Tratando Valores Nulos — Pandas vs Polars

Publicado:
Atualizado:
PorJeferson Peter
1 min de leitura
Polars & Pandas
Compartilhe este post:

Imagine que você está trabalhando com um conjunto de dados que possui valores ausentes em algumas colunas.
Como limpá-los ou preenchê-los? Pandas e Polars oferecem ferramentas simples para tratar nulos.


Dados de exemplo

import pandas as pd
import polars as pl
import numpy as np

dados = {"nome": ["Alice", "Bob", None], "nota": [10, None, 30]}
df_pd = pd.DataFrame(dados)
df_pl = pl.DataFrame(dados)

Removendo nulos

# Pandas
print(df_pd.dropna())

#    nome  nota
# 0  Alice  10.0

# Polars
print(df_pl.drop_nulls())

# shape: (1, 2)
# ┌───────┬───────┐
# │ nome  ┆ nota  │
# │ ---   ┆ ---   │
# │ str   ┆ i64   │
# ╞═══════╪═══════╡
# │ Alice ┆ 10    │
# └───────┴───────┘

Preenchendo nulos

# Pandas
print(df_pd.fillna({"nome": "Desconhecido", "nota": 0}))

#          nome  nota
# 0       Alice  10.0
# 1         Bob   0.0
# 2 Desconhecido 30.0

# Polars
print(df_pl.fill_null(strategy="forward"))

# shape: (3, 2)
# ┌───────┬───────┐
# │ nome  ┆ nota  │
# │ ---   ┆ ---   │
# │ str   ┆ i64   │
# ╞═══════╪═══════╡
# │ Alice ┆ 10    │
# │ Bob   ┆ 10    │
# │ Bob   ┆ 30    │
# └───────┴───────┘

Conclusão

  • Pandas: dropna(), fillna() são os principais métodos.
  • Polars: drop_nulls(), fill_null() oferecem funcionalidade semelhante.
  • Ambos fornecem opções flexíveis para lidar com valores ausentes de forma eficiente.
Compartilhe este post:
Tratando Valores Nulos — Pandas vs Polars | CodeCraftPython