Criando DataFrames em Pandas vs Polars
Publicado:
Atualizado:
PorJeferson Peter
2 min de leituraPolars & Pandas
Criar um DataFrame é frequentemente o primeiro passo em qualquer fluxo de análise de dados.
Enquanto o Pandas é a biblioteca mais utilizada, o Polars vem ganhando espaço pela velocidade e sintaxe limpa.
Veja como criar DataFrames nas duas bibliotecas, lado a lado.
De um dicionário de listas
# Pandas
import pandas as pd
dados = {"nome": ["Alice", "Bob"], "idade": [25, 30]}
df_pd = pd.DataFrame(dados)
print(df_pd)
# nome idade
# 0 Alice 25
# 1 Bob 30
# Polars
import polars as pl
dados = {"nome": ["Alice", "Bob"], "idade": [25, 30]}
df_pl = pl.DataFrame(dados)
print(df_pl)
# shape: (2, 2)
# ┌───────┬────────┐
# │ nome ┆ idade │
# │ --- ┆ --- │
# │ str ┆ i64 │
# ╞═══════╪════════╡
# │ Alice ┆ 25 │
# │ Bob ┆ 30 │
# └───────┴────────┘
✔ Ambas aceitam um dicionário de listas, mas o Polars imprime em um formato tabular mais rico.
De uma lista de dicionários (registros)
# Pandas
registros = [{"nome": "Alice", "idade": 25}, {"nome": "Bob", "idade": 30}]
df_pd = pd.DataFrame(registros)
print(df_pd)
# nome idade
# 0 Alice 25
# 1 Bob 30
# Polars
registros = [{"nome": "Alice", "idade": 25}, {"nome": "Bob", "idade": 30}]
df_pl = pl.DataFrame(registros)
print(df_pl)
# shape: (2, 2)
# ┌───────┬────────┐
# │ nome ┆ idade │
# │ --- ┆ --- │
# │ str ┆ i64 │
# ╞═══════╪════════╡
# │ Alice ┆ 25 │
# │ Bob ┆ 30 │
# └───────┴────────┘
✔ Comportamento muito semelhante nas duas bibliotecas.
De uma lista de listas com nomes de colunas
# Pandas
df_pd = pd.DataFrame([[1, "A"], [2, "B"]], columns=["id", "rotulo"])
print(df_pd)
# id rotulo
# 0 1 A
# 1 2 B
# Polars
df_pl = pl.DataFrame([[1, "A"], [2, "B"]], schema=["id", "rotulo"])
print(df_pl)
# shape: (2, 2)
# ┌─────┬────────┐
# │ id ┆ rotulo │
# │ --- ┆ --- │
# │ i64 ┆ str │
# ╞═════╪════════╡
# │ 1 ┆ A │
# │ 2 ┆ B │
# └─────┴────────┘
✔ Pandas usa columns=..., Polars usa schema=....
Conclusão
- Pandas e Polars compartilham sintaxe muito semelhante para criar DataFrames.
- Polars fornece uma saída mais rica e melhor performance em grandes volumes de dados.
- Se você já conhece Pandas, migrar para Polars é bem natural.
👉 Próximo passo: no próximo post, vamos ver como selecionar linhas e colunas em ambas as bibliotecas.