[API relationnelle et Pandas](https://duckdb.org/docs/archive/0.9.2/guides/python/relational_api_pandas)

<b>Transformation d'une DF pandas en une BD duckdb avec des requêtes 'SQL' effectuées à partir de la libaririe duckdb puis exportation en DF pandas</b>

Date : 01-01-2024

In [2]:
import duckdb
import pandas as pd

In [3]:
# Connection à une BD virtuelle
conn = duckdb.connect()

In [4]:
# Création d'une DF pandas
input_df = pd.DataFrame.from_dict({'i': [1, 2, 3, 4],
                                   'j': ["one", "two", "three", "four"]})
input_df


Unnamed: 0,i,j
0,1,one
1,2,two
2,3,three
3,4,four


In [6]:
# Relation d'une BD duckdb avec un DF pandas : 
# insertion des données de la DF dans une table de BD
rel = conn.from_df(input_df)
rel

┌───────┬─────────┐
│   i   │    j    │
│ int64 │ varchar │
├───────┼─────────┤
│     1 │ one     │
│     2 │ two     │
│     3 │ three   │
│     4 │ four    │
└───────┴─────────┘

In [9]:
# Requête SQL façon "duckdb":
# SELECT i, j, i*2 AS two_i FROM input_df ORDER BY i DESC LIMIT 2
transform_rel = rel.filter('i > 2').project('i, j, i*2 AS two_i').order('i desc')
transform_rel

┌───────┬─────────┬───────┐
│   i   │    j    │ two_i │
│ int64 │ varchar │ int64 │
├───────┼─────────┼───────┤
│     4 │ four    │     8 │
│     3 │ three   │     6 │
└───────┴─────────┴───────┘

In [11]:
# Exportation de la table de la BD ci-avant en DF pandas
output_df = transform_rel.df()
output_df

Unnamed: 0,i,j,two_i
0,4,four,8
1,3,three,6
