In [1]:
import duckdb
from dotenv import load_dotenv
import os

In [2]:
duck = duckdb.connect()
duck.install_extension('postgres')
duck.load_extension('postgres')

In [3]:
load_dotenv()

True

In [4]:
db_host = os.getenv('DB_HOST', 'localhost')
db_port = os.getenv('DB_PORT', '5432')
db_name = os.getenv('DB_NAME', 'postgres')
db_user = os.getenv('DB_USER', 'postgres')
db_password = os.getenv('DB_PASSWORD', '')


In [5]:
duck.sql(f"""
    ATTACH 'host={db_host} port={db_port} dbname={db_name} user={db_user} password={db_password}' 
    AS pg (TYPE POSTGRES)
""")

print(f"✓ Successfully connected DuckDB to PostgreSQL database '{db_name}'")


✓ Successfully connected DuckDB to PostgreSQL database 'medisoft'


In [6]:
duck.sql("select Id from read_csv('data/Contacts - Contacts.csv')")

┌────────────────────────┐
│           Id           │
│        varchar         │
├────────────────────────┤
│ NULL                   │
│ 386758000004007839     │
│ 386758000008457005     │
│ 386758000008463001     │
│ 386758000008474001     │
│ 386758000008480001     │
│ 386758000008521007     │
│ 386758000008524053     │
│ 386758000008528007     │
│ 386758000008528021     │
│         ·              │
│         ·              │
│         ·              │
│ 386758000009436048     │
│ 386758000009436049     │
│ 386758000009436050     │
│ 386758000009436051     │
│ 386758000009436052     │
│ 386758000009436053     │
│ 386758000009436054     │
│ 386758000009436055     │
│ 386758000009436056     │
│ 386758000009436057     │
├────────────────────────┤
│         ? rows         │
│ (>9999 rows, 20 shown) │
└────────────────────────┘

In [7]:
duck.sql("select Id from pg.zoho.Contacts")

┌────────────────────────┐
│           Id           │
│         int64          │
├────────────────────────┤
│                   NULL │
│     386758000004007808 │
│     386758000008456960 │
│     386758000008463040 │
│     386758000008473984 │
│     386758000008480000 │
│     386758000008520960 │
│     386758000008524096 │
│     386758000008528000 │
│     386758000008528000 │
│              ·         │
│              ·         │
│              ·         │
│     386758000009421760 │
│     386758000009421760 │
│     386758000009421760 │
│     386758000009421760 │
│     386758000009421760 │
│     386758000009421760 │
│     386758000009421760 │
│     386758000009421760 │
│     386758000009421760 │
│     386758000009421760 │
├────────────────────────┤
│         ? rows         │
│ (>9999 rows, 20 shown) │
└────────────────────────┘

In [9]:
duck.sql("create table if not exists pg.zoho.Contacts_backup as select * from pg.zoho.Contacts")

In [10]:
duck.sql("select * from pg.zoho.Contacts_backup")

┌────────────────────┬────────────────────┬──────────────┬────────────┬──────────────────────────────┬──────────────────────────────┬────────────────────┬─────────────┬─────────────────────────────────────────┬─────────────────┬──────────────────────────────────────┬─────────────────────────┬────────────────────────┬────────────┬─────────────┬────────┬──────────────┬───────────────┬───────────┬────────────┬───────────────┬──────────┬────────────────────┬────────────────────┬───────────────────────────┬───────────────────────────┬────────────┬─────────────────┬──────────┬───────────────┬───────────────────────────┬─────────┬────────────────┬──────────────┬──────────────┬────────────┬───────────────┬─────────────┬─────────────┬───────────┬─────────────────┬───────────────┬─────────────┬────────────────────┬────────┬────────────────┬────────────────┬────────────────────────────┬───────────────────┬────────────────────────────┬────────────┬───────────────────────────────────┬──────────────

In [17]:
duck.execute(
    """
    insert into pg.zoho.Contacts (
    select 
        * replace(
            try_cast(Email_Opt_Out as float) as Email_Opt_Out,
            try_cast(Id as int64) as Id,
            try_cast(Account_Name as int64) as Account_Name,
        )
    from read_csv('data/Contacts - Contacts.csv')
    )
    """
)


FloatProgress(value=0.0, layout=Layout(width='auto'), style=ProgressStyle(bar_color='black'))

<_duckdb.DuckDBPyConnection at 0x10b0a3a70>

In [18]:
duck.sql("select count(*) from pg.zoho.Contacts")

┌──────────────┐
│ count_star() │
│    int64     │
├──────────────┤
│        36232 │
└──────────────┘

In [None]:
duck.sql("select * from read_csv('data/Contacts - Contacts.csv') limit 2")

┌────────────────────┬────────────────────┬─────────────┬────────────┬───────────┬───────────┬──────────────┬─────────────┬──────────────────────────────┬─────────────────┬────────────┬──────────────┬───────────────┬────────────┬─────────────┬─────────┬──────────────┬───────────────┬───────────┬────────────┬───────────────┬──────────┬────────────────────┬────────────────────┬──────────────────────────┬──────────────────────────┬────────────┬─────────────────┬──────────┬───────────────┬──────────────────────────┬─────────┬────────────────┬──────────────┬──────────────┬────────────┬───────────────┬─────────────┬─────────────┬───────────┬─────────────────┬───────────────┬─────────────┬────────────────────┬───────┬────────────────┬────────────────┬────────────────────────────┬───────────────────┬────────────────────────────┬────────────┬───────────────────────────────────┬──────────────┬─────────────┬──────────────────────────┬──────────────────────────┬──────────────┬─────────────────────

print()

In [None]:
print()