Вот примеры использования библиотеки DuckDB для записи, дозаписи, компрессии данных и чтения данных из DuckDB в DataFrame в Python:

In [None]:
import duckdb
import pandas as pd

# Подключение к базе данных DuckDB
conn = duckdb.connect(database=':memory:', read_only=False)

# Создание DataFrame для записи в DuckDB
data = {'id': [1, 2, 3], 'name': ['Alice', 'Bob', 'Charlie']}
df = pd.DataFrame(data)

# Запись DataFrame в DuckDB
conn.register('my_table', df)
conn.execute("CREATE TABLE my_table AS SELECT * FROM my_table")

# Дозапись в таблицу DuckDB
data2 = {'id': [4, 5], 'name': ['Dave', 'Eve']}
df2 = pd.DataFrame(data2)
conn.register('my_table2', df2)
conn.execute("INSERT INTO my_table SELECT * FROM my_table2")

# Варианты компрессии данных
conn.execute("CREATE TABLE my_compressed_table AS SELECT * FROM my_table WITH COMPRESSION")

# Чтение данных из DuckDB в DataFrame
result = conn.execute("SELECT * FROM my_table")
df_result = result.fetchdf()
print(df_result)


Этот код демонстрирует создание подключения к базе данных DuckDB в памяти, запись DataFrame в таблицу DuckDB, дозапись в существующую таблицу, использование компрессии данных при создании таблицы, и чтение данных из DuckDB обратно в DataFrame.

Вот примеры использования библиотеки DuckDB для записи, дозаписи и чтения данных на диск в Python:

In [None]:
import duckdb
import pandas as pd

# Подключение к базе данных DuckDB
conn = duckdb.connect(database='example_database.db', read_only=False)

# Создание DataFrame для записи в DuckDB
data = {'id': [1, 2, 3], 'name': ['Alice', 'Bob', 'Charlie']}
df = pd.DataFrame(data)

# Запись DataFrame в DuckDB на диск
conn.register('my_table', df)
conn.execute("CREATE TABLE my_table AS SELECT * FROM my_table")

# Дозапись в таблицу DuckDB на диск
data2 = {'id': [4, 5], 'name': ['Dave', 'Eve']}
df2 = pd.DataFrame(data2)
conn.register('my_table2', df2)
conn.execute("INSERT INTO my_table SELECT * FROM my_table2")

# Чтение данных из DuckDB на диске в DataFrame
result = conn.execute("SELECT * FROM my_table")
df_result = result.fetchdf()
print(df_result)

# Закрытие соединения
conn.close()


Этот код демонстрирует создание подключения к базе данных DuckDB на диске, запись DataFrame в таблицу DuckDB на диск, дозапись в существующую таблицу на диск и чтение данных из DuckDB на диске обратно в DataFrame.

 вот пример использования библиотеки DuckDB для записи, дозаписи и чтения данных на диск в Python:

In [None]:
import duckdb
import pandas as pd

# Подключение к базе данных DuckDB на диске
conn = duckdb.connect(database='example_database.db', read_only=False)

# Создание DataFrame для записи в DuckDB
data = {'id': [1, 2, 3], 'name': ['Alice', 'Bob', 'Charlie']}
df = pd.DataFrame(data)

# Запись DataFrame в DuckDB на диск
conn.register('my_table', df)
conn.execute("CREATE TABLE my_table AS SELECT * FROM my_table")

# Создание второго DataFrame для дозаписи
data2 = {'id': [4, 5], 'name': ['Dave', 'Eve']}
df2 = pd.DataFrame(data2)

# Дозапись в таблицу DuckDB на диск
conn.register('my_table2', df2)
conn.execute("INSERT INTO my_table SELECT * FROM my_table2")

# Чтение данных из DuckDB на диске в DataFrame
result = conn.execute("SELECT * FROM my_table")
df_result = result.fetchdf()
print(df_result)

# Закрытие соединения
conn.close()


Этот пример демонстрирует создание подключения к базе данных DuckDB на диске, запись DataFrame в таблицу DuckDB на диск, дозапись в существующую таблицу на диск и чтение данных из DuckDB на диске обратно в DataFrame.

Чтобы подключиться к файлу DuckDB на диске с помощью SQLAlchemy, вы можете использовать SQLAlchemy-DuckDB диалект. Вот пример того, как это можно сделать:

In [None]:
from sqlalchemy import create_engine, MetaData, Table, Column, Integer, String

# Создание движка SQLAlchemy для подключения к DuckDB на диске
engine = create_engine('duckdb:///example_database.db')

# Создание метаданных и объекта таблицы для выполнения операций
metadata = MetaData()

# Определение структуры таблицы
my_table = Table('my_table', metadata,
                 Column('id', Integer, primary_key=True),
                 Column('name', String)
                )

# Отображение структуры таблицы на базу данных
metadata.create_all(engine)

# Вставка данных в таблицу
with engine.connect() as conn:
    conn.execute(my_table.insert(), [{'id': 1, 'name': 'Alice'}, {'id': 2, 'name': 'Bob'}, {'id': 3, 'name': 'Charlie'}])

# Чтение данных из таблицы
with engine.connect() as conn:
    result = conn.execute(my_table.select())
    for row in result:
        print(row)


Этот код создает движок SQLAlchemy для подключения к базе данных DuckDB на диске с помощью URI duckdb:///example_database.db. Затем он создает метаданные и определяет структуру таблицы. Данные вставляются в таблицу, а затем они считываются и выводятся на экран.

Убедитесь, что у вас установлен пакет SQLAlchemy-DuckDB, который предоставляет диалект DuckDB для SQLAlchemy.