In [2]:
pip install psycopg2-binary

Collecting psycopg2-binary
  Downloading psycopg2_binary-2.9.11-cp311-cp311-manylinux2014_x86_64.manylinux_2_17_x86_64.whl.metadata (4.9 kB)
Downloading psycopg2_binary-2.9.11-cp311-cp311-manylinux2014_x86_64.manylinux_2_17_x86_64.whl (4.2 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m4.2/4.2 MB[0m [31m10.6 MB/s[0m eta [36m0:00:00[0m00:01[0m0:01[0m
[?25hInstalling collected packages: psycopg2-binary
Successfully installed psycopg2-binary-2.9.11
Note: you may need to restart the kernel to use updated packages.


In [9]:
import psycopg2
import pandas as pd
from sqlalchemy import create_engine

def test_postgres_connection():
    try:
        # Подключаемся к PostgreSQL
        connection = psycopg2.connect(
            host='postgres-db',  # или 'host.docker.internal'
            port=5432,
            database='postgres',
            user='airflow',
            password='airflow'
        )
        print("✅ Успешное подключение к PostgreSQL!")
        
        # Создаем курсор
        cursor = connection.cursor()
        
        # Выполняем простой запрос
        cursor.execute("SELECT version();")
        version = cursor.fetchone()
        print(f"📊 Версия PostgreSQL: {version[0]}")
        
        # Получаем список таблиц
        cursor.execute("""
            SELECT table_name 
            FROM information_schema.tables 
            WHERE table_schema = 'public'
            ORDER BY table_name;
        """)
        
        tables = cursor.fetchall()
        print("📋 Таблицы в базе данных:")
        for table in tables:
            print(f"   - {table[0]}")
        
        # Если есть таблицы, читаем первую в DataFrame
        if tables:
            first_table = tables[0][0]
            print(f"\n🎯 Читаем данные из таблицы: {first_table}")
            
            # Читаем данные в DataFrame
            df = pd.read_sql(f"SELECT * FROM {first_table} LIMIT 10", connection)
            
            if not df.empty:
                print("✅ Данные успешно загружены в DataFrame!")
                print(f"📐 Размер DataFrame: {df.shape}")
                print("\n📊 Первые строки:")
                display(df.head(10))
            else:
                print("ℹ️ Таблица пустая")
        else:
            print("ℹ️ В базе нет таблиц в схеме 'public'")
            
        # Закрываем соединение
        cursor.close()
        connection.close()
        print("\n🔒 Соединение закрыто")
        
    except Exception as e:
        print(f"❌ Ошибка: {e}")

# Запускаем проверку
test_postgres_connection()

✅ Успешное подключение к PostgreSQL!
📊 Версия PostgreSQL: PostgreSQL 13.22 (Debian 13.22-1.pgdg13+1) on x86_64-pc-linux-gnu, compiled by gcc (Debian 14.2.0-19) 14.2.0, 64-bit
📋 Таблицы в базе данных:
   - players
   - какой_кайф

🎯 Читаем данные из таблицы: players
✅ Данные успешно загружены в DataFrame!
📐 Размер DataFrame: (6, 5)

📊 Первые строки:


  df = pd.read_sql(f"SELECT * FROM {first_table} LIMIT 10", connection)


Unnamed: 0,id,никнейм,название_игры,количество_очков,время_игры
0,1,catgirl,roblox,6000,25.5
1,2,catgirl,minecraft,3400,14.0
2,3,player25,roblox,4500,15.5
3,4,player25,minecraft,1000,35.5
4,5,gvin,roblox,20000,65.7
5,6,gvin,minecraft,400,4.2



🔒 Соединение закрыто


In [None]:
import pandas as pd
from sqlalchemy import create_engine, text

def test_with_sqlalchemy():
    try:
        # Создаем engine
        engine = create_engine('postgresql+psycopg2://airflow:airflow@postgres-db:5432/postgres')
        
        # Проверяем подключение (ИСПРАВЛЕНО - добавили text())
        with engine.connect() as conn:
            result = conn.execute(text("SELECT version()"))
            print(f"✅ Подключение успешно: {result.fetchone()[0]}")
        
        # Получаем список таблиц (для pandas.read_sql text() не нужен)
        tables_df = pd.read_sql("""
            SELECT table_name 
            FROM information_schema.tables 
            WHERE table_schema = 'public'
        """, engine)
        
        print(f"📋 Найдено таблиц: {len(tables_df)}")
        
        if not tables_df.empty:
            # Читаем первую таблицу
            first_table = tables_df.iloc[0]['table_name']
            print(f"🎯 Читаем таблицу: {first_table}")
            
            # Читаем данные
            df = pd.read_sql(f"SELECT * FROM {first_table} LIMIT 10", engine)
            
            print(f"✅ Данные загружены! Размер: {df.shape}")
            print("\n📊 Содержимое:")
            display(df)
            
            return df
        else:
            print("ℹ️ Таблиц не найдено")
            return None
            
    except Exception as e:
        print(f"❌ Ошибка: {e}")
        return None

# Запускаем
df_result = test_with_sqlalchemy()