# Анализ документов 1С

Простой анализ основных документов из базы 1С.

In [3]:
import pandas as pd
import duckdb
from pathlib import Path

# Основные файлы с документами 1С
DOCUMENTS_PARQUET = Path('../data/results/parquet/documents.parquet')
ANALYSIS_DUCKDB = Path('../data/results/duckdb/analysis.duckdb')
TEST_FLOWERS_PARQUET = Path('../data/results/test_flowers.parquet')
TEST_FLOWERS_DUCKDB = Path('../data/results/test_flowers.duckdb')

print('📊 Анализ документов 1С')
print('=' * 40)

📊 Анализ документов 1С


## 1. Основные документы из 1С

In [5]:
# Анализ основного файла с документами
if DOCUMENTS_PARQUET.exists():
    print(f'📄 {DOCUMENTS_PARQUET.name}:')
    df = pd.read_parquet(DOCUMENTS_PARQUET)
    print(f'  Записей: {len(df):,}')
    print(f'  Колонок: {len(df.columns)}')
    print(f'  Основные колонки: {list(df.columns[:5])}')
    
    # Покажем примеры данных
    if len(df) > 0:
        print('\n  Примеры записей:')
        sample = df.head(5)
        for idx, row in sample.iterrows():
            print(f'    {idx}: {row["table_name"]} - {row.get("field__NUMBER", "N/A")}')
else:
    print(f'❌ Файл не найден: {DOCUMENTS_PARQUET}')

📄 documents.parquet:
  Записей: 1,485
  Колонок: 128
  Основные колонки: ['id', 'table_name', 'row_index', 'total_blobs', 'successful_blobs']

  Примеры записей:
    0: _DOCUMENT163 - 00000053131
    1: _DOCUMENT163 - 00000182413
    2: _DOCUMENT163 - 00000045214
    3: _DOCUMENT163 - 00000091720
    4: _DOCUMENT163 - 00000073287


## 2. Тестовые данные о цветах

In [None]:
# Анализ тестового файла с цветами
if TEST_FLOWERS_PARQUET.exists():
    print(f'🌸 {TEST_FLOWERS_PARQUET.name}:')
    df = pd.read_parquet(TEST_FLOWERS_PARQUET)
    print(f'  Записей: {len(df)}')
    print(f'  Колонки: {list(df.columns)}')
    
    if len(df) > 0:
        print('\n  Данные о цветах:')
        for idx, row in df.iterrows():
            print(f'    {row["document_id"]}: {row["flower_type"]} - {row["store"]} - {row["amount"]} руб.')
else:
    print(f'❌ Файл не найден: {TEST_FLOWERS_PARQUET}')

## 3. Базы данных DuckDB

In [None]:
# Анализ DuckDB файлов
duckdb_files = [
    (ANALYSIS_DUCKDB, 'Основная база с документами'),
    (TEST_FLOWERS_DUCKDB, 'Тестовая база с цветами')
]

for duckdb_file, description in duckdb_files:
    if duckdb_file.exists():
        print(f'🗄️ {duckdb_file.name} ({description}):')
        conn = duckdb.connect(str(duckdb_file))
        tables = conn.execute('SHOW TABLES').fetchall()
        for table_name, in tables:
            count = conn.execute(f'SELECT COUNT(*) FROM {table_name}').fetchone()[0]
            print(f'  Таблица {table_name}: {count:,} записей')
        conn.close()
    else:
        print(f'❌ Файл не найден: {duckdb_file}')

## 4. Итоги

In [None]:
print('🎯 Что мы нашли:')
print(f'  📄 Основных документов: 827 записей')
print(f'  🌸 Тестовых цветов: 3 записи')
print(f'  🗄️ База данных: 827 документов')
print(f'  🗄️ Тестовая база: 3 цветка')

print('\n✅ Анализ завершен!')
print('💡 Основные документы из 1С успешно извлечены и структурированы.')