In [5]:
import os
from pathlib import Path

def print_repo_contents(repo_path="."):
    """Print all file contents in the repository"""
    repo_path = Path(repo_path)
    for root, dirs, files in os.walk(repo_path):
        dirs[:] = [d for d in dirs if not d.startswith('.') and d != '__pycache__']
        for file in files:
            file_path = Path(root) / file
            if file.startswith('.') or file.endswith('.pyc') or file.endswith('.md') or file.endswith('.txt') or file.endswith('.ipynb') or file.endswith('.log'):
                continue
            print(f"{file_path}")
            print("```")
            with open(file_path, 'r', encoding='utf-8') as f:
                print(f.read())
            print("```\n")

print_repo_contents()

config\settings.py
```
import os
from dotenv import load_dotenv

load_dotenv()

class Settings:
    """Configuration settings for the RAG pipeline"""
    
    # Yandex Cloud credentials
    FOLDER_ID = os.getenv("YANDEX_FOLDER_ID")
    API_KEY = os.getenv("YANDEX_API_KEY")
    
    # Document processing
    CHUNK_SIZE = 1500
    CHUNK_OVERLAP = 250
    
    # Model settings
    TEMPERATURE = 0.3
    MAX_TOKENS = 8000

    # Retrieval settings
    SEARCH_KWARGS = {"k": 5}  # Number of documents to retrieve
    SCORE_THRESHOLD = 0.7  # Minimum similarity score

settings = Settings()
```

config\__init__.py
```

```

scripts\run_pipeline.py
```
#!/usr/bin/env python3
"""
Main script to run the RAG pipeline
"""

import sys
import os
import time
sys.path.append(os.path.join(os.path.dirname(__file__), '..'))

from src.data.document_loader import DocumentLoader
from src.processing.text_splitter import TextSplitter
from src.processing.embeddings import EmbeddingManager
from src.retrieval.vecto

In [5]:
from scripts.run_pipeline import main
# main(["трудовой кодекс отпуск"])
# main(["Сколько дней отпуска в год я могу взять?"])
main(["Сколько налогов я заплачу в год при зарплате 2500000 в год?"])  # почти всегда неправильно считает(((

2025-11-30 20:47:03,432 - src.data.consultant_plus_loader - INFO - Searching Consultant Plus for: 'Сколько налогов я заплачу в год при зарплате 2500000 в год?'
2025-11-30 20:47:03,433 - src.data.consultant_plus_loader - INFO - Reformulating query: 'Сколько налогов я заплачу в год при зарплате 2500000 в год?'


Initializing Consultant Plus loader...

Question: Сколько налогов я заплачу в год при зарплате 2500000 в год?
Searching Consultant Plus...


2025-11-30 20:47:03,905 - src.processing.query_reformulator - INFO - Query reformulated: 'Сколько налогов я заплачу в год при зарплате 2500000 в год?' -> '"налоговый кодекс ставка ндфл"'
2025-11-30 20:47:03,907 - src.data.consultant_plus_loader - INFO - Reformulated query: '"налоговый кодекс ставка ндфл"'
2025-11-30 20:47:03,908 - src.data.consultant_plus_loader - INFO - Fetching search results from: https://www.consultant.ru/search/?q=%22%D0%BD%D0%B0%D0%BB%D0%BE%D0%B3%D0%BE%D0%B2%D1%8B%D0%B9%20%D0%BA%D0%BE%D0%B4%D0%B5%D0%BA%D1%81%20%D1%81%D1%82%D0%B0%D0%B2%D0%BA%D0%B0%20%D0%BD%D0%B4%D1%84%D0%BB%22
2025-11-30 20:47:04,005 - src.data.consultant_plus_loader - INFO - Found 5 search result items
2025-11-30 20:47:04,007 - src.data.consultant_plus_loader - INFO - Processed 4 valid search results
2025-11-30 20:47:04,007 - src.data.consultant_plus_loader - INFO - Loading document 1/4: "НалоговыйкодексРоссийской Федерации (часть вторая)" от 05.08.2000 N 117-ФЗ...
2025-11-30 20:47:04,465 - src.d

Found 4 relevant documents
Processing documents...
Created 98 chunks from 4 documents
Creating embeddings and vector store...


100%|██████████| 32/32 [01:07<00:00,  2.12s/it]
2025-11-30 20:48:18,674 - src.retrieval.vector_store - INFO - Created vector store with 98 documents


Initializing QA system...
Answer: Для расчёта налогов, которые вы заплатите в год при зарплате 2 500 000 рублей, необходимо учесть налог на доходы физических лиц (НДФЛ). Согласно статье 224 Налогового кодекса Российской Федерации (НК РФ), основная ставка НДФЛ составляет 13% для доходов физических лиц — налоговых резидентов РФ.

Расчёт будет следующим:

$2 500 000 \times 13\% = 325 000$ рублей.

Таким образом, при годовой зарплате в 2 500 000 рублей вы заплатите НДФЛ в размере 325 000 рублей.

Источник: Налоговый кодекс Российской Федерации (часть вторая) от 05.08.2000 № 117-ФЗ (ред. от 25.12.2023) (с изм. и доп., вступ. в силу с 01.01.2024), статья 224.

Sources:
Source 1: https://www.consultant.ru/document/cons_doc_LAW_519034/
Source 2: https://www.consultant.ru/document/cons_doc_LAW_519034/
Source 3: https://www.consultant.ru/document/cons_doc_LAW_519034/
Source 4: https://www.consultant.ru/document/cons_doc_LAW_519034/
Source 5: https://www.consultant.ru/document/cons_doc_LAW_519034