In [1]:
import os
import requests
from bs4 import BeautifulSoup
from openpyxl import Workbook

# URL с алфавитом
BASE_URL = "https://slovarozhegova.ru/letter.php?charkod={}"
LETTER_CODES = list(range(192, 224))  # Юникод для русских букв от А до Я

def fetch_words_for_letter(letter_code):
    """Загружает слова с сайта для конкретной буквы."""
    url = BASE_URL.format(letter_code)
    response = requests.get(url)
    if response.status_code != 200:
        print(f"Не удалось загрузить данные для буквы: {chr(letter_code)}")
        return []

    soup = BeautifulSoup(response.content, "html.parser")

    # Извлекаем слова, находящиеся в тегах <a class="chara"> <strong>
    words = []
    for word_tag in soup.select('a.chara strong'):
        words.append(word_tag.text.strip())

    return words

def save_words_to_excel(words, file_name="data/slovarozhegova.xlsx"):
    """Сохраняет список слов в Excel."""
    # Создаем папку data, если она не существует
    os.makedirs(os.path.dirname(file_name), exist_ok=True)

    wb = Workbook()
    ws = wb.active
    ws.title = "Слова"
    ws.append(["Слово"])  # Заголовок столбца
    for word in words:
        ws.append([word])
    wb.save(file_name)

def main():
    all_words = []
    for letter_code in LETTER_CODES:
        print(f"Обработка буквы: {chr(letter_code)}")
        words = fetch_words_for_letter(letter_code)
        all_words.extend(words)
    
    print(f"Найдено слов: {len(all_words)}")
    save_words_to_excel(all_words)
    print("Слова сохранены в файл data/slovarozhegova.xlsx")

if __name__ == "__main__":
    main()

Обработка буквы: À
Обработка буквы: Á
Обработка буквы: Â
Обработка буквы: Ã
Обработка буквы: Ä
Обработка буквы: Å
Обработка буквы: Æ
Обработка буквы: Ç
Обработка буквы: È
Обработка буквы: É
Обработка буквы: Ê
Обработка буквы: Ë
Обработка буквы: Ì
Обработка буквы: Í
Обработка буквы: Î
Обработка буквы: Ï
Обработка буквы: Ð
Обработка буквы: Ñ
Обработка буквы: Ò
Обработка буквы: Ó
Обработка буквы: Ô
Обработка буквы: Õ
Обработка буквы: Ö
Обработка буквы: ×
Обработка буквы: Ø
Обработка буквы: Ù
Обработка буквы: Ú
Обработка буквы: Û
Обработка буквы: Ü
Обработка буквы: Ý
Обработка буквы: Þ
Обработка буквы: ß
Найдено слов: 36086
Слова сохранены в файл data/slovarozhegova.xlsx
