In [43]:
import wikipediaapi

# Создание объекта Wikipedia
wiki_wiki = wikipediaapi.Wikipedia(
    language='ru',  # язык (например: 'ru', 'en', 'fr')
    extract_format=wikipediaapi.ExtractFormat.WIKI,  # формат текста
    user_agent='MyApp/1.0 (myemail@example.com)'  # user agent для идентификации
)

# Получение страницы
page = wiki_wiki.page('Басенджи')

# Проверка существования страницы
if page.exists():
    print(f"Заголовок: {page.title}")
    print(f"Краткое описание: {page.summary[:1000]}...")  # первые 500 символов
    print(f"URL: {page.fullurl}")
    
    # Полный текст
    print(f"\nПолный текст: {page.text[:1000]}...")
else:
    print("Страница не найдена")

Заголовок: Басенджи
Краткое описание: Басе́нджи (басенжи), или африканская нелающая собака (а также конголезская кустарниковая собака, лесная собака из Конго, конго-терьер, ньям-ньям-терьер, собака занде, «существо из зарослей»), — одна из древнейших пород собак....
URL: https://ru.wikipedia.org/wiki/%D0%91%D0%B0%D1%81%D0%B5%D0%BD%D0%B4%D0%B6%D0%B8

Полный текст: Басе́нджи (басенжи), или африканская нелающая собака (а также конголезская кустарниковая собака, лесная собака из Конго, конго-терьер, ньям-ньям-терьер, собака занде, «существо из зарослей»), — одна из древнейших пород собак.

История породы
В Древнем Египте этих собак привозили в подарок фараонам, которые очень почитали басенджи и считали их живым оберегом. Об этом свидетельствуют настенные изображения басенджи в гробницах фараонов, а также найденные мумии собак, похороненных с почестями вместе со своими великими хозяевами.
Собаки, подобные басенджи, были распространены в Нубии (территория современного Судана). В захоронениях

Вот основные атрибуты и методы объекта `Page` в библиотеке `wikipedia-api`:

## Основные атрибуты объекта `Page`:

```python
import wikipediaapi

wiki = wikipediaapi.Wikipedia('ru')
page = wiki.page('Искусственный интеллект')

if page.exists():
    # 1. Базовые атрибуты
    print(f"page.title: {page.title}")  # заголовок страницы
    print(f"page.summary: {page.summary[:100]}...")  # краткое описание
    print(f"page.text: {page.text[:100]}...")  # полный текст
    print(f"page.fullurl: {page.fullurl}")  # полная ссылка на страницу
    print(f"page.canonicalurl: {page.canonicalurl}")  # каноническая ссылка
    print(f"page.language: {page.language}")  # язык страницы
    
    # 2. Метаданные
    print(f"page.exists(): {page.exists()}")  # существует ли страница
    print(f"page.namespace: {page.namespace}")  # пространство имен (0 для статей)
    
    # 3. Содержимое в разных форматах
    print(f"page.wiki_text: {page.wiki_text[:100]}...")  # текст с вики-разметкой
    print(f"page.plain_text: {page.plain_text[:100]}...")  # чистый текст
    
    # 4. Структурные элементы
    print("\nСекции:")
    for section in page.sections:
        print(f"  - {section.title} (уровень: {section.level})")
    
    print("\nКатегории:")
    for cat in list(page.categories.keys())[:5]:  # первые 5 категорий
        print(f"  - {cat}")
    
    print("\nСсылки на другие страницы:")
    for link in list(page.links.keys())[:5]:  # первые 5 ссылок
        print(f"  - {link}")
    
    # 5. Дополнительные атрибуты
    print(f"page.parentid: {page.parentid}")  # ID родительской страницы
    print(f"page.revid: {page.revid}")  # ID ревизии
    print(f"page.lastrevid: {page.lastrevid}")  # ID последней ревизии
    print(f"page.length: {page.length}")  # длина статьи в символах
    print(f"page.touched: {page.touched}")  # время последнего изменения
    print(f"page.pageid: {page.pageid}")  # ID страницы
```

## Подробный список всех атрибутов:

### **Основные атрибуты содержимого:**
- `title` - заголовок страницы
- `text` - полный текст статьи (без разметки)
- `summary` - краткое описание/аннотация
- `plain_text` - чистый текст (аналогично text)
- `wiki_text` - текст с вики-разметкой

### **URL и идентификаторы:**
- `fullurl` - полный URL страницы
- `canonicalurl` - канонический URL
- `pageid` - уникальный ID страницы
- `revid` - ID текущей ревизии
- `lastrevid` - ID последней ревизии
- `parentid` - ID родительской страницы

### **Структурные элементы:**
- `sections` - список секций/разделов статьи (объекты Section)
- `categories` - словарь категорий статьи
- `links` - словарь ссылок на другие страницы
- `backlinks` - словарь обратных ссылок (кто ссылается на эту страницу)
- `langlinks` - ссылки на версии статьи на других языках

### **Метаданные:**
- `namespace` - пространство имен (0 - основное, другие - служебные)
- `language` - язык страницы
- `length` - длина статьи в символах
- `touched` - время последнего изменения
- `displaytitle` - отображаемый заголовок (может отличаться от title)

### **Методы проверки:**
- `exists()` - проверяет, существует ли страница
- `is_disambiguation()` - проверяет, является ли страница неоднозначностью
- `is_redirect()` - проверяет, является ли страница перенаправлением

## Пример использования всех атрибутов:

```python
import wikipediaapi
from datetime import datetime

def analyze_wikipedia_page(page_title, lang='ru'):
    """Анализ страницы Wikipedia со всеми атрибутами"""
    
    wiki = wikipediaapi.Wikipedia(
        language=lang,
        user_agent='PageAnalyzer/1.0'
    )
    
    page = wiki.page(page_title)
    
    if not page.exists():
        print(f"Страница '{page_title}' не найдена")
        return
    
    # 1. Базовая информация
    print("=" * 50)
    print(f"АНАЛИЗ СТРАНИЦЫ: {page.title}")
    print("=" * 50)
    
    print("\n1. ОСНОВНАЯ ИНФОРМАЦИЯ:")
    print(f"   Заголовок: {page.title}")
    print(f"   Отображаемый заголовок: {page.displaytitle}")
    print(f"   ID страницы: {page.pageid}")
    print(f"   Язык: {page.language}")
    print(f"   Пространство имен: {page.namespace}")
    print(f"   URL: {page.fullurl}")
    print(f"   Длина статьи: {page.length} символов")
    
    # 2. Содержимое
    print("\n2. СОДЕРЖАНИЕ:")
    print(f"   Краткое описание ({len(page.summary)} символов):")
    print(f"   {page.summary[:200]}...")
    
    # 3. Структура
    print("\n3. СТРУКТУРА:")
    print(f"   Количество секций: {len(page.sections)}")
    for i, section in enumerate(page.sections[:3], 1):  # первые 3 секции
        print(f"   {i}. {section.title} (уровень: {section.level})")
    if len(page.sections) > 3:
        print(f"   ... и еще {len(page.sections) - 3} секций")
    
    # 4. Категории
    print(f"\n4. КАТЕГОРИИ ({len(page.categories)}):")
    categories = list(page.categories.keys())
    for cat in categories[:5]:  # первые 5 категорий
        print(f"   • {cat}")
    if len(categories) > 5:
        print(f"   ... и еще {len(categories) - 5} категорий")
    
    # 5. Ссылки
    print(f"\n5. ССЫЛКИ ({len(page.links)}):")
    links = list(page.links.keys())
    for link in links[:5]:  # первые 5 ссылок
        print(f"   → {link}")
    if len(links) > 5:
        print(f"   ... и еще {len(links) - 5} ссылок")
    
    # 6. Ссылки на другие языки
    print(f"\n6. ВЕРСИИ НА ДРУГИХ ЯЗЫКАХ:")
    if hasattr(page, 'langlinks') and page.langlinks:
        lang_links = list(page.langlinks.keys())
        for lang_code in lang_links[:3]:  # первые 3 языка
            print(f"   {lang_code}: {page.langlinks[lang_code].title}")
        if len(lang_links) > 3:
            print(f"   ... и еще {len(lang_links) - 3} языков")
    
    # 7. Дополнительная информация
    print("\n7. ДОПОЛНИТЕЛЬНО:")
    print(f"   ID ревизии: {page.revid}")
    print(f"   ID последней ревизии: {page.lastrevid}")
    if page.parentid:
        print(f"   ID родительской страницы: {page.parentid}")
    
    # 8. Проверки
    print("\n8. ПРОВЕРКИ:")
    print(f"   Существует: {page.exists()}")
    print(f"   Страница-неоднозначность: {page.is_disambiguation()}")
    print(f"   Перенаправление: {page.is_redirect()}")
    
    # 9. Временные метки
    if hasattr(page, 'touched') and page.touched:
        print(f"\n9. ВРЕМЕННЫЕ МЕТКИ:")
        # Преобразуем строку времени в читаемый формат
        touched_time = datetime.strptime(page.touched, '%Y-%m-%dT%H:%M:%SZ')
        print(f"   Последнее изменение: {touched_time.strftime('%d.%m.%Y %H:%M:%S')}")

# Пример использования
if __name__ == "__main__":
    # Анализ нескольких статей
    articles = [
        "Python",
        "Искусственный интеллект",
        "Машинное обучение"
    ]
    
    for article in articles:
        analyze_wikipedia_page(article)
        print("\n" + "="*50 + "\n")
```

## Специфические атрибуты для секций (Section):

Каждая секция в `page.sections` также имеет свои атрибуты:

```python
for section in page.sections:
    print(f"Заголовок: {section.title}")
    print(f"Уровень: {section.level}")  # 1, 2, 3...
    print(f"Текст: {section.text[:100]}...")  # текст секции
    print(f"Подсекции: {len(section.sections)}")  # вложенные секции
    print(f"Полный текст: {section.full_text[:100]}...")  # текст с подсекциями
    print("-" * 30)
```

## Полезные методы для работы:

```python
# Получить определенную секцию по заголовку
section = page.section_by_title("История")
if section:
    print(f"Текст секции 'История': {section.text}")

# Получить все заголовки секций
titles = [s.title for s in page.sections]

# Получить определенную ссылку
if "Наука" in page.links:
    science_page = page.links["Наука"]
    print(f"Страница 'Наука': {science_page.title}")

# Проверить категорию
if "Категория:Программирование" in page.categories:
    print("Страница относится к программированию")
```

Эти атрибуты предоставляют полный доступ к структуре и содержимому статей Wikipedia.

In [46]:
import wikipediaapi
import requests

class WikipediaSearch:
    def __init__(self, lang='ru'):
        self.lang = lang
        self.wiki = wikipediaapi.Wikipedia(
            language=lang,
            user_agent='WikipediaSearch/1.0'
        )
    
    def search(self, query, limit=10):
        """Поиск и получение полных страниц"""
        
        # 1. Поиск через API
        search_results = self._api_search(query, limit)
        
        # 2. Получение полных страниц
        pages = []
        for result in search_results:
            page = self.wiki.page(result['title'])
            if page.exists():
                pages.append(page)
        
        return pages
    
    def _api_search(self, query, limit):
        """Внутренний метод поиска через Wikipedia API"""
        url = f"https://{self.lang}.wikipedia.org/w/api.php"
        
        params = {
            'action': 'query',
            'format': 'json',
            'list': 'search',
            'srsearch': query,
            'srlimit': limit,
            'srprop': 'snippet|titlesnippet'
        }
        
        try:
            response = requests.get(url, params=params, 
                                  headers={'User-Agent': 'WikipediaSearch/1.0'})
            data = response.json()
            
            results = []
            if 'query' in data and 'search' in data['query']:
                for item in data['query']['search']:
                    results.append({
                        'title': item['title'],
                        'snippet': item['snippet'],
                        'pageid': item['pageid']
                    })
            
            return results
            
        except Exception as e:
            print(f"Ошибка поиска: {e}")
            return []

# Использование
searcher = WikipediaSearch('ru')
pages = searcher.search("Василиса работает по ночам ", limit=5)

for i, page in enumerate(pages, 1):
    print(f"{i}. {page.title}")
    print(f"   {page.summary[:1500]}...")
    print()

1. Володина, Василиса
   Васили́са Владимировна Воло́дина (имя при рождении — Елизаве́та Влади́мировна Нау́мова, род. 16 апреля 1974, Москва, СССР) — российский астролог и телеведущая. Соведущая и астролог (2008 года по 2020) телепередачи «Давай поженимся» на «Первом канале»....

2. Часодеи
   Часоде́и — серия книг украинской русскоязычной писательницы Натальи Щербы, написанная в жанре подростковое фэнтези. Главной героиней серии является школьница Василиса О́гнева, попавшая в особый мир, жители которого умеют управлять временем.
Первая книга, «Часовой ключ», вышла в 2011 году тиражом 50 тысяч экземпляров после победы Натальи Щербы в конкурсе издательства Росмен «Новая детская книга». На момент конкурса название книги было «Часовой ключ для Василисы»
«Часовой ключ» занял 2-е место в номинации «Лучший цикл, сериал и роман с продолжением» на фестивале фантастики «Звёздный мост» в 2011 году и в том же году получил премию «Алиса» за лучшее детско-юношеское произведение в фантастике на конф