In [66]:
# Напишите функцию get_response(url), которая отправляет GET-запрос по заданному URL-адресу 
# и возвращает объект ответа. Затем выведите следующую информацию об ответе:
# Код состояния (status code)
# Текст ответа (response text)
# Заголовки ответа (response headers)

import requests

def get_response(url):
    try:
        response = requests.get(url)
        return response
    except requests.exceptions.RequestException as e:
        # Выбрасываем исключение с сообщением об ошибке
        raise RuntimeError(f"Произошла ошибка при выполнении запроса: {e}")

url = "https://example.com"

try:
    response = get_response(url) # Пытаемся получить ответ от сервера
    if response:                 # Если ответ успешный, выводим информацию
        print("Status Code:", response.status_code)
        print("Response Text:", response.text)
        print("Response Headers:", response.headers)
except RuntimeError as e:
    print(e)
    print("Пожалуйста, проверьте правильность URL-адресов или подключение к интернету.")

Status Code: 200
Response Text: <!doctype html>
<html>
<head>
    <title>Example Domain</title>

    <meta charset="utf-8" />
    <meta http-equiv="Content-type" content="text/html; charset=utf-8" />
    <meta name="viewport" content="width=device-width, initial-scale=1" />
    <style type="text/css">
    body {
        background-color: #f0f0f2;
        margin: 0;
        padding: 0;
        font-family: -apple-system, system-ui, BlinkMacSystemFont, "Segoe UI", "Open Sans", "Helvetica Neue", Helvetica, Arial, sans-serif;
        
    }
    div {
        width: 600px;
        margin: 5em auto;
        padding: 2em;
        background-color: #fdfdff;
        border-radius: 0.5em;
        box-shadow: 2px 3px 7px 2px rgba(0,0,0,0.02);
    }
    a:link, a:visited {
        color: #38488f;
        text-decoration: none;
    }
    @media (max-width: 700px) {
        div {
            margin: 0 auto;
            width: auto;
        }
    }
    </style>    
</head>

<body>
<div>
    <h1>Examp

In [62]:
# Напишите функцию find_common_words(url_list), которая принимает список URL-адресов и
# возвращает список наиболее часто встречающихся слов на веб-страницах. Для каждого URL
# адреса функция должна получить содержимое страницы с помощью запроса GET и использовать
# регулярные выражения для извлечения слов. Затем функция должна подсчитать количество
# вхождений каждого слова и вернуть наиболее часто встречающиеся слова в порядке убывания частоты.

import requests
import re
from collections import Counter

def find_common_words(url_list):
    for url1 in url_list:
        combined_text = ""
        try:
            response = requests.get(url1)
            response.raise_for_status()  # Проверяем наличие HTTP-ошибок
            combined_text = response.text
        except requests.exceptions.RequestException as e:
            raise RuntimeError(f"Ошибка при запросе к {url}: {e}")
            continue  # Переходим к следующему URL в списке

    # Ищем все слова в собранном тексте
        words = re.findall(r"\b[a-zA-Zа-яА-ЯёЁ]+\b", combined_text)      
        for word, count in Counter(words).most_common(5):  # Считаем 5 самых частых слов
             yield url1, word, count

url_list = ["https://example.com",  "https://www.wikipedia.org"]
current_url = None
for url, word, count in find_common_words(url_list):
    if url != current_url:
        # Выводим имя веб-страницы только один раз
        print(f"Часто используемые слова на странице {url}:")
        current_url = url
    print(f"{word}: {count}")

Часто используемые слова на странице https://example.com:
width: 5
html: 4
div: 4
a: 4
p: 4
Часто используемые слова на странице https://www.wikipedia.org:
a: 781
li: 693
lang: 486
org: 411
wikipedia: 383
