In [1]:
import requests
from bs4 import BeautifulSoup

def scrape_wikipedia(url):
    """
    Scrapes a Wikipedia article.

    Args:
        url (str): The URL of the Wikipedia article.

    Returns:
        dict: A dictionary containing the scraped data.
    """

    # Kirim permintaan GET ke URL
    response = requests.get(url)

    # Parse konten HTML menggunakan BeautifulSoup
    soup = BeautifulSoup(response.content, 'html.parser')

    # Ekstrak judul artikel
    title = soup.find('h1', id='firstHeading').text

    # Ekstrak konten utama artikel
    content = soup.find('div', class_='mw-parser-output')

    # Hapus elemen yang tidak diinginkan (misalnya, referensi, catatan kaki)
    for element in content.find_all(['sup', 'ol', 'ul', 'table']):
        element.extract()

    # Ekstrak teks dari konten yang tersisa
    text = content.get_text()

    # Buat kamus untuk menyimpan data yang di-scrape
    data = {
        'title': title,
        'text': text
    }

    return data

# Contoh penggunaan
url = 'https://id.wikipedia.org/wiki/Python_(bahasa_pemrograman)'
data = scrape_wikipedia(url)
print(data)

{'title': 'Python (bahasa pemrograman)', 'text': '\n\n\n\nPython adalah bahasa pemrograman tujuan umum yang ditafsirkan, tingkat tinggi. Dibuat oleh Guido van Rossum dan pertama kali dirilis pada tahun 1991, filosofi desain Python menekankan keterbacaan kode dengan penggunaan spasi putih yang signifikan. Konstruksi bahasanya dan pendekatan berorientasi objek bertujuan untuk membantu pemrogram menulis kode yang jelas dan logis untuk proyek skala kecil dan besar.\nPython diketik secara dinamis dan pengumpulan sampah. Ini mendukung beberapa paradigma pemrograman, termasuk pemrograman terstruktur (terutama, prosedural), berorientasi objek, dan fungsional. Python sering dideskripsikan sebagai bahasa "termasuk baterai" karena perpustakaan standarnya yang komprehensif.\nPython dibuat pada akhir 1980-an sebagai penerus bahasa ABC. Python 2.0, dirilis pada tahun 2000, memperkenalkan fitur-fitur seperti pemahaman daftar dan sistem pengumpulan sampah dengan penghitungan referensi.\nPython 3.0, di