In [6]:
import requests
from bs4 import BeautifulSoup

# URL strony z otwarciami szachowymi
url = "https://www.thechesswebsite.com/chess-openings/"

# Pobranie strony
response = requests.get(url)
soup = BeautifulSoup(response.content, "html.parser")

# 1. Scrapowanie listy otwarć (np. "1. e4", "1. d4")
openings_list = soup.find_all("a", id="moves")

# 2. Scrapowanie otwarć z obrazkami
openings_with_images = soup.find_all("a", href=True)

# Tworzymy plik markdown
with open("chess_openings.md", "w") as file:
    # Nagłówek markdown
    file.write("# Otwarcia szachowe\n\n")

    # Zapisujemy listę otwarć (np. 1. e4, 1. d4)
    file.write("## Lista popularnych otwarć:\n")
    for opening in openings_list:
        move = opening.get_text().strip()
        link = opening['href']
        file.write(f"- [{move}]({link})\n")
    
    # Zapisujemy otwarcia z obrazkami i tytułami
    file.write("\n## Otwarcia z obrazkami i tytułami:\n")
    for opening in openings_with_images:
        img_tag = opening.find("img")
        if img_tag:
            img_url = img_tag['src']
            title = opening.find("h5")
            if title:
                title_text = title.get_text().strip()
            else:
                title_text = "Brak tytułu"
            
            # Dodajemy tytuł, obrazek i link
            file.write(f"### [{title_text}]({opening['href']})\n")
            file.write(f"![{title_text}]({img_url})\n\n")

print("Scraping zakończony. Sprawdź plik 'chess_openings.md'.")


Scraping zakończony. Sprawdź plik 'chess_openings.md'.


In [4]:
import requests
from bs4 import BeautifulSoup

# URL strony z otwarciami szachowymi
url = "https://www.thechesswebsite.com/chess-openings/"

# Funkcja do pobierania wstępu z Wikipedii
def get_wikipedia_intro(opening_name):
    search_url = f"https://en.wikipedia.org/wiki/{opening_name.replace(' ', '_')}"
    response = requests.get(search_url)
    if response.status_code == 200:
        wiki_soup = BeautifulSoup(response.content, "html.parser")
        # Pobieramy pierwszy akapit z artykułu na Wikipedii
        intro = wiki_soup.find("p")
        if intro:
            return intro.get_text(strip=True)
    return "Brak dodatkowych informacji z Wikipedii."

# Pobranie strony
response = requests.get(url)
soup = BeautifulSoup(response.content, "html.parser")

# 1. Scrapowanie listy otwarć (np. "1. e4", "1. d4")
openings_list = soup.find_all("a", id="moves")

# 2. Scrapowanie otwarć z obrazkami
openings_with_images = soup.find_all("a", href=True)

# Tworzymy plik markdown
with open("./chess-openings/index.markdown", "w") as file:
    file.write("---\nlayout: page\ntitle: Chess Openings\n---\n\n")
    
    # Nagłówek markdown
    file.write("# Otwarcia szachowe\n\n")

    # Zapisujemy listę otwarć (np. 1. e4, 1. d4)
    file.write("## Lista popularnych otwarć:\n")
    for opening in openings_list:
        move = opening.get_text().strip()
        link = opening['href']
        # Pobieramy dodatkowe informacje o otwarciu
        opening_name = move.replace(' ', '_')  # Zamieniamy spacje na podkreślniki
        wiki_info = get_wikipedia_intro(opening_name)
        
        # Zapisujemy dane do pliku markdown
        file.write(f"- [{move}]({link})\n")
        file.write(f"  - Dodatkowe informacje: {wiki_info}\n")
    
    # Zapisujemy otwarcia z obrazkami i tytułami
    file.write("\n## Otwarcia z obrazkami i tytułami:\n")
    for opening in openings_with_images:
        img_tag = opening.find("img")
        if img_tag:
            img_url = img_tag['src']
            title = opening.find("h5")
            if title:
                title_text = title.get_text().strip()
            else:
                title_text = "Brak tytułu"
            
            # Dodajemy tytuł, obrazek i link
            file.write(f"### [{title_text}]({opening['href']})\n")
            file.write(f"![{title_text}]({img_url})\n\n")
            # Pobieramy dodatkowe informacje z Wikipedii
            wiki_info = get_wikipedia_intro(title_text)
            file.write(f"  - Dodatkowe informacje: {wiki_info}\n")

    # Sekcja szablonu Jekyll
    

print("Scraping zakończony. Sprawdź plik 'chess-openings.md'.")


Scraping zakończony. Sprawdź plik 'chess-openings.md'.
