In [1]:
# İmdb 250 listesinde bulunan bir film sitesindeki filmleri ve puanlarını çekme

import requests
from bs4 import BeautifulSoup
import pandas as pd

# IMDb Top 250 sayfasının URL'si
url = "https://www.imdb.com/chart/top/"

# Tarayıcı benzeri başlıklardan kurtulmak için: Google: my user agent
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/122.0.0.0 Safari/537.36"
}

# Sayfayı çekme
response = requests.get(url, headers=headers)
if response.status_code != 200:  # 200 durum kodu başarı içindir.
    raise Exception(f"Failed to load page {url}")


# Beautiful Soup ile parse etme(ayrıştırma işlemi)
soup = BeautifulSoup(response.content, 'html.parser')



# Filmlerin bulunduğu tabloyu bulma
movies_table = soup.find(name="ul", class_="ipc-metadata-list ipc-metadata-list--dividers-between sc-a1e81754-0 eBRbsI compact-list-view ipc-metadata-list--base")

# Tabloyu bulup bulamadığımızı kontrol etme
if not movies_table:
    raise Exception("Could not find the movie table. The page structure might have changed.")

# Filmleri bulma
movies = movies_table.find_all('li', class_='ipc-metadata-list-summary-item')
# Film bilgilerini saklamak için boş liste
movie_list = []

# Tüm Filmleri kazıma için for loop
for movie in movies:
    # Film adı
    title_tag = movie.find('h3', class_='ipc-title__text')
    #print(title_tag)
    title = title_tag.text.strip() if title_tag else 'N/A'
    #print(title)
    # Yapım yılı
    year_tag = movie.find('span', class_='sc-b189961a-8 kLaxqf cli-title-metadata-item')      
    #print(year_tag)
    year = year_tag.text.strip('()') if year_tag else 'N/A'
    #print(year)
    
    # Rating ve oy sayısı
    rating_tag = movie.find('span', class_='ipc-rating-star ipc-rating-star--base ipc-rating-star--imdb ratingGroup--imdb-rating')    
    #print(rating_tag)
    rating = rating_tag.text.strip() if rating_tag else 'N/A'
    #print(rating)
    
    # Filmin bilgilerini listeye ekleme
    movie_list.append([title, year, rating])

# Verileri bir DataFrame'e dönüştürme
df = pd.DataFrame(movie_list, columns=['Movie', 'Year', 'Rating'])

# DataFrame'i görüntüleme
print(df)


                                                Movie  Year      Rating
0                         1. The Shawshank Redemption  1994  9.3 (2.9M)
1                                    2. The Godfather  1972    9.2 (2M)
2                                  3. The Dark Knight  2008  9.0 (2.9M)
3                            4. The Godfather Part II  1974  9.0 (1.4M)
4                                     5. 12 Angry Men  1957  9.0 (876K)
5                                 6. Schindler's List  1993  9.0 (1.5M)
6    7. The Lord of the Rings: The Return of the King  2003    9.0 (2M)
7                                     8. Pulp Fiction  1994  8.9 (2.2M)
8   9. The Lord of the Rings: The Fellowship of th...  2001    8.9 (2M)
9                 10. Il buono, il brutto, il cattivo  1966  8.8 (818K)
10                                   11. Forrest Gump  1994  8.8 (2.3M)
11          12. The Lord of the Rings: The Two Towers  2002  8.8 (1.8M)
12                                     13. Fight Club  1999  8.8

In [2]:
df.to_excel('cikti.xlsx', index=False)

In [2]:
#pip install requests

In [3]:
#pip install bs4