In [6]:
import bs4 as bs  # BeautifulSoup kütüphanesini içe aktarıyoruz
import urllib.request  # Web sayfası içeriğini almak için kullanılır
import re  # Düzenli ifadeler ile metin işleme işlemleri için kullanılır
import nltk  # Doğal dil işleme için kullanılan bir kütüphane
import heapq  # En yüksek puanlı cümleleri seçmek için kullanılır

# Gerekli NLTK veri dosyalarını indiriyoruz
nltk.download('punkt')
nltk.download('stopwords')

# Wikipedia'dan belirli bir makaleyi çekiyoruz
url = 'https://tr.wikipedia.org/wiki/Programlama'
scraped_data = urllib.request.urlopen(url)
article = scraped_data.read()

# Makale içeriğini BeautifulSoup ile ayrıştırıyoruz
parsed_article = bs.BeautifulSoup(article, 'lxml')

# Tüm paragraf (<p>) etiketlerini alıyoruz
paragraphs = parsed_article.find_all('p')

# Makale metnini oluşturuyoruz
article_text = " ".join(p.text for p in paragraphs)

# Kare parantez içindeki referans numaralarını ve ekstra boşlukları kaldırıyoruz
article_text = re.sub(r'\[[0-9]*\]', ' ', article_text)
article_text = re.sub(r'\s+', ' ', article_text)

# Özel karakterleri ve sayıları kaldırıyoruz, sadece harfler kalıyor
formatted_article_text = re.sub('[^a-zA-ZğüşıöçĞÜŞİÖÇ ]', ' ', article_text)
formatted_article_text = re.sub(r'\s+', ' ', formatted_article_text)

# Metni cümlelere ayırıyoruz
sentence_list = nltk.sent_tokenize(article_text)

# Kelimelerin ağırlıklı frekansını buluyoruz
stopwords = set(nltk.corpus.stopwords.words('turkish'))  # Türkçe stopword'leri alıyoruz

word_frequencies = {}  # Kelime sıklıklarını saklamak için boş bir sözlük
for word in nltk.word_tokenize(formatted_article_text.lower()):
    if word not in stopwords:  # Eğer kelime stopword değilse
        word_frequencies[word] = word_frequencies.get(word, 0) + 1

# En yüksek frekansa sahip kelimeyi belirleyerek tüm frekansları normalleştiriyoruz
maximum_frequency = max(word_frequencies.values(), default=1)
for word in word_frequencies:
    word_frequencies[word] /= maximum_frequency

# Cümlelere puan veriyoruz
sentence_scores = {}
for sent in sentence_list:
    sentence_words = nltk.word_tokenize(sent.lower())
    sentence_scores[sent] = sum(word_frequencies.get(word, 0) for word in sentence_words if len(sent.split()) < 30)

# En yüksek puanlı 7 cümleyi seçerek özet oluşturuyoruz
summary_sentences = heapq.nlargest(7, sentence_scores, key=sentence_scores.get)
summary = ' '.join(summary_sentences)

# Özetlenen metni ekrana yazdırıyoruz
print("Özet:", summary)


[nltk_data] Downloading package punkt to
[nltk_data]     C:\Users\EXCALIBUR\AppData\Roaming\nltk_data...
[nltk_data]   Package punkt is already up-to-date!
[nltk_data] Downloading package stopwords to
[nltk_data]     C:\Users\EXCALIBUR\AppData\Roaming\nltk_data...
[nltk_data]   Package stopwords is already up-to-date!


Özet: Yazılan kaynak kodu genellikle bir derleyici ve bağlayıcı yardımıyla belirli bir sistemde çalıştırılabilir hale getirilir. Bir program yazmak veya bir problemi çözmek için öncelikle komutları unutmak ve çözümü gerçek hayatta yapıyormuş gibi düşünmek gerekir. Bu programlama dili Java ve C# gibi yüksek seviyede bir dil olabileceği gibi C, assembly ve bazı durumlarda makine dili de olabilir. Ayrıca kaynak kodu, bir yorumlayıcı yardımıyla derlemeye gerek duyulmadan satır satır çalıştırılabilir. Diğer bir tanımla programlama, bilgisayar programlarının yazılması, test edilmesi ve bakımının yapılması sürecine verilen isimdir. Programlama ya da diğer adı ile yazılımlama (İngilizce: programming), bilgisayarın donanıma nasıl davranacağını anlatan, bilgisayara yön veren komutlar, kelimeler, aritmetik işlemlerdir. Programlama, bir programlama dilinde yapılır.
