# Creating an Excel Database for Episode Info

## Creating an excel file

In [7]:
# pip install pandas
# pip install load_dotenv

In [6]:
import pandas as pd
from dotenv import load_dotenv
import os
import feedparser

In [7]:
# Load env variables from .env file
load_dotenv()
no_url = os.getenv("NO_URL")

In [8]:
# Getting the feed
feed = feedparser.parse(no_url)

In [9]:
# Write to excel file
excel_filename = "nasil_olunur_database.xlsx"

In [7]:
# Populate the dataframe
# collect all rows in a list and concat at once for faster performance

rows = []

for episode in feed['entries']:
    title = episode["title"]
    dash_pos = title.find("-")
    episode_number = title[:dash_pos]
    audio_url = episode.enclosures[0].href
    guest_name = title[dash_pos+1:].strip()
    description = episode["description"]

    rows.append(
        {
        'Episode Number': episode_number,
        'Episode Title': title,
        'Episode Audio Url': audio_url,
        'Guest Name': guest_name

        }
    )

    df = pd.DataFrame(rows)
    df.set_index('Episode Number', inplace=True)
    # print(df)


Konuğum, şarkılarının sözlerini de kendi yazan bir müzisyen, şair ve şimdi roman yazarı Can Bonomo.
Bonomo ile sohbete ‘Ateşli Silahlar ve Bilardo’ adlı kitabından konuşarak başladık; çocukluğundan, İzmir’den, radyoculuk günlerinden, ilk albümüne giden yoldan ve sonrasından, uzun yıllar dağılmayan ekiplerle işler yapmaktan, yemekten, şairden, şiirden, resimden, ilişkilerden, çok yönlü olmaktan, ilgi alanlarından, neşeden ve daha pek çok konudan söz açtık. Ve onun değimiyle “Podcast yapmanın, tekne sahibi olmaya benzemesi”ne de vurgu yaptık mı; yaptık! Zengin işi gibi biraz podcast yapmak, durduğu yerde yakıyor ve belki de en iyisi arkadaşının podcasti:)


In [65]:
# Dataframe to excel
df.to_excel(excel_filename, index=True)

## Adding Descriptions to Database

In [10]:
database_path = "nasil_olunur_database.xlsx"

df = pd.read_excel(database_path)

In [11]:
df.tail()

Unnamed: 0.1,Unnamed: 0,Episode Number,Episode Title,Episode Audio Url,Guest Name,Word Document Name,Keyword - People,Keyword - Places (TR),Keyword - Subjects (TR),Keyword - Subjects (EN),Description (TR),Description (EN),Episode Date
226,226,5,5: Murat Meriç,https://cdn.simplecast.com/audio/41de06/41de06...,Murat Meriç,/Users/kaanerdem/Desktop/projeler/pdtxt/pdtxt_...,"Murat Meriç, Bülent Ortaçgil, Barış Bıçakçı, S...","Ankara, Gezi Parkı","müzik yazarlığı, şarkı sözleri, radyoculuk, be...","music writing, song lyrics, radio broadcasting...","Bu bölümün konuğu; basılı medyadan, radyo ve t...",,2019-03-28
227,227,4,4: İbrahim Selim,https://cdn.simplecast.com/audio/41de06/41de06...,İbrahim Selim,/Users/kaanerdem/Desktop/projeler/pdtxt/pdtxt_...,"İbrahim Selim, Hakan Günday, Serenay Sarıkaya,...","İstanbul, Bağdat Caddesi, Onedio Stüdyoları, D...","oyunculuk, şarkı söz yazarlığı, dizi sektörü, ...","acting, songwriting, TV series industry, theat...","İbrahim Selim, kendi neslinin en yetenekli akt...",,2019-03-28
228,228,3,3: İsmail Küçükkaya,https://cdn.simplecast.com/audio/41de06/41de06...,İsmail Küçükkaya,,,,,,Hafta içi her sabah Fox TV'de Çalar Saat'i haz...,,2019-03-28
229,229,2,2: Zeynep Atakan,https://cdn.simplecast.com/audio/41de06/41de06...,Zeynep Atakan,,,,,,"Bu bölümde, ülkemizde 'bağımsız film yapımcılı...",,2019-03-28
230,230,1,1: Serdar Kuzuloğlu,https://cdn.simplecast.com/audio/41de06/41de06...,Serdar Kuzuloğlu,,,,,,"İkizleri yeni dünyaya gelmişti, bir purosu ve ...",,2019-03-28


In [69]:
from datetime import datetime

In [72]:
# results = {}
#
# for episode in feed['entries']:
#     description_tr = episode["description"]
#     dash_pos = title.find("-")
#     title = episode["title"]
#     episode_number = title[:dash_pos]
#
#     results[episode_number] = description_tr
#
# # print(results)
#
results = {}

for episode in feed['entries']:
    description_tr = episode["description"]
    title = episode["title"]
    date = episode["published"]
    date_obj = datetime.strptime(date, "%a, %d %b %Y %H:%M:%S %z")
    formatted_date = date_obj.strftime("%Y-%m-%d")

    # Find the position of the dash and colon
    dash_pos = title.find("-")
    colon_pos = title.find(":")

    # Choose the first occurring position among dash and colon
    split_pos = min(
        pos for pos in [dash_pos, colon_pos] if pos != -1
    ) if dash_pos != -1 or colon_pos != -1 else None

    # Extract the episode number if a valid split position was found
    if split_pos is not None:
        episode_number = title[:split_pos].strip()  # Strip to remove extra spaces
    else:
        episode_number = title  # Default to the full title if no dash or colon found

    results[episode_number] = [description_tr, formatted_date]

# print(results)



In [73]:
df.tail()

Unnamed: 0,Episode Number,Episode Title,Episode Audio Url,Guest Name,Word Document Name,Keyword - People,Keyword - Places (TR),Keyword - Subjects (TR),Keyword - Subjects (EN),Description (TR),Description (EN)
226,5,5: Murat Meriç,https://cdn.simplecast.com/audio/41de06/41de06...,Murat Meriç,/Users/kaanerdem/Desktop/projeler/pdtxt/pdtxt_...,"Murat Meriç, Bülent Ortaçgil, Barış Bıçakçı, S...","Ankara, Gezi Parkı","müzik yazarlığı, şarkı sözleri, radyoculuk, be...","music writing, song lyrics, radio broadcasting...","Bu bölümün konuğu; basılı medyadan, radyo ve t...",
227,4,4: İbrahim Selim,https://cdn.simplecast.com/audio/41de06/41de06...,İbrahim Selim,/Users/kaanerdem/Desktop/projeler/pdtxt/pdtxt_...,"İbrahim Selim, Hakan Günday, Serenay Sarıkaya,...","İstanbul, Bağdat Caddesi, Onedio Stüdyoları, D...","oyunculuk, şarkı söz yazarlığı, dizi sektörü, ...","acting, songwriting, TV series industry, theat...","İbrahim Selim, kendi neslinin en yetenekli akt...",
228,3,3: İsmail Küçükkaya,https://cdn.simplecast.com/audio/41de06/41de06...,İsmail Küçükkaya,,,,,,Hafta içi her sabah Fox TV'de Çalar Saat'i haz...,
229,2,2: Zeynep Atakan,https://cdn.simplecast.com/audio/41de06/41de06...,Zeynep Atakan,,,,,,"Bu bölümde, ülkemizde 'bağımsız film yapımcılı...",
230,1,1: Serdar Kuzuloğlu,https://cdn.simplecast.com/audio/41de06/41de06...,Serdar Kuzuloğlu,,,,,,"İkizleri yeni dünyaya gelmişti, bir purosu ve ...",


In [74]:
episode_numbers = [
    4, 5, 6, 7, 8, 9, 11, 12, 14, 15, 17, 19, 21, 22, 23, 24, 25, 26, 27,
    28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45,
    46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58
]

for episode in range(1,231):
    df.loc[df["Episode Number"] == episode, ["Episode Date"]] = results[str(episode)][1]

In [78]:
df.tail()

Unnamed: 0,Episode Number,Episode Title,Episode Audio Url,Guest Name,Word Document Name,Keyword - People,Keyword - Places (TR),Keyword - Subjects (TR),Keyword - Subjects (EN),Description (TR),Description (EN),Episode Date
226,5,5: Murat Meriç,https://cdn.simplecast.com/audio/41de06/41de06...,Murat Meriç,/Users/kaanerdem/Desktop/projeler/pdtxt/pdtxt_...,"Murat Meriç, Bülent Ortaçgil, Barış Bıçakçı, S...","Ankara, Gezi Parkı","müzik yazarlığı, şarkı sözleri, radyoculuk, be...","music writing, song lyrics, radio broadcasting...","Bu bölümün konuğu; basılı medyadan, radyo ve t...",,2019-03-28
227,4,4: İbrahim Selim,https://cdn.simplecast.com/audio/41de06/41de06...,İbrahim Selim,/Users/kaanerdem/Desktop/projeler/pdtxt/pdtxt_...,"İbrahim Selim, Hakan Günday, Serenay Sarıkaya,...","İstanbul, Bağdat Caddesi, Onedio Stüdyoları, D...","oyunculuk, şarkı söz yazarlığı, dizi sektörü, ...","acting, songwriting, TV series industry, theat...","İbrahim Selim, kendi neslinin en yetenekli akt...",,2019-03-28
228,3,3: İsmail Küçükkaya,https://cdn.simplecast.com/audio/41de06/41de06...,İsmail Küçükkaya,,,,,,Hafta içi her sabah Fox TV'de Çalar Saat'i haz...,,2019-03-28
229,2,2: Zeynep Atakan,https://cdn.simplecast.com/audio/41de06/41de06...,Zeynep Atakan,,,,,,"Bu bölümde, ülkemizde 'bağımsız film yapımcılı...",,2019-03-28
230,1,1: Serdar Kuzuloğlu,https://cdn.simplecast.com/audio/41de06/41de06...,Serdar Kuzuloğlu,,,,,,"İkizleri yeni dünyaya gelmişti, bir purosu ve ...",,2019-03-28


In [76]:
df.to_excel(excel_filename, index=True)

Let's Fill the Word Document Name Column

In [4]:
df = pd.read_excel(excel_filename)

In [16]:
df_filtered = df[df["Episode Number"] == 1]
df_filtered.tail()

Unnamed: 0.1,Unnamed: 0,Episode Number,Episode Title,Episode Audio Url,Guest Name,Word Document Name,Keyword - People,Keyword - Places (TR),Keyword - Subjects (TR),Keyword - Subjects (EN),Description (TR),Description (EN),Episode Date
230,230,1,1: Serdar Kuzuloğlu,https://cdn.simplecast.com/audio/41de06/41de06...,Serdar Kuzuloğlu,,,,,,"İkizleri yeni dünyaya gelmişti, bir purosu ve ...",,2019-03-28
