# Nodebook CSV Manager  
Ce nodebook sert de bac à sable pour la création des fonctions et algorythmes des questions portant sur le CSV

#### Import des dépendances / libraries

In [None]:
import pandas as pd
import csv
from webscrapper import ScrapEpisodes
from ManagerCSV.ManagerCSV import ManagerCSV

#### Class de gestion du SVG

In [40]:
class ManagerCSV() : 
    def __init__(self,episodes) :
        self.episodes = episodes

    def data_to_df(self) : 
        data_to_df = {
            "series_name" : [],
            "episode_number" : [],
            "season_number" : [],
            "air_date" : [],
            "origin_country" : [],
            "channel" : [],
            "episode_url" : [],
            "duration":[]
        }
        try : 
            for episode in self.episodes :
                data_to_df.get("series_name").append(episode.get("series_name"))
                data_to_df.get("episode_number").append(episode.get("episode_number"))
                data_to_df.get("season_number").append(episode.get("season_number"))
                data_to_df.get("air_date").append(episode.get("air_date"))
                data_to_df.get("origin_country").append(episode.get("origin_country"))
                data_to_df.get("channel").append(episode.get("channel"))
                data_to_df.get("episode_url").append(episode.get("episode_url"))
                if episode.get("duration") is not None:
                    data_to_df.get("duration").append(episode.get("duration"))
                else : 

                    data_to_df.get("duration").append("None")
            return pd.DataFrame(data_to_df)
        except : 
            print("Erreur lors de la création du dataframe !")
            return None
        


    def df_to_csv(self,dataframe,path_file) :
        try :
            dataframe.to_csv(path_file,sep=';')
            print("Fichier csv créé avec succès ! : ",path_file)
            return True
        except :
            print("Erreur lors de la création du fichier csv")
            return False

    def csv_to_tuples(self,fichier_csv) :
        tuples = []
        try : 
            with open(fichier_csv, 'r', encoding='utf-8') as csv_file:
                csv_reader = csv.reader(csv_file, delimiter=';')
                next(csv_reader) # Enleve la premiere ligne
                for row in csv_reader:
                    index = int(row[0])
                    titre = str(row[1])
                    saison = int(row[2])
                    episode = int(row[3])
                    date_diffusion = str(row[4])
                    pays = str(row[5])
                    chaine = str(row[6])
                    lien = str(row[7])
                    if row[8] == "None" : 
                        duration = str(row[8])
                    else : 
                        duration = int(row[8])
                    
                    tup = (index, titre, saison, episode, date_diffusion, pays, chaine, lien,duration)
                    tuples.append(tup)
        except:
            print("Erreur lors de la lecture du fichier csv !", )
            return False
        return tuples

    
    def verify_types(self,tuples) : 
        types_tuples = []
        for tup in tuples :
            enum = {
                "int" : "integer",
                "str" : "string",
            }
            types = (
                enum.get(type(tup[0]).__name__),
                enum.get(type(tup[1]).__name__),
                enum.get(type(tup[2]).__name__),
                enum.get(type(tup[3]).__name__),
                enum.get(type(tup[4]).__name__),
                enum.get(type(tup[5]).__name__),
                enum.get(type(tup[6]).__name__),
                enum.get(type(tup[7]).__name__),
                enum.get(type(tup[8]).__name__),
                )

            types_tuples.append(types)
        return types_tuples #Retourne une liste de tuples contenant les types des colonnes

#### Scrapping des données

In [26]:
base_url = "https://www.spin-off.fr"

scrapper = ScrapEpisodes(base_url, "/calendrier_des_series.html")
episodes = scrapper.getAllEpisodes()

Récupération des données de la page Invasion (2021)...
Récupération des données de la page The Morning Show...
Récupération des données de la page Still Up...
Récupération des données de la page The Changeling...
Récupération des données de la page Invasion (2021)...
Récupération des données de la page The Morning Show...
Récupération des données de la page Lessons In Chemistry...
Récupération des données de la page Lessons In Chemistry...
Récupération des données de la page Still Up...
Récupération des données de la page The Changeling...
Récupération des données de la page Invasion (2021)...
Récupération des données de la page The Morning Show...
Récupération des données de la page Lessons In Chemistry...
Récupération des données de la page Still Up...
Récupération des données de la page Invasion (2021)...
Récupération des données de la page The Morning Show...
Récupération des données de la page Lessons In Chemistry...
Récupération des données de la page Still Up...


#### Conversion des données en Dataframe

In [45]:
csv_manager = ManagerCSV(episodes)
csv_df = csv_manager.data_to_df()
csv_df.head(10)

Unnamed: 0,series_name,episode_number,season_number,air_date,origin_country,channel,episode_url,duration
0,Arthdal Chronicles,8,2,01-10-2023,Corée du Sud,tvN,episode08-411009-01102023-saison2-Arthdal-Chro...,
1,Behind Your Touch,16,1,01-10-2023,Etats-Unis,Netflix,episode16-408686-01102023-saison1-Behind-Your-...,
2,Bob's Burgers,1,14,01-10-2023,Etats-Unis,Fox,episode01-408094-01102023-saison14-Bob-s-Burge...,
3,Entre Tierras,4,1,01-10-2023,Espagne,ATRESplayer,episode04-410970-01102023-saison1-Entre-Tierra...,
4,Family Guy,1,22,01-10-2023,Etats-Unis,Fox,episode01-408096-01102023-saison22-Family-Guy....,
5,Heartland (CA),1,17,01-10-2023,Canada,CBC,episode01-410271-01102023-saison17-Heartland-(...,
6,Krapopolis,3,1,01-10-2023,Etats-Unis,Fox,episode03-408093-01102023-saison1-Krapopolis.html,
7,Last Week Tonight With John Oliver,11,10,01-10-2023,Etats-Unis,HBO,episode11-410868-01102023-saison10-Last-Week-T...,
8,Les Mystères de l'amour,8,33,01-10-2023,France,TMC,episode08-410185-01102023-saison33-Les-Mystere...,
9,SkyMed,1,2,01-10-2023,Canada,CBC Gem,episode01-410144-01102023-saison2-SkyMed.html,


#### Exportation en CSV

In [None]:
csv_manager.df_to_csv(csv_df,"./data/files/episodes.csv")

#### Affichage des tuples depuis le fichier CSV

In [46]:
csv_tuples = csv_manager.csv_to_tuples("./data/files/episodes.csv")
for i in csv_tuples :
    print(i)

(0, 'Arthdal Chronicles', 8, 2, '01-10-2023', 'Corée du Sud', 'tvN', 'episode08-411009-01102023-saison2-Arthdal-Chronicles.html', 'None')
(1, 'Behind Your Touch', 16, 1, '01-10-2023', 'Etats-Unis', 'Netflix', 'episode16-408686-01102023-saison1-Behind-Your-Touch.html', 'None')
(2, "Bob's Burgers", 1, 14, '01-10-2023', 'Etats-Unis', 'Fox', 'episode01-408094-01102023-saison14-Bob-s-Burgers.html', 'None')
(3, 'Entre Tierras', 4, 1, '01-10-2023', 'Espagne', 'ATRESplayer', 'episode04-410970-01102023-saison1-Entre-Tierras.html', 'None')
(4, 'Family Guy', 1, 22, '01-10-2023', 'Etats-Unis', 'Fox', 'episode01-408096-01102023-saison22-Family-Guy.html', 'None')
(5, 'Heartland (CA)', 1, 17, '01-10-2023', 'Canada', 'CBC', 'episode01-410271-01102023-saison17-Heartland-(CA).html', 'None')
(6, 'Krapopolis', 3, 1, '01-10-2023', 'Etats-Unis', 'Fox', 'episode03-408093-01102023-saison1-Krapopolis.html', 'None')
(7, 'Last Week Tonight With John Oliver', 11, 10, '01-10-2023', 'Etats-Unis', 'HBO', 'episode11-

#### Affichage des types des tuples précédemment créés

In [42]:
csv_types = csv_manager.verify_types(csv_tuples)
for i in csv_types : 
    print(i)

('integer', 'string', 'integer', 'integer', 'string', 'string', 'string', 'string', 'string')
('integer', 'string', 'integer', 'integer', 'string', 'string', 'string', 'string', 'string')
('integer', 'string', 'integer', 'integer', 'string', 'string', 'string', 'string', 'string')
('integer', 'string', 'integer', 'integer', 'string', 'string', 'string', 'string', 'string')
('integer', 'string', 'integer', 'integer', 'string', 'string', 'string', 'string', 'string')
('integer', 'string', 'integer', 'integer', 'string', 'string', 'string', 'string', 'string')
('integer', 'string', 'integer', 'integer', 'string', 'string', 'string', 'string', 'string')
('integer', 'string', 'integer', 'integer', 'string', 'string', 'string', 'string', 'string')
('integer', 'string', 'integer', 'integer', 'string', 'string', 'string', 'string', 'string')
('integer', 'string', 'integer', 'integer', 'string', 'string', 'string', 'string', 'string')
('integer', 'string', 'integer', 'integer', 'string', 'strin

#### Filtrage des episodes qui ont une durée

In [49]:
filtered_df = csv_df[csv_df["duration"] != "None"]
filtered_df.head(10)

Unnamed: 0,series_name,episode_number,season_number,air_date,origin_country,channel,episode_url,duration
62,Invasion (2021),7,2,04-10-2023,Etats-Unis,Apple TV+,episode07-407971-04102023-saison2-Invasion-(20...,52
68,The Morning Show,5,3,04-10-2023,Etats-Unis,Apple TV+,episode05-407700-04102023-saison3-The-Morning-...,50
139,Still Up,5,1,06-10-2023,Etats-Unis,Apple TV+,episode05-408946-06102023-saison1-Still-Up.html,45
140,The Changeling,7,1,06-10-2023,Etats-Unis,Apple TV+,episode07-408182-06102023-saison1-The-Changeli...,50
205,Invasion (2021),8,2,11-10-2023,Etats-Unis,Apple TV+,episode08-407972-11102023-saison2-Invasion-(20...,52
235,The Morning Show,6,3,11-10-2023,Etats-Unis,Apple TV+,episode06-407701-11102023-saison3-The-Morning-...,50
301,Lessons In Chemistry,1,1,13-10-2023,Etats-Unis,Apple TV+,episode01-406597-13102023-saison1-Lessons-In-C...,54
302,Lessons In Chemistry,2,1,13-10-2023,Etats-Unis,Apple TV+,episode02-406598-13102023-saison1-Lessons-In-C...,54
308,Still Up,6,1,13-10-2023,Etats-Unis,Apple TV+,episode06-408947-13102023-saison1-Still-Up.html,45
309,The Changeling,8,1,13-10-2023,Etats-Unis,Apple TV+,episode08-408183-13102023-saison1-The-Changeli...,50
