In [1]:
import pandas as pd

# Bibliotecas para visualização dos dados
import matplotlib.pyplot as plt
import seaborn as sns


Carregando dataset

In [2]:
df = pd.read_csv('netflix_titles.csv')

In [3]:
df.head()

Unnamed: 0,show_id,type,title,director,cast,country,date_added,release_year,rating,duration,listed_in,description
0,s1,Movie,Dick Johnson Is Dead,Kirsten Johnson,,United States,"September 25, 2021",2020,PG-13,90 min,Documentaries,"As her father nears the end of his life, filmm..."
1,s2,TV Show,Blood & Water,,"Ama Qamata, Khosi Ngema, Gail Mabalane, Thaban...",South Africa,"September 24, 2021",2021,TV-MA,2 Seasons,"International TV Shows, TV Dramas, TV Mysteries","After crossing paths at a party, a Cape Town t..."
2,s3,TV Show,Ganglands,Julien Leclercq,"Sami Bouajila, Tracy Gotoas, Samuel Jouy, Nabi...",,"September 24, 2021",2021,TV-MA,1 Season,"Crime TV Shows, International TV Shows, TV Act...",To protect his family from a powerful drug lor...
3,s4,TV Show,Jailbirds New Orleans,,,,"September 24, 2021",2021,TV-MA,1 Season,"Docuseries, Reality TV","Feuds, flirtations and toilet talk go down amo..."
4,s5,TV Show,Kota Factory,,"Mayur More, Jitendra Kumar, Ranjan Raj, Alam K...",India,"September 24, 2021",2021,TV-MA,2 Seasons,"International TV Shows, Romantic TV Shows, TV ...",In a city of coaching centers known to train I...


### Quais colunas estão presentes no dataset?

Para verificar a quantidade de colunas presente no dataset, basta verificar via **columns** da biblioteca do pandas, ela retorna em formato de lista todas as colunas do dataset

In [4]:
df.columns

Index(['show_id', 'type', 'title', 'director', 'cast', 'country', 'date_added',
       'release_year', 'rating', 'duration', 'listed_in', 'description'],
      dtype='object')

In [5]:
print(f"O dataset possui {len(df.columns)} colunas")

O dataset possui 12 colunas


### Quantos filmes estão disponíveis na Netflix?

É possível observar que o dataset possui uma coluna **type** nela é explicitado o tipo do contéudo. 

Como é possível observar no código abaixo, possuimos os seguintes tipos : **Movie** e **TV Show**

Assim, temos que filtrar apenas as linhas que possuam **Movie** como type

In [6]:
df['type'].unique()

array(['Movie', 'TV Show'], dtype=object)

In [8]:
df_movies = df[df['type'] == 'Movie']
df_movies.head()

Unnamed: 0,show_id,type,title,director,cast,country,date_added,release_year,rating,duration,listed_in,description
0,s1,Movie,Dick Johnson Is Dead,Kirsten Johnson,,United States,"September 25, 2021",2020,PG-13,90 min,Documentaries,"As her father nears the end of his life, filmm..."
6,s7,Movie,My Little Pony: A New Generation,"Robert Cullen, José Luis Ucha","Vanessa Hudgens, Kimiko Glenn, James Marsden, ...",,"September 24, 2021",2021,PG,91 min,Children & Family Movies,Equestria's divided. But a bright-eyed hero be...
7,s8,Movie,Sankofa,Haile Gerima,"Kofi Ghanaba, Oyafunmike Ogunlano, Alexandra D...","United States, Ghana, Burkina Faso, United Kin...","September 24, 2021",1993,TV-MA,125 min,"Dramas, Independent Movies, International Movies","On a photo shoot in Ghana, an American model s..."
9,s10,Movie,The Starling,Theodore Melfi,"Melissa McCarthy, Chris O'Dowd, Kevin Kline, T...",United States,"September 24, 2021",2021,PG-13,104 min,"Comedies, Dramas",A woman adjusting to life after a loss contend...
12,s13,Movie,Je Suis Karl,Christian Schwochow,"Luna Wedler, Jannis Niewöhner, Milan Peschel, ...","Germany, Czech Republic","September 23, 2021",2021,TV-MA,127 min,"Dramas, International Movies",After most of her family is murdered in a terr...


Após a criação do dataset contendo apenas filmes, para garantir que não houvesse linhas com filmes repetidos, utilizei a função unique sobre a coluna de titúlos, garantindo que não haveria repetição e tivessemos o número exato de filmes

In [9]:
filmes_unicos = df_movies['title'].unique()

print(f"A netflix possui {len(filmes_unicos)} filmes disponíveis")

A netflix possui 6131 filmes disponíveis


### Quem são os 5 diretores com mais filmes e séries na plataforma?

In [10]:
df_directos_movie = df_movies['director'].value_counts().head(5)

In [11]:
print("Os 5 diretores com mais filmes são:")

for key, value in df_directos_movie.items():
    print(f"{key} - {value} filmes")

Os 5 diretores com mais filmes são:
Rajiv Chilaka - 19 filmes
Raúl Campos, Jan Suter - 18 filmes
Suhas Kadav - 16 filmes
Marcus Raboy - 15 filmes
Jay Karas - 14 filmes


### Quais diretores também atuaram como atores em suas próprias produções?

Nessa questão voltamos a atuar no dataset como um todo, dado que não há exclusividade de filmes

Inicialmente, converti a coluna de cast para uma lista, afim de facilitar a verificação do diretor, uma vez que, antes ela era uma longa string contendo o nome dos atores

In [12]:
df['cast'] = df['cast'].apply(lambda x: x.split(", ") if pd.notnull(x) else [])

In [35]:
list_directors_actors = df[df.apply(lambda row: row['director'] in row['cast'], axis=1)]

In [36]:
list_directors_actors

Unnamed: 0,show_id,type,title,director,cast,country,date_added,release_year,rating,duration,listed_in,description
107,s108,Movie,A Champion Heart,David de Vos,"[Mandy Grace, David de Vos, Donna Rusch, Devan...",United States,"September 4, 2021",2018,G,90 min,"Children & Family Movies, Dramas",When a grieving teen must work off her debt to...
139,s140,Movie,Do the Right Thing,Spike Lee,"[Danny Aiello, Ossie Davis, Ruby Dee, Richard ...",United States,"September 1, 2021",1989,R,120 min,"Classic Movies, Comedies, Dramas","On a sweltering day in Brooklyn, simmering rac..."
231,s232,Movie,The Water Man,David Oyelowo,"[David Oyelowo, Rosario Dawson, Lonnie Chavis,...",United States,"August 25, 2021",2021,PG,92 min,"Children & Family Movies, Dramas","Desperate to save his ailing mother, 11-year-o..."
350,s351,Movie,Space Cowboys,Clint Eastwood,"[Clint Eastwood, Tommy Lee Jones, Donald Suthe...",United States,"August 1, 2021",2000,PG-13,130 min,"Action & Adventure, Dramas, Sci-Fi & Fantasy",A retired engineer agrees to help NASA prevent...
351,s352,Movie,Team America: World Police,Trey Parker,"[Trey Parker, Matt Stone, Kristen Miller, Masa...","United States, Germany","August 1, 2021",2004,R,98 min,"Action & Adventure, Comedies, Cult Movies","In this musical satire, an all-marionette poli..."
...,...,...,...,...,...,...,...,...,...,...,...,...
8682,s8683,Movie,Vizontele Tuuba,Yılmaz Erdoğan,"[Yılmaz Erdoğan, Tarık Akan, Altan Erkekli, Ce...",Turkey,"March 10, 2017",2004,NR,106 min,"Comedies, Dramas, International Movies","With civil war looming, a TV-obsessed Turkish ..."
8708,s8709,Movie,We're No Animals,Alejandro Agresti,"[John Cusack, Paul Hipp, Kevin Morris, Alejand...","United States, Argentina","August 15, 2017",2015,TV-MA,94 min,"Comedies, Dramas, Independent Movies","Unhappy with his commercial film work, a jaded..."
8719,s8720,Movie,What a Wonderful Family!,Huang Lei,"[Huang Lei, Sun Li, Lee Li-Chun, Zhang Weixin,...",China,"July 1, 2018",2017,TV-14,102 min,"Comedies, Dramas, International Movies","In a large family living under one roof, a sto..."
8751,s8752,Movie,Wish I Was Here,Zach Braff,"[Zach Braff, Kate Hudson, Donald Faison, Joey ...",United States,"August 16, 2018",2014,R,106 min,"Comedies, Dramas, Independent Movies","With his acting career moribund, Aidan Bloom s..."


In [37]:
directors_titles = list_directors_actors.groupby('director')['title'].apply(list)
directors_titles

director
Aamir Khan                                          [Taare Zameen Par]
Adrian Murray                                              [Withdrawn]
Alan Alda                                           [The Four Seasons]
Alan Rickman                                          [A Little Chaos]
Alejandro Agresti                                   [We're No Animals]
                                           ...                        
Youssef Chahine         [Alexandria: Again and Forever, Cairo Station]
Yvan Attal                                       [They Are Everywhere]
Yılmaz Erdoğan       [Ekşi Elmalar, Neseli Hayat, Organize Isler, M...
Zach Braff                                           [Wish I Was Here]
Zoe Lister-Jones                                            [Band Aid]
Name: title, Length: 222, dtype: object

In [38]:
directors_counts = directors_titles.apply(len)

top_directors = directors_counts.sort_values(ascending=False)

top_directors.head(5)


director
Yılmaz Erdoğan    6
Omoni Oboli       6
Clint Eastwood    4
Rano Karno        3
Louis C.K.        3
Name: title, dtype: int64

In [43]:
# Print a quantiadade de diretores que dirigiram suas obras, bem como seus nomes e obras trabalhadas
print(f"Temos um total de {len(top_directors)} diretores que também trabalham como atores\n")
for director in top_directors.index:
    print(f"{director} ({top_directors[director]} obras):")
    for title in directors_titles[director]:
        print(f" - {title}")

    print(" ")


Temos um total de 222 diretores que também trabalham como atores

Yılmaz Erdoğan (6 obras):
 - Ekşi Elmalar
 - Neseli Hayat
 - Organize Isler
 - Money Trap
 - The Butterfly's Dream
 - Vizontele Tuuba
 
Omoni Oboli (6 obras):
 - Love Is War
 - Moms at War
 - Being Mrs Elliot
 - The First Lady
 - Wives on Strike
 - Wives on Strike: The Revolution
 
Clint Eastwood (4 obras):
 - Space Cowboys
 - Million Dollar Baby
 - The Outlaw Josey Wales
 - Gran Torino
 
Rano Karno (3 obras):
 - Si Doel the Movie 2
 - Si Doel the Movie 3
 - Si Doel the Movie
 
Louis C.K. (3 obras):
 - Louis C.K. 2017
 - Louis C.K.: Hilarious
 - Louis C.K.: Live at the Comedy Store
 
Sermiyan Midyat (3 obras):
 - Bir Baba Hindu
 - Hükümet Kadin
 - Hükümet Kadin 2
 
Note Chern-Yim (3 obras):
 - Holy Man 2
 - Holy Man 3
 - The Holy Man
 
Sylvester Stallone (3 obras):
 - Rocky II
 - Rocky III
 - Rocky IV
 
Kunle Afolayan (3 obras):
 - Oct-01
 - The Bridge
 - The Figurine (Araromire)
 
George Clooney (2 obras):
 - The Midnig

In [59]:
print("Os seguintes diretores aturam que também atuaram em suas obras foram:")



262


### Explore o dataset e compartilhe um insight ou número que você considere interessante.