![](https://static.wixstatic.com/media/060b97_2092cc6b8dfe4bb8b88c2081146e7fc7~mv2.jpg/v1/fill/w_863,h_399,al_c,q_80/Tv%20Show%20Banner.webp)

Na atualidade, com diversas plataformas de streaming e muito conteúdo sendo produzido, ficamos perdidos em escolher qual plataforma assinar ou quais plataformas possuem as melhores séries pra se assistir. Com essa análise podemos visualizar e analisar quais plataformas possuem mais e melhores séries.

Para isso é necessário importar as bibliotecas que utilizaremos e o arquivo que contem o dataset que foi encontrado no Kaggle: https://www.kaggle.com/ruchi798/tv-shows-on-netflix-prime-video-hulu-and-disney

In [None]:
import seaborn as sns
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np


#Importando potly
import plotly
import plotly.offline as py

# habilita o modo offline
from plotly.offline import plot
from plotly.offline import iplot
plotly.offline.init_notebook_mode(connected=True)

import plotly.graph_objs as go
import plotly.express as px

import warnings
warnings.filterwarnings('ignore')

In [None]:
filename = "../input/tv-shows-on-netflix-prime-video-hulu-and-disney/tv_shows.csv"
df = pd.read_csv(filename)

In [None]:
df.head()

**Features**

**Age**: is the process of giving age ratings and content advice to films and other audiovisual content to help children and families choose what’s right for them and avoid what’s not.

**IMDb**: is an online database of information related to films, television programs, home videos, video games, and streaming content online – including cast, production crew and personal biographies, plot summaries, trivia, ratings, and fan and critical reviews. 

**Rotten Tomatoes**: is an American review-aggregation website for film and television.


**Netflix**: is a streaming service that allows our members to watch a wide variety of award-winning TV shows, movies, documentaries, and more on thousands of internet-connected devices.

**Hulu**: Hulu is the leading premium streaming service offering live and on-demand TV and movies, with and without commercials, both in and outside the home. 

**Prime Video**: is a video streaming service available for Amazon Prime members. With an eligible Amazon Prime membership, you have access to thousands of Prime Video titles at no additional cost.


**Disney+**: is the exclusive home for your favorite movies and TV shows from Disney, Pixar, Marvel, Star Wars, and National Geographic.

In [None]:
df.isnull().sum()

**Conferindo alguns insights com a plataforma de avaliação IMDb**

Os 15 titulos de séries melhores avaliados.

In [None]:
df_imdb = df.sort_values(by='IMDb', ascending=False)
print(df_imdb[['Title','Year','IMDb','Age']].head(15))

In [None]:
plt.subplots(figsize=(10,8))
sns.barplot(x="IMDb", y="Title" , data= df_imdb.head(20))

Verificando a disposição das notas do IMDb

In [None]:
sns.kdeplot(data=df['IMDb'])

Para descobrir a quantidade de séries por notas é necessário agrupar as colunas pelas notas do IMDb e soma-las.

In [None]:
imdb = df[['IMDb','Age','Netflix','Hulu','Prime Video', 'Disney+']].groupby(by='IMDb').sum().reset_index()
imdb['total_rate']= imdb[['Netflix','Hulu','Prime Video', 'Disney+']].sum(axis=1)

In [None]:
trace1= go.Scatter(x=imdb['IMDb'],
                y=imdb['total_rate'],
                mode='lines+markers'
                
                )

layout = go.Layout(title='Total Rate IMDB',
                xaxis_rangeslider_visible=True)
fig = go.Figure(trace1,layout)

fig.show()

In [None]:

#IMDB por plataforma
trace1= go.Scatter(x=imdb['IMDb'],
                y=imdb['Netflix'],
                mode='lines+markers',
                name = "Netflix",
                )

trace2= go.Scatter(x=imdb['IMDb'],
                y=imdb['Hulu'],
                mode='lines+markers',
                name = "Hulu",
                )

trace3= go.Scatter(x=imdb['IMDb'],
                y=imdb['Prime Video'],
                mode='lines+markers',
                name = "Prime Video",
                )

trace4= go.Scatter(x=imdb['IMDb'],
                y=imdb['Disney+'],
                mode='lines+markers',
                name = "Disney+",
                )

layout = go.Layout(title='Total Rate IMDB',
                xaxis_rangeslider_visible=True)

data = [trace1,trace2,trace3,trace4]

py.iplot(data)

Na atualidade encontramos diversas plataformas de streaming que oferecem séries, abaixo podemos conferir a quantidade de itens disponiveis por plataforma.

In [None]:
#Quantidade TV SHOWS por Plataforma

df_sum = df.sum()
df_sum = df_sum['Netflix':'Disney+']
print(df_sum)

In [None]:
trace1 = go.Bar(x=df_sum.values, 
                y=df_sum.index, 
                orientation='h',
                text=df_sum.values,
                textposition='auto'
                
               
               )
x = [trace1]

layout = go.Layout(title="Quantidade TV SHOWS por Plataforma",
                   yaxis={'title':'Plataforma'},
                   xaxis={'title': 'Quantidade'})

fig = go.Figure(x, layout=layout)
fig.show()

A faixa etária é importante pois com ela os conteúdos são classificados de acordo com a idade que podem ser assistidos, assim melhorando o acompanhamento dos pais a respeito do que seus filhos estão vendo ou podem ver.

Abaixo realizamos a soma por idade de cada uma dessas plataformas.

In [None]:
df_age = df[['Age','Netflix','Hulu','Prime Video', 'Disney+']].groupby(by='Age').sum().reset_index()
df_age['total_age']= df_age[['Netflix','Hulu','Prime Video', 'Disney+']].sum(axis=1)

In [None]:
trace1= go.Bar(x=df_age['Age'],
               y=df_age['total_age'],
               text=df_age['total_age'],
               textposition='auto'
               )

layout= go.Layout(title='Quantidade Total por Classificação etaria',
                  xaxis={'title':'Classificação etária'},
                  yaxis={'title': 'Quantidade'}
                 
                  )

fig = go.Figure(trace1, layout)
fig.show()

In [None]:
#Faixa etária Netflix
trace1= go.Bar(x=df_age['Age'],
               y=df_age['Netflix'],
               text=df_age['Netflix'],
               textposition='auto')

layout = go.Layout(title='Faixa etária Netflix',
                   xaxis={'title':'Faixa etária'},
                   yaxis={'title':'Quantidade'}
                          )

fig = go.Figure(trace1,layout)
fig.show()

In [None]:
#Faixa etária Hulu
trace1= go.Bar(x=df_age['Age'],
               y=df_age['Hulu'],
               text=df_age['Hulu'],
               textposition='auto')

layout = go.Layout(title='Faixa etária Hulu',
                   xaxis={'title':'Faixa etária'},
                   yaxis={'title':'Quantidade'}
                          )

fig = go.Figure(trace1,layout)
fig.show()

In [None]:
#Faixa etária Hulu
trace1= go.Bar(x=df_age['Age'],
               y=df_age['Prime Video'],
               text=df_age['Prime Video'],
               textposition='auto')

layout = go.Layout(title='Faixa etária Prime Video',
                   xaxis={'title':'Faixa etária'},
                   yaxis={'title':'Quantidade'}
                          )

fig = go.Figure(trace1,layout)
fig.show()

In [None]:
#Faixa etária Disney+
trace1= go.Bar(x=df_age['Age'],
               y=df_age['Disney+'],
               text=df_age['Disney+'],
               textposition='auto')

layout = go.Layout(title='Faixa etária Disney+',
                   xaxis={'title':'Faixa etária'},
                   yaxis={'title':'Quantidade'}
                          )

fig = go.Figure(trace1,layout)
fig.show()

Abaixo realizo a soma total de titulos disponiveis por ano

In [None]:
df_year = df[['Year','Age','Netflix','Hulu','Prime Video', 'Disney+']].groupby(by='Year').sum().reset_index()
df_year['total_year']= df_year[['Netflix','Hulu','Prime Video', 'Disney+']].sum(axis=1)

In [None]:
trace1= go.Scatter(x=df_year['Year'],
                y=df_year['total_year'],
                mode='lines+markers'
                
                )

layout = go.Layout(title='Quantidade total por Ano',
                xaxis_rangeslider_visible=True)
fig = go.Figure(trace1,layout)

fig.show()