# ANÁLISE TOP 10 DOS PRODUTOS DA NETFLIX

## Helder C. Silva



## 1. Introdução


A Netflix( https://www.netflix.com/br/) é um serviço de tramissão online que oferece uma ampla variedade de séries, filmes e documentários premiados em milhares de aparelhos conectados à internet, apresentando um atendimento versátil pois é possível assistir aonde e quando quisermos.

A base de dados a ser analisada é formada por aquivos CSV que foram obtidos através do Kaggle: (https://www.kaggle.com/datasets/prasertk/netflix-daily-top-10-in-us?select=netflix+daily+top+10.csv) que usou o site (https://www.the-numbers.com/netflix-top-10) e possui apróximadamente 7.100 registros e um tamannho em disco de 456,09 kB; o que possibilita a fácil exploração dessas informações em qualquer computador comum e pessoal.

O estudo tem por objetivo realizar análise exploratória, apresentando os títulos que estão como top 10 da Netflix, trazendo insights relevantes e surpreendentes. 


## 1.1 Apresentação dos Dados

A base explorada contém os seguintes campos, colunas: 

* **As of**: Levantamento realizar a partir da data;
* **Rank**: Classificação;
* **Year to Data Rank**: Ano para classificação dos dados;
* **Last Week Rank**: Classifcação da semana passada;
* **Title**: Título;
* **Type**: Modelo;
* **Netflix Exclusive**: Exclusivo Netflix;
* **Netflix Release Date**: Data de lançamento da Netflix;
* **Days In Top 10**: Dias no Top 10;
* **Viewership Score**: Pontuação de audiência.



In [1]:
import pandas as pd
import datetime as dt

In [2]:
# Carregando a base de dados

netflix = pd.read_csv("netflix10.csv")

FileNotFoundError: [Errno 2] No such file or directory: 'netflix10.csv'

## 1.2 Visualização da base 

In [None]:
# Visualizar as 5 primeiras e 5 últimas linhas da nossa base
display(netflix)

## 1.3 Verificar valores nulos

In [None]:
netflix.isnull().sum()

## 1.4 Tipo dos dados

In [None]:
netflix.dtypes

## 2. Período no qual foi feito o levantamento dos dados

In [None]:
inicio = pd.to_datetime(netflix['As of']).dt.date.min()
print(inicio)

In [None]:
fim = pd.to_datetime(netflix['As of']).dt.date.max()
print(fim)

## 2.1 Alisando as informações estatísticas

In [None]:
netflix.describe()

## 2.2 Entendo melhor as informações acima

In [None]:
netflix.plot(kind='box', figsize=(10,6),subplots=True);

Os dados no **Rank** vai de 1 até 10, ou seja, os dados estão distrubuídos pois todos os dias terão filmes classificados. 

In [None]:
netflix[netflix[ 'Days In Top 10']>=80]

Por curiosidade verifiquei que o título '**CoComelon**' aparece mais 80 dias no em top 10. Inclusive realizei uma pesquisa no qual soube que se trata de uma série infantil, musical e educativa. 

## 2.3 Analisando com mais detalhes algumas informações

In [None]:
# Apresentar quantas vezes cada título na base
netflix.Title.value_counts()

Um dos insights é que **'CoComelon'** que é uma seríe foi um dos melhores investimentos que a Netflix realizou, pois o mesmo aparece em nossa base de dados por um período 428 dias no top 10 de **'Ozark'** e **Cobra Kai'**. 

In [None]:
# Lavantamento dos tipos de conteúdos que constam no top 10
netflix.Type.value_counts().plot(kind='bar');

Através do gráfico é possível identificar que o tipo de conteúdo que são mais acessados, assistidos são filmes ou séries, entre outros. Contudo a maioria dos títulos registrados no top 10 são **TV show**(séries) e depois **Move**(filmes).

In [None]:
# Pontuação audiência
netflix['Viewership Score'].hist();

Nesse momento fui através da orientação em relação à essa coluna **'Viewership Score'**, no qual representa que à audiência é uma pontuação atribuída a cada programa com base em sua classificação diária histórica, destinando 10 pontos para o título que aparece na 1ª posição e 9 pontos para o que segue na 2ª posição. Observando também que os filmes ficam pouco tempo no rank, até mesmo por outros lançamentos de filmes que são feitos diariamente. 

In [None]:
# Resultado do que mais ganhou ponto em relação à audiência
netflix[netflix['Viewership Score'] == netflix['Viewership Score'].max()]

Nesse caso o **CoComelon** ficou com a maior pontuação, pois o mesmo permaneceu muitos dias no top 10, trazendo assim um índice de audiência destaque. 

## 3. Conclusão

Conclui-se através da análise exploratória realizada primeiramente o quão é relevante esse tipo de estudo, pois nos mostra que para de fato criar estratégias cada vez mais assertivas devemos observar os dados, "ouvi-lós". Tendo em vista que antes dessa verificação pensava que em uma lista de top 10 da Netflix seria composta em grande parte por títulos famosos e mais comentados inclusive nas redes sociais. Contudo os dados trouxeram uma visão fora do senso comum no qual o **CoComelon** ficou no topo do rank por muitos dias, ou seja, acredito que é um insight relavante pra tomada de decisões, definição de investimentos, oferta e otimização de custos,uma vez que apresentamos a "voz" do cliente através dos dados. 