## Season (Temporada)
--Medidas de tendencia central: Aquí, la media y mediana representan la temporada promedio. Dado que la moda sería la temporada con mayor cantidad de episodios, esto puede reflejar cambios en la cantidad de episodios producidos por temporada.

--Medidas de dispersión: La varianza y desviación estándar no son tan significativas aquí, ya que el número de temporada simplemente ordena a los episodios.
### Gráficos:
--Histograma: Muestra la cantidad de episodios por temporada, indicando si hay temporadas con más producción.

--Polígono de frecuencias: Puede revelar tendencias, como un aumento o disminución en el número de episodios a lo largo de las temporadas.

--Ojiva: Muestra la frecuencia acumulada de episodios por temporada, lo cual ayuda a observar cómo ha crecido la serie en episodios a lo largo de los años.

In [1]:
import pandas as pd
import numpy as np
import os
import matplotlib.pyplot as plt
import seaborn as sns

os.chdir(r"C:\Users\Martina\Documents\TUP\Estadistica y Probabilidad\TPI")

# Carga el archivo CSV en un dataframe de Pandas
df = pd.read_csv('data\simpsons_episodes.csv')
# Imprime el dataframe
print(df)

# Función para calcular medidas de tendencia central
def calcular_medidas_tendencia_central(serie):
    media = serie.mean()       # Media aritmética
    mediana = serie.median()   # Mediana
    moda = serie.mode()        # Moda (puede haber más de una moda)
    return media, mediana, moda

# Función para calcular medidas de dispersión
def calcular_medidas_dispersion(serie):
    rango = serie.max() - serie.min()  # Rango
    varianza = serie.var()             # Varianza
    desviacion_estandar = serie.std()  # Desviación estándar
    return rango, varianza, desviacion_estandar

      id                                          image_url  imdb_rating  \
0     10  http://static-media.fxx.com/img/FX_Networks_-_...          7.4   
1     12  http://static-media.fxx.com/img/FX_Networks_-_...          8.3   
2     14  http://static-media.fxx.com/img/FX_Networks_-_...          8.2   
3     17  http://static-media.fxx.com/img/FX_Networks_-_...          8.1   
4     19  http://static-media.fxx.com/img/FX_Networks_-_...          8.0   
..   ...                                                ...          ...   
595  500  http://static-media.fxx.com/img/FX_Networks_-_...          7.0   
596  502  http://static-media.fxx.com/img/FX_Networks_-_...          7.3   
597  511  http://static-media.fxx.com/img/FX_Networks_-_...          6.9   
598  542  http://static-media.fxx.com/img/FX_Networks_-_...          6.4   
599  548  http://static-media.fxx.com/img/FX_Networks_-_...          7.0   

     imdb_votes  number_in_season  number_in_series original_air_date  \
0        1511.

In [None]:
seasons = df['season'].dropna()

# Frecuencia absoluta: Cuenta el número de episodios por temporada
freq_abs = seasons.value_counts().sort_index()

# Frecuencia relativa: Proporción de episodios en cada temporada
freq_rel = freq_abs / len(seasons)

# Frecuencia acumulada
freq_cum = freq_abs.cumsum()

# Tabla de frecuencias
freq_table_season = pd.DataFrame({
    'Temporada': freq_abs.index,
    'Frecuencia Absoluta': freq_abs.values,
    'Frecuencia Relativa': freq_rel.values,
    'Frecuencia Acumulada': freq_cum.values
})

print(freq_table_season)

In [None]:
print("------------------------------------------")
media, mediana, moda = calcular_medidas_tendencia_central(seasons)
print(f"Medidas de tendencia central para seasons:")
print(f"  Media: {media}")
print(f"  Mediana: {mediana}")
print(f"  Moda: {moda.tolist()}\n")  # Convertimos a lista para legibilidad

In [None]:
print("------------------------------------------")
rango, varianza, desviacion_estandar = calcular_medidas_dispersion(seasons)
print(f"Medidas de dispersión para seasons:")
print(f"  Rango: {rango}")
print(f"  Varianza: {varianza}")
print(f"  Desviación Estándar: {desviacion_estandar}\n")

In [None]:
# Histograma
plt.figure(figsize=(10, 6))
plt.hist(seasons, bins=range(int(seasons.min()), int(seasons.max()) + 2), edgecolor='black', alpha=0.7, align='left')
plt.title("Histograma de Temporadas")
plt.xlabel("Temporada")
plt.ylabel("Frecuencia")
plt.xticks(range(int(seasons.min()), int(seasons.max()) + 1))  # Etiquetas para cada temporada
plt.show()

In [None]:
# Histograma
plt.figure(figsize=(10, 6))
plt.hist(seasons, bins=range(int(seasons.min()), int(seasons.max()) + 2), edgecolor='black', alpha=0.7, align='left')
plt.title("Histograma de Temporadas")
plt.xlabel("Temporada")
plt.ylabel("Frecuencia")
plt.xticks(range(int(seasons.min()), int(seasons.max()) + 1))  # Etiquetas para cada temporada
plt.show()

In [None]:
# Polígono de Frecuencias
freq_abs = seasons.value_counts().sort_index()  # Cuenta la frecuencia de cada temporada y ordena
temporadas = freq_abs.index

plt.figure(figsize=(10, 6))
plt.plot(temporadas, freq_abs, marker='o', linestyle='-', color='b')
plt.title("Polígono de Frecuencias de Temporadas")
plt.xlabel("Temporada")
plt.ylabel("Frecuencia")
plt.grid(True)
plt.xticks(temporadas)  # Etiquetas para cada temporada
plt.show()

In [None]:
# Ojiva (Frecuencia Acumulada)
freq_cum = freq_abs.cumsum()

plt.figure(figsize=(10, 6))
plt.plot(temporadas, freq_cum, marker='o', linestyle='-', color='g')
plt.title("Ojiva de Temporadas")
plt.xlabel("Temporada")
plt.ylabel("Frecuencia Acumulada")
plt.grid(True)
plt.xticks(temporadas)  # Etiquetas para cada temporada
plt.show()