# Exploratory Data Analysis - Pitchfork Reviews

### 📌 1. Importar librerías

In [None]:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from sqlalchemy import create_engine
from dotenv import load_dotenv
import os

### 📌 2. Cargar las variables de entorno

In [None]:
load_dotenv()

DATABASE_URL = os.getenv('DB_URL')

### 📌 3. Cargar datos desde PostgreSQL

In [None]:
engine = create_engine(DATABASE_URL)
query = 'SELECT * FROM pitchfork_reviews;'
df = pd.read_sql(query, engine)

### 📌 4. Verificación de los primeros registros

In [None]:
df.head()

### 📌 5. Limpieza de datos

In [None]:
print(df.isnull().sum())

df.dropna(inplace=True)

### 📌 6. Análisis descriptivo

In [None]:
df.describe()

## 📌 7. Visualización de la distribución de puntuaciones

In [None]:
plt.figure(figsize=(8,6))
sns.histplot(df['score'], kde=True, bins=20)
plt.title('Distribución de Puntuaciones de Pitchfork')
plt.xlabel('Puntuación')
plt.ylabel('Frecuencia')
plt.show()

### 📌 8. Visualización de los géneros musicales

In [None]:
plt.figure(figsize=(10,6))
genre_count = df['genre'].value_counts()
genre_count.plot(kind='bar')
plt.title('Cantidad de Reviews por Género Musical')
plt.xlabel('Género')
plt.ylabel('Cantidad de Reviews')
plt.xticks(rotation=45)
plt.show()