In [3]:
# Código para Google Colab
# Visualización de denuncias CNTV por canal y por tema

import pandas as pd
import altair as alt

# Subir archivo desde el equipo
from google.colab import files
uploaded = files.upload()

# Cargar el archivo Excel (debes subirlo cuando se ejecute esta celda)
df = pd.read_excel(next(iter(uploaded)))

# Renombrar columnas clave
df = df.rename(columns={
    'CANAL / CABLE ESTANDARIZADO': 'Canal',
    'Nº Denuncias': 'Denuncias',
    'Contenidos Denunciados': 'Contenido',
    'AÑO ': 'Año'
})

# Limpiar nulos y pasar a minúscula
df['Contenido'] = df['Contenido'].fillna('').str.lower()

# Filtrar solo canales específicos
canales_permitidos = ['TVN', 'CHILEVISIÓN', 'CANAL 13', 'MEGA', 'LA RED']
df = df[df['Canal'].str.upper().isin(canales_permitidos)]

# Clasificación temática

def clasificar_tema(texto):
    if any(p in texto for p in ['violencia', 'agresión', 'agresivo', 'golpe', 'maltrato', 'amenaza', 'ataque', 'abuso']):
        return 'Violencia, Agresión y Conductas Inapropiadas'
    elif any(p in texto for p in ['dignidad', 'intimidad', 'vida privada', 'exposición indebida', 'humillación']):
        return 'Dignidad / Intimidad / Vida Privada'
    elif any(p in texto for p in ['sexual', 'desnudo', 'vulgar', 'lenguaje soez', 'contenido sexual']):
        return 'Contenido Sexual / Lenguaje Vulgar'
    elif any(p in texto for p in ['manipulación', 'sesgo', 'desinformación', 'falta de pluralismo', 'falsedad']):
        return 'Desinformación / Sesgo / Falta de Pluralismo / Manipulación'
    elif any(p in texto for p in ['niño', 'niñez', 'menor', 'horario de protección', 'infantil']):
        return 'Niñez / Horario de Protección'
    else:
        return 'Otro'

# Aplicar clasificación
df['Tema Clasificado'] = df['Contenido'].apply(clasificar_tema)

# Agrupar por Canal y Tema
agg_df = df.groupby(['Canal', 'Tema Clasificado'])['Denuncias'].sum().reset_index()

# Visualización con Altair
chart = alt.Chart(agg_df).mark_bar().encode(
    x=alt.X('sum(Denuncias):Q', title='Total de Denuncias'),
    y=alt.Y('Canal:N', sort='-x', title='Canal'),
    color=alt.Color('Tema Clasificado:N', title='Tema')
).properties(
    width=800,
    height=500,
    title='Cantidad de denuncias por canal y tema (canales seleccionados)'
)

chart


Saving Denuncias_Clasificadas_Personajes.xlsx to Denuncias_Clasificadas_Personajes (2).xlsx
