In [1]:
# Librerías.
import pandas as pd
import Funciones as f
import unidecode

In [None]:
%%capture
# Ejecutar notebooks anteriores.
%run "18. Columnas de CO y CT.ipynb"

In [3]:
# Definir los ítems progresistas y conservadores.
Items_Progresistas = [5, 6, 9, 11, 16, 20, 24, 25, 27, 28]
Items_Conservadores = [3, 4, 7, 8, 10, 19, 22, 23, 29, 30]

In [4]:
# Crear listas de columnas para cambios de opinión progresistas.
Columnas_CO_Pro = [f'CO_Item_{Item}_Izq' for Item in Items_Progresistas] + \
                  [f'CO_Item_{Item}_Der' for Item in Items_Progresistas]

Columnas_CO_Pro_Izq = [f'CO_Item_{Item}_Izq' for Item in Items_Progresistas]

Columnas_CO_Pro_Der = [f'CO_Item_{Item}_Der' for Item in Items_Progresistas]

In [5]:
# Crear listas de columnas para cambios de opinión conservadores.
Columnas_CO_Con = [f'CO_Item_{Item}_Izq' for Item in Items_Conservadores] + \
                  [f'CO_Item_{Item}_Der' for Item in Items_Conservadores]

Columnas_CO_Con_Izq = [f'CO_Item_{Item}_Izq' for Item in Items_Conservadores]

Columnas_CO_Con_Der = [f'CO_Item_{Item}_Der' for Item in Items_Conservadores]

In [6]:
# Crear listas de columnas para cambios de tiempo progresistas.
Columnas_CT_Pro = [f'CT_Item_{Item}_Izq' for Item in Items_Progresistas] + \
                  [f'CT_Item_{Item}_Der' for Item in Items_Progresistas]

Columnas_CT_Pro_Izq = [f'CT_Item_{Item}_Izq' for Item in Items_Progresistas]

Columnas_CT_Pro_Der = [f'CT_Item_{Item}_Der' for Item in Items_Progresistas]

In [7]:
# Crear listas de columnas para cambios de tiempo conservadores.
Columnas_CT_Con = [f'CT_Item_{Item}_Izq' for Item in Items_Conservadores] + \
                  [f'CT_Item_{Item}_Der' for Item in Items_Conservadores]

Columnas_CT_Con_Izq = [f'CT_Item_{Item}_Izq' for Item in Items_Conservadores]

Columnas_CT_Con_Der = [f'CT_Item_{Item}_Der' for Item in Items_Conservadores]

In [8]:
# Crear columnas de CO promedios.
for Nombre_Df, df in dfs_Finales.items():
      
   # Calcular promedios de cambios de opinión.
   df['CO_Pro'] = df[Columnas_CO_Pro].mean(axis=1)
   df['CO_Pro_Izq'] = df[Columnas_CO_Pro_Izq].mean(axis=1)
   df['CO_Pro_Der'] = df[Columnas_CO_Pro_Der].mean(axis=1)
   df['CO_Con'] = df[Columnas_CO_Con].mean(axis=1)
   df['CO_Con_Izq'] = df[Columnas_CO_Con_Izq].mean(axis=1)
   df['CO_Con_Der'] = df[Columnas_CO_Con_Der].mean(axis=1)

In [9]:
# Crear columnas de CT promedios.
for Nombre_Df, df in dfs_Finales.items():
   
   # Calcular promedios de cambios de tiempo.
   df['CT_Pro'] = df[Columnas_CT_Pro].mean(axis=1)
   df['CT_Pro_Izq'] = df[Columnas_CT_Pro_Izq].mean(axis=1)
   df['CT_Pro_Der'] = df[Columnas_CT_Pro_Der].mean(axis=1)
   df['CT_Con'] = df[Columnas_CT_Con].mean(axis=1)
   df['CT_Con_Izq'] = df[Columnas_CT_Con_Izq].mean(axis=1)
   df['CT_Con_Der'] = df[Columnas_CT_Con_Der].mean(axis=1)

In [None]:
import pandas as pd
from typing import Dict, List


def Verificar_Cambio_Opinion_Manual(
    Diccionario_Dfs: Dict[str, pd.DataFrame],
    Numero_Sujetos: int = 3,
    Semilla_Aleatoria: int = 42
) -> None:

    """
    
    Verifica manualmente que las columnas de cambio de opinión
    (CO_Item_<Num>_Izq y CO_Item_<Num>_Der) estén bien calculadas
    para una muestra aleatoria de sujetos.

    Parámetros:
    - Diccionario_Dfs: Diccionario con los DataFrames a controlar.
    - Numero_Sujetos: Cantidad de sujetos a muestrear.
    - Semilla_Aleatoria: Semilla para reproducibilidad del muestreo.

    Ejemplo:
        >>> Verificar_Cambio_Opinion_Manual(dfs_Finales, 5, 123)
    
    """

    Items_IP: List[int] = [
        3, 4, 5, 6, 7, 8, 9, 10, 11,
        16, 19, 20, 22, 23, 24, 25,
        27, 28, 29, 30
    ]

    for Nombre_Df, Df in Diccionario_Dfs.items():
        print("\n" + "=" * 60)
        print(f"CONTROL MANUAL DE CAMBIO DE OPINIÓN - {Nombre_Df}")
        print("=" * 60)

        # Verificar existencia de columnas CO
        Columnas_Faltantes: List[str] = []
        for Num in Items_IP:
            Col_Izq = f"CO_Item_{Num}_Izq"
            Col_Der = f"CO_Item_{Num}_Der"
            if Col_Izq not in Df.columns:
                Columnas_Faltantes.append(Col_Izq)
            if Col_Der not in Df.columns:
                Columnas_Faltantes.append(Col_Der)
        if Columnas_Faltantes:
            print("❌ Columnas CO faltantes:")
            for Columna in Columnas_Faltantes:
                print(f"   - {Columna}")
            continue
        else:
            print("✅ Todas las columnas CO están presentes.")

        # Verificar existencia de columna ID
        if "ID" not in Df.columns:
            print("❌ Columna 'ID' no encontrada.")
            continue

        # Muestra aleatoria de IDs
        Lista_Ids: List = (
            pd.Series(Df["ID"].dropna().unique())
            .sample(
                n = min(Numero_Sujetos, Df["ID"].nunique()),
                random_state = Semilla_Aleatoria
            )
            .tolist()
        )

        # Chequeo manual de cada sujeto en la muestra
        for Subject_ID in Lista_Ids:
            Fila = Df.loc[Df["ID"] == Subject_ID].iloc[0]
            print(f"\n📋 Sujeto ID={Subject_ID}")
            for Num in Items_IP:
                # Columnas base y con candidato para respuesta
                Col_Base = f"IP_Item_{Num}_Respuesta"
                Col_Izq = f"IP_Item_{Num}_Izq_Respuesta"
                Col_CO_Izq = f"CO_Item_{Num}_Izq"
                Col_Der = f"IP_Item_{Num}_Der_Respuesta"
                Col_CO_Der = f"CO_Item_{Num}_Der"

                if all(C in Df.columns for C in [Col_Base, Col_Izq, Col_CO_Izq]):
                    Valor_Base = pd.to_numeric(Fila[Col_Base], errors="coerce")
                    Valor_Lado = pd.to_numeric(Fila[Col_Izq], errors="coerce")
                    Valor_CO = pd.to_numeric(Fila[Col_CO_Izq], errors="coerce")
                    CO_Esperado = Valor_Lado - Valor_Base
                    if pd.isna(CO_Esperado) and pd.isna(Valor_CO):
                        print(f"   ✅ Item {Num}_Izq: NaN == NaN")
                    elif Valor_CO == CO_Esperado:
                        print(f"   ✅ Item {Num}_Izq: {Valor_CO:.2f} == {CO_Esperado:.2f}")
                    else:
                        print(f"   ❌ Item {Num}_Izq: {Valor_CO:.2f} != {CO_Esperado:.2f}")

                if all(C in Df.columns for C in [Col_Base, Col_Der, Col_CO_Der]):
                    Valor_Base = pd.to_numeric(Fila[Col_Base], errors="coerce")
                    Valor_Lado = pd.to_numeric(Fila[Col_Der], errors="coerce")
                    Valor_CO = pd.to_numeric(Fila[Col_CO_Der], errors="coerce")
                    CO_Esperado = Valor_Lado - Valor_Base
                    if pd.isna(CO_Esperado) and pd.isna(Valor_CO):
                        print(f"   ✅ Item {Num}_Der: NaN == NaN")
                    elif Valor_CO == CO_Esperado:
                        print(f"   ✅ Item {Num}_Der: {Valor_CO:.2f} == {CO_Esperado:.2f}")
                    else:
                        print(f"   ❌ Item {Num}_Der: {Valor_CO:.2f} != {CO_Esperado:.2f}")


def Main() -> None:

    """
    
    Ejecuta el control manual de cambio de opinión
    para los DataFrames en dfs_Finales.
    
    """

    if "dfs_Finales" not in globals():
        print("❌ 'dfs_Finales' no encontrado.")
        return

    Verificar_Cambio_Opinion_Manual(
        Diccionario_Dfs = globals()["dfs_Finales"],
        Numero_Sujetos = 3,
        Semilla_Aleatoria = 42
    )


if __name__ == "__main__":
    Main()


In [None]:
import pandas as pd
from typing import Dict, List


def Verificar_Promedios_CO_Manual(
    Diccionario_Dfs: Dict[str, pd.DataFrame],
    Numero_Sujetos: int = 3,
    Semilla_Aleatoria: int = 42
) -> None:

    """
    
    Control manual aleatorio de los promedios de cambio de opinión:
    CO_Pro, CO_Pro_Izq, CO_Pro_Der, CO_Con, CO_Con_Izq, CO_Con_Der.

    Para cada sujeto muestra el valor en el DataFrame y el cálculo
    esperado a partir de las columnas individuales CO_Item_<n>_Izq/Der.

    Parámetros:
    - Diccionario_Dfs: dict con los DataFrames a controlar.
    - Numero_Sujetos: cuántos sujetos muestrear.
    - Semilla_Aleatoria: semilla para reproducibilidad.

    """

    # Definición de ítems progresistas y conservadores.
    Items_Progresistas = [5, 6, 9, 11, 16, 20, 24, 25, 27, 28]
    Items_Conservadores = [3, 4, 7, 8, 10, 19, 22, 23, 29, 30]

    Agregados = [
        ('Pro', Items_Progresistas),
        ('Con', Items_Conservadores)
    ]

    for Nombre_Df, df in Diccionario_Dfs.items():
        print("\n" + "="*60)
        print(f"VALIDACIÓN PROMEDIOS CO - {Nombre_Df}")
        print("="*60)

        # Verificar columnas agregadas existen.
        AgCols = [
            'CO_Pro', 'CO_Pro_Izq', 'CO_Pro_Der',
            'CO_Con', 'CO_Con_Izq', 'CO_Con_Der'
        ]
        Faltantes = [c for c in AgCols if c not in df.columns]
        if Faltantes:
            print("❌ Columnas agregadas faltantes:")
            for c in Faltantes:
                print(f"   - {c}")
            continue
        else:
            print("✅ Todas las columnas CO agregadas están presentes.")

        # Verificar ID.
        if 'ID' not in df.columns:
            print("❌ Columna 'ID' no encontrada.")
            continue

        # Muestra aleatoria de sujetos.
        Ids = pd.Series(df['ID'].dropna().unique()).sample(
            n = min(Numero_Sujetos, df['ID'].nunique()),
            random_state = Semilla_Aleatoria
        ).tolist()

        for Subject_ID in Ids:
            fila = df.loc[df['ID'] == Subject_ID].iloc[0]
            print(f"\n📋 Sujeto ID = {Subject_ID}")

            # Para cada agregado (Pro y Con).
            for Prefijo, Items in Agregados:
                # Construir listas de columnas individuales.
                cols_izq = [f'CO_Item_{i}_Izq' for i in Items]
                cols_der = [f'CO_Item_{i}_Der' for i in Items]
                cols_all = cols_izq + cols_der

                # Cálculo esperado ignorando NaN.
                vals_izq = pd.to_numeric(
                    fila[cols_izq], errors='coerce'
                )
                vals_der = pd.to_numeric(
                    fila[cols_der], errors='coerce'
                )
                esperado_izq = vals_izq.mean()
                esperado_der = vals_der.mean()
                esperado_all = pd.concat(
                    [vals_izq, vals_der]
                ).mean()

                # Valores en el DataFrame.
                val_izq = fila[f'CO_{Prefijo}_Izq']
                val_der = fila[f'CO_{Prefijo}_Der']
                val_all = fila[f'CO_{Prefijo}']

                # Comparar con tolerancia.
                tol = 1e-6
                def igual(a, b):
                    if pd.isna(a) and pd.isna(b):
                        return True
                    return abs(a - b) < tol

                # Reporte Izq.
                if igual(val_izq, esperado_izq):
                    print(f"   ✅ CO_{Prefijo}_Izq: {val_izq:.4f}")
                else:
                    print(f"   ❌ CO_{Prefijo}_Izq: DF={val_izq:.4f} vs Esperado={esperado_izq:.4f}")

                # Reporte Der.
                if igual(val_der, esperado_der):
                    print(f"   ✅ CO_{Prefijo}_Der: {val_der:.4f}")
                else:
                    print(f"   ❌ CO_{Prefijo}_Der: DF={val_der:.4f} vs Esperado={esperado_der:.4f}")

                # Reporte All.
                if igual(val_all, esperado_all):
                    print(f"   ✅ CO_{Prefijo}: {val_all:.4f}")
                else:
                    print(f"   ❌ CO_{Prefijo}: DF={val_all:.4f} vs Esperado={esperado_all:.4f}")


def Main() -> None:

    """
    
    Ejecuta validación manual aleatoria de promedios CO
    para los DataFrames en dfs_Finales.
    
    """

    if 'dfs_Finales' not in globals():
        print("❌ 'dfs_Finales' no encontrado.")
        return

    Verificar_Promedios_CO_Manual(
        Diccionario_Dfs = globals()['dfs_Finales'],
        Numero_Sujetos = 3,
        Semilla_Aleatoria = 42
    )


if __name__ == "__main__":
    Main()


In [None]:
import pandas as pd
from typing import Dict, List


def Verificar_Cambio_Tiempo_Manual(
    Diccionario_Dfs: Dict[str, pd.DataFrame],
    Numero_Sujetos: int = 3,
    Semilla_Aleatoria: int = 42
) -> None:

    """
    
    Verifica manualmente que las columnas de cambio de tiempo
    (CT_Item_<n>_Izq y CT_Item_<n>_Der) estén bien calculadas
    para una muestra aleatoria de sujetos.

    Parámetros:
    - Diccionario_Dfs: dict[str, pd.DataFrame] con los DataFrames.
    - Numero_Sujetos: int de sujetos a muestrear.
    - Semilla_Aleatoria: int para reproducibilidad.

    Retorna:
    - None: imprime resultados de la verificación.
    
    """

    Items_IP: List[int] = [
        3, 4, 5, 6, 7, 8, 9, 10, 11,
        16, 19, 20, 22, 23, 24, 25,
        27, 28, 29, 30
    ]
    Lados: List[str] = ['Izq', 'Der']

    for Nombre_Df, Data_Frame in Diccionario_Dfs.items():
        print("\n" + "=" * 60)
        print(f"CONTROL MANUAL TIEMPO - {Nombre_Df}")
        print("=" * 60)

        if 'ID' not in Data_Frame.columns:
            print("❌ Columna 'ID' no encontrada.")
            continue

        Lista_Ids: List = (
            pd.Series(Data_Frame['ID'].dropna().unique())
            .sample(n = min(Numero_Sujetos,
                            Data_Frame['ID'].nunique()),
                    random_state = Semilla_Aleatoria)
            .tolist()
        )

        for Subject_Id in Lista_Ids:
            Fila = Data_Frame.loc[
                Data_Frame['ID'] == Subject_Id
            ].iloc[0]
            print(f"\n📋 Sujeto ID={Subject_Id}")

            for Num in Items_IP:
                for Lado in Lados:
                    Col_Base = f"IP_Item_{Num}_Tiempo"
                    Col_Lado = f"IP_Item_{Num}_{Lado}_Tiempo"
                    Col_CT = f"CT_Item_{Num}_{Lado}"

                    if {Col_Base, Col_Lado, Col_CT}.issubset(
                        Data_Frame.columns
                    ):
                        Valor_Base = pd.to_numeric(
                            Fila[Col_Base], errors='coerce'
                        )
                        Valor_Lado = pd.to_numeric(
                            Fila[Col_Lado], errors='coerce'
                        )
                        Valor_CT = pd.to_numeric(
                            Fila[Col_CT], errors='coerce'
                        )
                        CT_Esperado = Valor_Lado - Valor_Base

                        if pd.isna(CT_Esperado) and pd.isna(Valor_CT):
                            print(f"   ✅ Item {Num}_{Lado}: "
                                  "NaN == NaN")
                        elif Valor_CT == CT_Esperado:
                            print(f"   ✅ Item {Num}_{Lado}: "
                                  f"{Valor_CT:.2f} == "
                                  f"{CT_Esperado:.2f}")
                        else:
                            print(f"   ❌ Item {Num}_{Lado}: "
                                  f"{Valor_CT:.2f} != "
                                  f"{CT_Esperado:.2f}")


def Verificar_Promedios_CT_Manual(
    Diccionario_Dfs: Dict[str, pd.DataFrame],
    Numero_Sujetos: int = 3,
    Semilla_Aleatoria: int = 42
) -> None:

    """
    
    Control manual aleatorio de promedios de cambio de tiempo:
    CT_Pro, CT_Pro_Izq, CT_Pro_Der, CT_Con, CT_Con_Izq, CT_Con_Der.

    Parámetros:
    - Diccionario_Dfs: dict[str, pd.DataFrame] con los DataFrames.
    - Numero_Sujetos: int de sujetos a muestrear.
    - Semilla_Aleatoria: int para reproducibilidad.

    Retorna:
    - None: imprime resultados de la verificación.
    
    """

    Items_Progresistas = [5, 6, 9, 11, 16, 20, 24, 25, 27, 28]
    Items_Conservadores = [3, 4, 7, 8, 10, 19, 22, 23, 29, 30]

    Agregados = [
        ('Pro', Items_Progresistas),
        ('Con', Items_Conservadores)
    ]

    for Nombre_Df, df in Diccionario_Dfs.items():
        print("\n" + "=" * 60)
        print(f"VALIDACIÓN PROMEDIOS CT - {Nombre_Df}")
        print("=" * 60)

        if 'ID' not in df.columns:
            print("❌ Columna 'ID' no encontrada.")
            continue

        Ids = pd.Series(df['ID'].dropna().unique()).sample(
            n = min(Numero_Sujetos, df['ID'].nunique()),
            random_state = Semilla_Aleatoria
        ).tolist()

        for Subject_Id in Ids:
            fila = df.loc[df['ID'] == Subject_Id].iloc[0]
            print(f"\n📋 Sujeto ID={Subject_Id}")

            for Prefijo, Items in Agregados:
                cols_izq = [
                    f"CT_Item_{i}_Izq" for i in Items
                ]
                cols_der = [
                    f"CT_Item_{i}_Der" for i in Items
                ]

                vals_izq = pd.to_numeric(
                    fila[cols_izq], errors='coerce'
                )
                vals_der = pd.to_numeric(
                    fila[cols_der], errors='coerce'
                )
                esperado_izq = vals_izq.mean()
                esperado_der = vals_der.mean()
                esperado_all = pd.concat(
                    [vals_izq, vals_der]
                ).mean()

                val_izq = fila[f"CT_{Prefijo}_Izq"]
                val_der = fila[f"CT_{Prefijo}_Der"]
                val_all = fila[f"CT_{Prefijo}"]

                tol = 1e-6
                def Igual(a: float, b: float) -> bool:
                    if pd.isna(a) and pd.isna(b):
                        return True
                    return abs(a - b) < tol

                if Igual(val_izq, esperado_izq):
                    print(f"   ✅ CT_{Prefijo}_Izq: {val_izq:.4f}")
                else:
                    print(f"   ❌ CT_{Prefijo}_Izq: DF={val_izq:.4f} vs "
                          f"{esperado_izq:.4f}")

                if Igual(val_der, esperado_der):
                    print(f"   ✅ CT_{Prefijo}_Der: {val_der:.4f}")
                else:
                    print(f"   ❌ CT_{Prefijo}_Der: DF={val_der:.4f} vs "
                          f"{esperado_der:.4f}")

                if Igual(val_all, esperado_all):
                    print(f"   ✅ CT_{Prefijo}: {val_all:.4f}")
                else:
                    print(f"   ❌ CT_{Prefijo}: DF={val_all:.4f} vs "
                          f"{esperado_all:.4f}")


def Main() -> None:

    """
    
    Ejecuta los controles manuales de cambio de tiempo
    para los DataFrames en dfs_Finales.
    
    """

    if 'dfs_Finales' not in globals():
        print("❌ 'dfs_Finales' no encontrado.")
        return

    Verificar_Cambio_Tiempo_Manual(
        Diccionario_Dfs = globals()['dfs_Finales'],
        Numero_Sujetos = 3,
        Semilla_Aleatoria = 42
    )

    Verificar_Promedios_CT_Manual(
        Diccionario_Dfs = globals()['dfs_Finales'],
        Numero_Sujetos = 3,
        Semilla_Aleatoria = 42
    )


if __name__ == "__main__":
    Main()


In [11]:
# Exportar base para el control.
for Nombre_df, df in dfs_Finales.items():
    dfs_Finales[Nombre_df].head(50).to_excel(f'Controles/19. CO y CT ({Nombre_df}).xlsx', index=False)