# Codificación Automatizada de Entrevistas con GPT-4o
Este notebook recorre todos los archivos `.txt` en la carpeta `entrevistas/`, solicita a GPT-4o sugerencias de codificación temática, y compila todos los códigos en un único archivo `.csv`.

## 1. Instalación de dependencias

In [1]:
!pip install openai pandas



In [2]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [7]:
import os
os.chdir("/content/drive/MyDrive/_Luz Stella Doctorado/Mario Chamie Mazzilli/1_Audios_Archivos .m4a/Prueba_Piloto_3_con_IA_Assist")

In [8]:
os.getcwd()

'/content/drive/MyDrive/_Luz Stella Doctorado/Mario Chamie Mazzilli/1_Audios_Archivos .m4a/Prueba_Piloto_3_con_IA_Assist'

## 2. Cargar archivos de entrevistas

In [3]:
import os
import pandas as pd

carpeta = "/content/drive/MyDrive/_Luz Stella Doctorado/Mario Chamie Mazzilli/1_Audios_Archivos .m4a/Prueba_Piloto_3_con_IA_Assist"
archivos = [f for f in os.listdir(carpeta) if f.endswith(".txt")]
print("Archivos encontrados:", archivos)

def leer_entrevista(nombre_archivo):
    with open(os.path.join(carpeta, nombre_archivo), encoding="utf-8") as f:
        return f.read()


Archivos encontrados: ['Voz 036.txt', 'Voz 035_medium.txt', 'Voz_Prueba_Piloto_01.txt']


## 3. Ingreso de clave de API y configuración del cliente

In [4]:
from openai import OpenAI
import getpass

clave = getpass.getpass("Ingrese su clave de OpenAI: ")
client = OpenAI(api_key=clave)
# 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


Ingrese su clave de OpenAI: ··········


## 4. Función para obtener códigos desde GPT-4o

In [5]:
def sugerir_codigos_chatgpt(texto, sistema="Eres un investigador cualitativo experto en codificación temática."):
    prompt_usuario = f"""A partir del siguiente fragmento de entrevista, propón códigos cualitativos y su descripción.

Texto:
{texto}

Entrega ÚNICAMENTE la lista JSON. No escribas explicaciones ni encabezados. La respuesta debe ser directamente una lista de objetos JSON con campos: 'codigo', 'descripcion'."""

    respuesta = client.chat.completions.create(
        model="gpt-4o",
        messages=[
            {"role": "system", "content": sistema},
            {"role": "user", "content": prompt_usuario}
        ],
        temperature=0.7
    )

    return respuesta.choices[0].message.content


## 5. Codificación de todas las entrevistas y consolidación en un solo archivo

In [6]:
import json
import re

resultados = []

for archivo in archivos:
    print(f"Codificando: {archivo}")
    texto = leer_entrevista(archivo)
    fragmento = texto[:1500]  # ajustar si es necesario
    respuesta_json = sugerir_codigos_chatgpt(fragmento)

    try:
        json_puro = re.search(r"\[.*\]", respuesta_json, re.DOTALL).group(0)
        datos = json.loads(json_puro)

        if isinstance(datos, list):
            for item in datos:
                item["archivo"] = archivo  # agrega nombre del archivo como contexto
                resultados.append(item)
        else:
            print(f"⚠️ Respuesta no válida en {archivo}")

    except Exception as e:
        print(f"❌ Error procesando {archivo}: {e}")

# Exportar resultados
if resultados:
    df_total = pd.DataFrame(resultados)
    df_total.to_csv("codigos_todas_entrevistas.csv", index=False)
    print("✅ Archivo combinado generado: codigos_todas_entrevistas.csv")
    display(df_total)
else:
    print("⚠️ No se generaron resultados válidos.")


Codificando: Voz 036.txt
Codificando: Voz 035_medium.txt
Codificando: Voz_Prueba_Piloto_01.txt
✅ Archivo combinado generado: codigos_todas_entrevistas.csv


Unnamed: 0,codigo,descripcion,archivo
0,participacion_comunitaria,Experiencias y valoraciones sobre la participa...,Voz 036.txt
1,desarrollo_capacidades,Propuestas y percepciones sobre el desarrollo ...,Voz 036.txt
2,consentimiento_informado,Proceso de obtención de permiso para participa...,Voz 036.txt
3,caracteristicas_demograficas,"Información demográfica del participante, incl...",Voz 036.txt
4,rol_comunitario,Rol del participante dentro de la organización...,Voz 036.txt
5,Participación comunitaria,Involucramiento activo de diversas comunidades...,Voz 035_medium.txt
6,Diversidad de grupos participantes,"Inclusión de comunidades campesinas, indígenas...",Voz 035_medium.txt
7,Metodologías participativas,Uso de metodologías específicas para facilitar...,Voz 035_medium.txt
8,Enfoque en la participación,La participación como base y enfoque principal...,Voz 035_medium.txt
9,Impacto territorial,Reflejo de los esfuerzos participativos a nive...,Voz 035_medium.txt
