# Asistente de Codificaci√≥n Cualitativa con GPT-4o y Exportaci√≥n CSV (versi√≥n corregida)
Este cuaderno permite cargar entrevistas, obtener sugerencias de codificaci√≥n usando GPT-4o y exportarlas a un archivo `.csv`. Ahora incluye limpieza autom√°tica del JSON generado.

## 1. Instalaci√≥n de dependencias

In [1]:
!pip install openai pandas



In [2]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


## 2. Cargar archivos de entrevistas

In [3]:
import os
import pandas as pd

carpeta = "/content/drive/MyDrive/_Luz Stella Doctorado/Mario Chamie Mazzilli/1_Audios_Archivos .m4a/Prueba_Piloto_3_con_IA_Assist"
archivos = [f for f in os.listdir(carpeta) if f.endswith(".txt")]
print("Archivos disponibles:", archivos)

def leer_entrevista(nombre_archivo):
    with open(os.path.join(carpeta, nombre_archivo), encoding="utf-8") as f:
        return f.read()

contenido = leer_entrevista(archivos[0])
print(contenido[:1000])


Archivos disponibles: ['comunidad_voz_036.txt', 'institucion_voz_035.txt', 'comunidad_prueba_01.txt']
 Formulario de entrevistas se mistrucuturada comunidades. Tesis y doctoral, ciudadan√≠a participaci√≥n y capacidades en la formulaci√≥n de los PEDED en la su regi√≥n de Montedemaria. Autor, Mario Chami√≠ Masilo, Universidad Estern√°e Colombia. Versi√≥n adoptada, adaptada para actores comunitarios. El objetivo en el alde de instrumento es recoger experiencias, valoraciones y propuestas de actores clave sobre la participaci√≥n comunitaria y el desarrollo de capacidades en la fase de la formulaci√≥n de los PEDED y PEDED en Montedemaria. Primero, muchas gracias por la participaci√≥n de S.A.1. En antestrevista, el objetivo es conocer su percepci√≥n sobre la participaci√≥n de su comunidad en la formulaci√≥n de los PEDED. Su opini√≥n es muy valiosa para una investigaci√≥n acad√©mica que busca mejorar. Los procesos de planeaci√≥n participativo en el pa√≠s, esta conversaci√≥n ser√° confiencial 

## 3. Ingreso de clave de API y configuraci√≥n del cliente

## üîê Gu√≠a para obtener la clave API de OpenAI

Para que este notebook funcione correctamente, debes generar tu propia **clave secreta (API key)** desde OpenAI. A continuaci√≥n, los pasos para obtenerla:

---

### 1. Crear una cuenta en OpenAI
- Visita: [https://platform.openai.com/signup](https://platform.openai.com/signup)
- Reg√≠strate con tu correo electr√≥nico o cuenta de Google/Microsoft.

---

### 2. Iniciar sesi√≥n en la plataforma
- Ve a: [https://platform.openai.com/account/api-keys](https://platform.openai.com/account/api-keys)
- Inicia sesi√≥n con tu cuenta ya creada.

---

### 3. Generar una nueva clave
- Haz clic en **‚Äú+ Create new secret key‚Äù**
- Asigna un nombre identificador (por ejemplo: `notebook_tesis`)
- Haz clic en **‚ÄúCreate secret key‚Äù**
- **Copia la clave** que se genera (ejemplo: `sk-XXXX...`)
  - ‚ö†Ô∏è Solo se muestra una vez. Gu√°rdala en lugar seguro.

---

### 4. Activar un plan de uso (si a√∫n no tienes uno)
- Visita: [https://platform.openai.com/account/billing/overview](https://platform.openai.com/account/billing/overview)
- Selecciona el plan **‚ÄúPay as you go‚Äù**
- Agrega un m√©todo de pago v√°lido
- Puedes establecer l√≠mites mensuales y recargas autom√°ticas

---

### 5. Ingresar la clave en el notebook
Cuando el sistema la solicite, p√©gala donde aparece:

```python
clave = getpass.getpass("Ingrese su clave de OpenAI: ")
```

No se mostrar√° en pantalla y solo se usar√° para tu sesi√≥n local.

---

### üîí Recomendaciones de seguridad
- Nunca compartas tu clave p√∫blicamente
- No la subas a GitHub ni a repositorios p√∫blicos
- Si crees que fue comprometida, elim√≠nala y genera una nueva desde tu cuenta

---


In [None]:
from openai import OpenAI
import getpass

# clave = getpass.getpass("Ingrese su clave de OpenAI: ")
clave = "PON_AQUI_TU_CLAVE_DE_OPENAI"
client = OpenAI(api_key=clave)
# (clave eliminada por seguridad)

Ingrese su clave de OpenAI: ¬∑¬∑¬∑¬∑¬∑¬∑¬∑¬∑¬∑¬∑


## 4. Funci√≥n para sugerir codificaci√≥n con JSON limpio

In [5]:
def sugerir_codigos_chatgpt(texto, sistema="Eres un investigador cualitativo experto en codificaci√≥n tem√°tica."):
    prompt_usuario = f"""A partir del siguiente fragmento de entrevista, prop√≥n c√≥digos cualitativos y su descripci√≥n.

Texto:
{texto}

Entrega √öNICAMENTE la lista JSON. No escribas explicaciones ni encabezados. La respuesta debe ser directamente una lista de objetos JSON con campos: 'codigo', 'descripcion'."""

    respuesta = client.chat.completions.create(
        model="gpt-4o",
        messages=[
            {"role": "system", "content": sistema},
            {"role": "user", "content": prompt_usuario}
        ],
        temperature=0.7
    )

    return respuesta.choices[0].message.content


## 5. Probar codificaci√≥n en un fragmento

In [6]:
fragmento = contenido[:1500]
respuesta_json = sugerir_codigos_chatgpt(fragmento)
print(respuesta_json)


```json
[
    {
        "codigo": "participacion_comunitaria",
        "descripcion": "Involucramiento de la comunidad en la formulaci√≥n de los Programas de Desarrollo con Enfoque Territorial (PEDED) en Montedemaria."
    },
    {
        "codigo": "desarrollo_capacidades",
        "descripcion": "Desarrollo de habilidades y capacidades de los actores comunitarios en el contexto de la planificaci√≥n participativa de los PEDED."
    },
    {
        "codigo": "percepcion_comunitaria",
        "descripcion": "Opiniones y valoraciones de los miembros de la comunidad sobre su participaci√≥n en los procesos de planificaci√≥n del desarrollo."
    },
    {
        "codigo": "consentimiento_informado",
        "descripcion": "Proceso de obtenci√≥n de permiso de los participantes para ser entrevistados y grabados, asegurando la confidencialidad y la opci√≥n de retirarse en cualquier momento."
    },
    {
        "codigo": "caracterizacion_participante",
        "descripcion": "Datos demogr√°f

## 6. Limpieza de respuesta y exportaci√≥n a CSV

In [7]:
import json
import re

try:
    # Extraer solo la parte JSON entre corchetes
    json_puro = re.search(r"\[.*\]", respuesta_json, re.DOTALL).group(0)
    datos = json.loads(json_puro)

    if isinstance(datos, list):
        df_codigos = pd.DataFrame(datos)
        nombre_archivo = "codigos_" + archivos[0].replace(".txt", ".csv")
        df_codigos.to_csv(nombre_archivo, index=False)
        print(f"‚úÖ Archivo exportado: {nombre_archivo}")
        display(df_codigos)
    else:
        print("‚ö†Ô∏è La respuesta no es una lista v√°lida de c√≥digos.")

except Exception as e:
    print("‚ùå Error al procesar la respuesta como JSON:")
    print(e)


‚úÖ Archivo exportado: codigos_comunidad_voz_036.csv


Unnamed: 0,codigo,descripcion
0,participacion_comunitaria,Involucramiento de la comunidad en la formulac...
1,desarrollo_capacidades,Desarrollo de habilidades y capacidades de los...
2,percepcion_comunitaria,Opiniones y valoraciones de los miembros de la...
3,consentimiento_informado,Proceso de obtenci√≥n de permiso de los partici...
4,caracterizacion_participante,Datos demogr√°ficos y de identificaci√≥n de los ...
5,enfoque_diferencial,Consideraci√≥n de las caracter√≠sticas individua...
6,rol_comunitario,Posici√≥n o funci√≥n que ocupa el participante d...
