Skip to content

AI-Code-Detector es una herramienta de machine learning que analiza código Python y detecta si fue escrito por un humano o por inteligencia artificial, usando procesamiento de lenguaje natural y modelos de clasificación.

License

Notifications You must be signed in to change notification settings

mat1520/AI-Code-Detector

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 

Repository files navigation

AI-Code-Detector

AI-Code-Detector es una herramienta de machine learning que analiza código Python y detecta si fue escrito por un humano o por inteligencia artificial, usando procesamiento de lenguaje natural y modelos de clasificación.

🚧 Proyecto en desarrollo - 2025


Descripción

Esta aplicación permite a desarrolladores, docentes y revisores analizar fragmentos de código Python y obtener una predicción automática sobre su origen (humano o IA). Utiliza embeddings generados con CodeBERT y un clasificador XGBoost entrenado con cientos de ejemplos reales y sintéticos.


Instalación

  1. Clona el repositorio y entra al directorio:
    git clone https://github.com/mat1520/AI-Code-Detector.git
    cd AI-Code-Detector
  2. Crea y activa un entorno virtual:
    python -m venv venv
    # En Windows:
    venv\Scripts\activate
    # En Linux/Mac:
    source venv/bin/activate
  3. Instala las dependencias:
    pip install -r requirements.txt

Uso rápido

  1. Genera los datos de código humano e IA (ver scripts en src/data_collection/).
  2. Extrae los embeddings:
    python -m src.preprocessing.feature_extractor
  3. Entrena el modelo:
    python -m src.training.train
  4. Lanza la app web:
    streamlit run src/app/main.py

Ejemplo de uso

Código humano

def suma(a, b):
    return a + b
print(suma(2, 3))

Código IA

def calculate_sum(a: int, b: int) -> int:
    """
    Calcula la suma de dos números enteros.
    """
    return a + b

Resultados

  • El modelo fue entrenado y evaluado con 819 ejemplos de código humano y 819 de IA.
  • Precisión superior al 95% en pruebas internas.
  • El sistema muestra la probabilidad de cada clase y una barra de progreso visual.

Estructura del proyecto

AI-Code-Detector/
├── data/
│   ├── raw_ai/
│   ├── raw_human/
│   └── processed/
├── src/
│   ├── app/
│   ├── data_collection/
│   ├── preprocessing/
│   ├── training/
│   └── utils/
├── models/
├── notebooks/
├── README.md
├── LICENSE
└── requirements.txt

Licencia

MIT License 2025. Consulta el archivo LICENSE para más detalles.

About

AI-Code-Detector es una herramienta de machine learning que analiza código Python y detecta si fue escrito por un humano o por inteligencia artificial, usando procesamiento de lenguaje natural y modelos de clasificación.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages