Skip to content

WilliamMSL/cv-parser

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

CV Parser

Outil local de parsing de CV utilisant Mistral OCR pour l'extraction de texte et Mistral Small pour la structuration en JSON.

Fonctionnalités

  • Drag & drop d'un CV au format PDF
  • Extraction OCR via Mistral OCR (mistral-ocr-latest)
  • Structuration automatique en JSON via Mistral Small
  • Affichage des résultats en tableaux (infos personnelles, formation, expérience, compétences, centres d'intérêt)
  • Export JSON téléchargeable

Installation

git clone https://github.com/YOUR_USERNAME/cv-parser.git
cd cv-parser
pip install -r requirements.txt

Configuration

Créez un fichier .env ou exportez la variable d'environnement :

export MISTRAL_API_KEY=your_mistral_api_key_here

Vous pouvez obtenir une clé API sur console.mistral.ai.

Utilisation

python app.py

Ouvrez http://localhost:8000 dans votre navigateur et glissez un CV au format PDF.

Structure JSON de sortie

{
  "personal_info": {
    "name": "",
    "email": "",
    "phone": "",
    "address": "",
    "mobility": "",
    "summary_or_objective": ""
  },
  "education": [
    {
      "degree": "",
      "institution": "",
      "location": "",
      "start_date": "",
      "end_date": ""
    }
  ],
  "experience": [
    {
      "title": "",
      "company": "",
      "location": "",
      "start_date": "",
      "end_date": "",
      "description": []
    }
  ],
  "skills": {
    "languages": [],
    "it_skills": [],
    "soft_skills": []
  },
  "interests": []
}

Stack

  • Backend : Python, FastAPI
  • OCR : Mistral OCR (mistral-ocr-latest)
  • Structuration : Mistral Small (mistral-small-latest)
  • Frontend : HTML/CSS/JS (vanilla)

About

CV parser using Mistral OCR + Mistral Small for structured JSON extraction

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors