In [12]:
import gzip
import json
import pandas as pd

# Chemin du fichier JSON compressé (ex: CVEs 2024)
file_path = "/content/nvdcve-1.1-2024.json.gz"

# Ouvrir et charger le contenu du fichier JSON
with gzip.open(file_path, 'rt', encoding='utf-8') as f:
    data = json.load(f)

# Extraire les informations pertinentes
records = []
for item in data['CVE_Items']:
    cve_id = item['cve']['CVE_data_meta']['ID']
    description = item['cve']['description']['description_data'][0]['value']

    # Extraire les CWE associés (s'ils existent)
    cwes = item.get('cve', {}).get('problemtype', {}).get('problemtype_data', [])
    cwe_list = [entry['description'][0]['value'] for entry in cwes if entry['description']]
    cwe = ", ".join(cwe_list) if cwe_list else "N/A"

    # Ajouter l'entrée aux résultats
    records.append({
        "CVE_ID": cve_id,
        "Description": description,
        "CWE": cwe
    })

# Convertir les données en DataFrame
df = pd.DataFrame(records)

# Sauvegarder en format TSV
df.to_csv("cve_2024.tsv", sep='\t', index=False)

print("Le fichier TSV a été généré avec succès!")


Le fichier TSV a été généré avec succès!
