In [2]:
import csv
import os
import requests

# Fonction pour extraire les issues GitHub
def extract_github_issues(repo_owner, repo_name, output_csv, token):
    try:
        # URL de l'API GitHub pour les issues du dépôt spécifié
        url = f'https://api.github.com/repos/{repo_owner}/{repo_name}/issues'
        # En-têtes pour l'authentification avec le token GitHub
        headers = {'Authorization': f'token {token}'}

        issues = []  # Liste pour stocker toutes les issues
        page = 1  # Compteur de pages pour la pagination des résultats

        while True:
            # Requête GET pour obtenir les issues de la page actuelle
            response = requests.get(url, headers=headers, params={'state': 'all', 'page': page})
            if response.status_code == 401:
                print("Erreur : Token GitHub non autorisé. Veuillez vérifier votre token.")
                return
            response.raise_for_status()  # Lève une exception pour les autres codes d'erreur HTTP
            page_issues = response.json()  # Convertir la réponse JSON en liste d'issues
            if not page_issues:
                break  # Si aucune issue n'est retournée, arrêter la boucle
            issues.extend(page_issues)  # Ajouter les issues de la page actuelle à la liste totale
            page += 1  # Passer à la page suivante

        # Vérifier si des issues ont été trouvées
        if not issues:
            print("Aucune issue trouvée.")
            return

        # Créer le répertoire si nécessaire
        os.makedirs(os.path.dirname(output_csv), exist_ok=True)

        # Écrire les issues dans un fichier CSV
        with open(output_csv, 'w', newline='', encoding='utf-8') as csvfile:
            issue_writer = csv.writer(csvfile)
            issue_writer.writerow(['ID', 'Title', 'User', 'State', 'Created At', 'Updated At', 'Labels'])
            for issue in issues:
                labels = ', '.join(label['name'] for label in issue.get('labels', []))
                issue_writer.writerow([
                    issue.get('number', 'N/A'),
                    issue.get('title', 'N/A'),
                    issue.get('user', {}).get('login', 'N/A'),
                    issue.get('state', 'N/A'),
                    issue.get('created_at', 'N/A'),
                    issue.get('updated_at', 'N/A'),
                    labels
                ])

        print(f"Extraction des issues terminée. Les issues sont enregistrées dans '{output_csv}'.")

    except requests.RequestException as e:
        print(f"Erreur lors de l'extraction des issues GitHub: {e}")
    except Exception as e:
        print(f"Une erreur inattendue s'est produite: {e}")

# Exemple d'utilisation avec des chemins absolus
if __name__ == "_main_":
    repo_owner = 'huggingface'  # Propriétaire du dépôt GitHub
    repo_name = 'datasets'  # Nom du dépôt GitHub
    github_token = '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'  # Remplacez par votre token GitHub
    output_issues_csv = r'/home/arij/documents/Arij.csv'  # Chemin absolu pour le fichier CSV des issues GitHub

    # Extraire les issues GitHub
    print("Début de l'extraction des issues...")
    extract_github_issues(repo_owner, repo_name, output_issues_csv, github_token)

    # Vérifier si le fichier des issues a été créé
    try:
        with open(output_issues_csv, 'r', encoding='utf-8') as f:
            print(f"Fichier '{output_issues_csv}' créé avec succès.")
    except FileNotFoundError:
        print(f"Erreur : Le fichier '{output_issues_csv}' n'a pas été créé.")
