In [None]:
# -----------------------------------------
# GitHub API - Extracci√≥n de Repositorios y Commits
# Autor: Gabriel Gonzalez 
# -----------------------------------------

# ========================
# üîß 1. Importaci√≥n de librer√≠as
# ========================
import requests  # Para realizar solicitudes HTTP a la API de GitHub
import json      # Para manipular respuestas en formato JSON
import os        # Para verificar si el archivo se guard√≥

# ========================
# 2. Configuraci√≥n general de autenticaci√≥n
# ========================

# URL base para todas las solicitudes a la API de GitHub
BASE_URL = "https://api.github.com"

# Token personal (NO subir tokens reales a repositorios p√∫blicos)
GITHUB_TOKEN = ""

# Cabeceras necesarias para autenticar y definir la versi√≥n de la API
headers = {
    "Authorization": f"Bearer {GITHUB_TOKEN}",
    "Accept": "application/vnd.github+json",
    "X-GitHub-Api-Version": "2022-11-28"
}

# ========================
# 3. Buscar repositorios por palabra clave
# ========================
query = "machine learning"  # Tema a buscar
params = {
    "q": query,
    "sort": "stars",       # Ordenar por popularidad
    "order": "desc",       # Resultados m√°s populares primero
    "per_page": 5           # L√≠mite de resultados por p√°gina
}

# Ejecutamos la solicitud GET al endpoint de b√∫squeda
try:
    response = requests.get(f"{BASE_URL}/search/repositories", headers=headers, params=params)
    response.raise_for_status()  # Lanza error si el c√≥digo no es 200
except requests.exceptions.HTTPError as err:
    print("‚ùå Error HTTP al buscar repositorios:", err)
except requests.exceptions.RequestException as err:
    print("‚ùå Error general de red:", err)
else:
    data = response.json()
    print(f"\nüîé Total de resultados encontrados: {data['total_count']}")

    # Mostramos los repositorios encontrados
    for i, repo in enumerate(data['items']):
        print(f"\n{i+1}. {repo['full_name']}")
        print(f"   ‚≠ê Estrellas: {repo['stargazers_count']}")
        print(f"   üìÑ Descripci√≥n: {repo['description']}")

# ========================
# 4. Funci√≥n para extraer commits con paginaci√≥n
# ========================
def get_all_commits(owner, repo, max_pages=3, per_page=5):
    """
    Extrae commits paginados de un repositorio p√∫blico usando la API de GitHub.

    Par√°metros:
        owner (str): Usuario o cuenta due√±a del repositorio.
        repo (str): Nombre del repositorio.
        max_pages (int): Cantidad m√°xima de p√°ginas a recorrer.
        per_page (int): Commits por p√°gina (m√°x. 100).

    Retorna:
        list: Lista de diccionarios con SHA, autor, fecha y mensaje.
    """
    commits_list = []

    for page in range(1, max_pages + 1):
        print(f"\nüîÑ Consultando p√°gina {page}...")
        url = f"{BASE_URL}/repos/{owner}/{repo}/commits"
        params = {"per_page": per_page, "page": page}

        try:
            response = requests.get(url, headers=headers, params=params)
            response.raise_for_status()
        except requests.exceptions.HTTPError as err:
            print(f"‚ùå Error HTTP en p√°gina {page}:", err)
            break
        except requests.exceptions.RequestException as err:
            print(f"‚ùå Error de red en p√°gina {page}:", err)
            break

        data = response.json()

        if not data:
            print("‚úÖ No hay m√°s commits disponibles.")
            break

        for commit in data:
            commit_info = {
                "sha": commit.get("sha"),
                "author": commit["commit"]["author"].get("name"),
                "date": commit["commit"]["author"].get("date"),
                "message": commit["commit"]["message"]
            }
            commits_list.append(commit_info)

    print(f"\nüì¶ Total de commits extra√≠dos: {len(commits_list)}")
    return commits_list

# ========================
# 5. Uso de la funci√≥n con repositorio 'pandas-dev/pandas'
# ========================
owner = "pandas-dev"
repo_name = "pandas"
commits = get_all_commits(owner, repo_name, max_pages=3, per_page=5)

print("\nüßæ Detalle de commits extra√≠dos:")
for i, c in enumerate(commits):
    print(f"\n{i+1}. üìÖ {c['date']} | üë§ {c['author']}")
    print(f"   üìù {c['message']}")
    print(f"   üîë SHA: {c['sha']}")

# ========================
# 6. Guardar commits en archivo JSON
# ========================
output_filename = f"commits_{repo_name}.json"
with open(output_filename, "w", encoding="utf-8") as f:
    json.dump(commits, f, indent=4, ensure_ascii=False)
print(f"\n‚úÖ Archivo guardado exitosamente como '{output_filename}'")

# ========================
# 7. Consultar contenido del repositorio (endpoint /contents)
# ========================
def get_repo_contents(owner, repo, path=""):
    """
    Consulta el contenido de un repositorio (archivos y carpetas) usando /contents

    Par√°metros:
        owner (str): Usuario o organizaci√≥n
        repo (str): Nombre del repositorio
        path (str): Ruta del directorio a consultar ("" es ra√≠z)

    Retorna:
        list: Lista de archivos o carpetas encontrados
    """
    url = f"{BASE_URL}/repos/{owner}/{repo}/contents/{path}"
    try:
        response = requests.get(url, headers=headers)
        response.raise_for_status()
    except requests.exceptions.HTTPError as err:
        print("‚ùå Error HTTP al consultar contenido:", err)
        return []
    except requests.exceptions.RequestException as err:
        print("‚ùå Error de red al consultar contenido:", err)
        return []

    data = response.json()
    print(f"\nüìÅ Contenido del repositorio '{repo}' en ruta '{path}':")
    for item in data:
        tipo = "üìÑ Archivo" if item['type'] == 'file' else "üìÅ Carpeta"
        print(f"- {tipo}: {item['name']}")
    return data

# Consultamos la ra√≠z del repositorio de pandas
directory_listing = get_repo_contents(owner, repo_name)

# ========================
# 8. Recomendaciones de manejo de errores comunes
# ========================
print("\nüìåRecomendaciones de manejo de errores:üìå")
print("- 401 Unauthorized ‚Üí Verifica si el token est√° vencido o mal escrito.")
print("- 403 Rate Limit ‚Üí La API de GitHub tiene l√≠mites por hora. Intenta luego o autentica correctamente.")
print("- 404 Not Found ‚Üí Verifica si el repositorio o ruta existe.")
print("- Error de red ‚Üí Revisa tu conexi√≥n o el servidor de GitHub.")