In [1]:
! pip install pandas 
! pip install requests

Collecting pandas
  Downloading pandas-2.2.2-cp310-cp310-win_amd64.whl.metadata (19 kB)
Collecting numpy>=1.22.4 (from pandas)
  Downloading numpy-1.26.4-cp310-cp310-win_amd64.whl.metadata (61 kB)
     ---------------------------------------- 0.0/61.0 kB ? eta -:--:--
     ------------------- ------------------ 30.7/61.0 kB 660.6 kB/s eta 0:00:01
     ---------------------------------------- 61.0/61.0 kB 1.1 MB/s eta 0:00:00
Collecting pytz>=2020.1 (from pandas)
  Downloading pytz-2024.1-py2.py3-none-any.whl.metadata (22 kB)
Collecting tzdata>=2022.7 (from pandas)
  Downloading tzdata-2024.1-py2.py3-none-any.whl.metadata (1.4 kB)
Downloading pandas-2.2.2-cp310-cp310-win_amd64.whl (11.6 MB)
   ---------------------------------------- 0.0/11.6 MB ? eta -:--:--
   -- ------------------------------------- 0.6/11.6 MB 12.4 MB/s eta 0:00:01
   --------------- ------------------------ 4.5/11.6 MB 48.0 MB/s eta 0:00:01
   ----------------------------------- ---- 10.2/11.6 MB 72.3 MB/s eta 0:00

In [7]:
import requests
import csv

# Obtener todas las categorías
categories_url = "https://www.getonbrd.com/api/v0/categories?per_page=100&page=1"
categories_response = requests.get(categories_url)

if categories_response.status_code == 200:
    categories_data = categories_response.json()
else:
    print(f"Error: {categories_response.status_code}")
    categories_data = None

if categories_data:
    all_jobs = []
    for category in categories_data['data']:
        category_id = category['id']
        page = 1
        while True:
            jobs_url = f"https://www.getonbrd.com/api/v0/categories/{category_id}/jobs?per_page=100&page={page}&expand=[%22company%22]"
            jobs_response = requests.get(jobs_url)
            
            if jobs_response.status_code == 200:
                jobs_data = jobs_response.json()
            else:
                print(f"Error: {jobs_response.status_code}")
                jobs_data = None

            if jobs_data and "data" in jobs_data and jobs_data["data"]:
                for job in jobs_data["data"]:
                    attributes = job['attributes']
                    company = attributes['company']['data']['attributes'] if 'company' in attributes else {}

                    filtered_job = {
                        "category": attributes.get('category_name', ''),
                        "seniority": attributes['seniority']['data']['type'] if 'seniority' in attributes else '',
                        "min_salary": attributes.get('min_salary', ''),
                        "max_salary": attributes.get('max_salary', ''),
                        "id": job['id'],
                        "modality": attributes['modality']['data']['type'] if 'modality' in attributes else '',
                        "remote": attributes.get('remote', ''),
                        "remote_modality": attributes.get('remote_modality', ''),
                        "remote_zone": attributes.get('remote_zone', ''),
                        "published_at": attributes.get('published_at', ''),
                        "application_deadline": attributes.get('application_deadline', ''),
                        "experience": attributes.get('experience', ''),
                        "skills": ', '.join(attributes.get('skills', [])) if 'skills' in attributes else '',
                        "benefits": attributes.get('benefits', ''),
                        "company_name": company.get('name', ''),
                        "company_country": company.get('country', ''),
                        "company_id": company.get('id', ''),
                        "company_description": company.get('description', '')
                    }
                    all_jobs.append(filtered_job)
                page += 1
            else:
                break

    # Guardar trabajos en un archivo CSV
    with open('../data/all_jobs_data.csv', mode='w', newline='', encoding='utf-8') as file:
        writer = csv.writer(file)
        # Escribir los encabezados
        writer.writerow([
            "category", "seniority", "min_salary", "max_salary", "id", "modality", "remote", 
            "remote_modality", "remote_zone", "published_at", "application_deadline", 
            "experience", "skills", "benefits", "company_name", "company_country", 
            "company_id", "company_description"
        ])

        for job in all_jobs:
            writer.writerow([
                job["category"],
                job["seniority"],
                job["min_salary"],
                job["max_salary"],
                job["id"],
                job["modality"],
                job["remote"],
                job["remote_modality"],
                job["remote_zone"],
                job["published_at"],
                job["application_deadline"],
                job["experience"],
                job["skills"],
                job["benefits"],
                job["company_name"],
                job["company_country"],
                job["company_id"],
                job["company_description"]
            ])

    print("Todos los trabajos se han guardado en 'all_jobs_data.csv' correctamente.")
else:
    print("No se pudieron obtener las categorías.")


{'data': [{'id': 'programador-biometria-aplicada-santiago', 'type': 'job', 'attributes': {'title': 'Programador', 'description_headline': 'Requerimientos del cargo', 'description': '<p>Debes tener experiencia comprobable en desarrollo con C#, conocimientos de bases de datos relacionales SQL Server, desarrollo de frontend con enfoque al UX en Angular, React o similar. Ser proactivo en la búsqueda de soluciones, con capacidad y voluntad para aprender tecnologías nuevas y trabajar por la mejora continua de los proyectos.</p>', 'projects': '<p>Estamos creando software para plataformas web y aplicaciones móviles como parte del R&amp;D de soluciones empresariales de alto desempeño y personalización para grandes empresas nacionales e internacionales con requerimientos desafiantes, alto nivel de involucramiento con los procesos del cliente y acompañamiento en la creación e implementación de productos para nuestros clientes.</p>', 'functions_headline': 'Funciones del cargo', 'functions': '<p>Es

KeyboardInterrupt: 

In [5]:
# Leer el archivo CSV con pandas para mostrar los primeros registros y verificar que se guardaron correctamente

import pandas as pd

df = pd.read_csv('../data/all_jobs_data.csv')
df.head()


Unnamed: 0,category,seniority,min_salary,max_salary,id,modality,remote,remote_modality,remote_zone,published_at,application_deadline,experience,skills,benefits,company_name,company_country,company_id,company_description
0,Programming,"{'data': {'id': 3, 'type': 'seniority'}}",2400.0,4000.0,programador-biometria-aplicada-santiago,"{'data': {'id': 1, 'type': 'modality'}}",False,no_remote,,1716506997,,,,<p>Somos una empresa con muy buen ambiente de ...,Biometria Aplicada,CL,,Somos una empresa sólida con más de 12 años de...
1,Programming,"{'data': {'id': 3, 'type': 'seniority'}}",,,tech-lead-arkho-santiago-70da,"{'data': {'id': 1, 'type': 'modality'}}",True,fully_remote,Santiago Metropolitan,1716436734,,,,<ul><li>Día administrativo semestral hasta los...,ARKHO,CL,,Somos una consultora experta en tecnologías de...
2,Programming,"{'data': {'id': 4, 'type': 'seniority'}}",,,desarrollador-a-backend-springboot-empresas-sb...,"{'data': {'id': 1, 'type': 'modality'}}",False,hybrid,,1716413884,,,,,Empresas SB,CL,,Tendrás grandes desafíos y nuestro respaldo.\r...
3,Programming,"{'data': {'id': 4, 'type': 'seniority'}}",,,desarrollador-a-ruby-on-rails-empresas-sb-sant...,"{'data': {'id': 1, 'type': 'modality'}}",False,hybrid,,1716229366,,,,,Empresas SB,CL,,Tendrás grandes desafíos y nuestro respaldo.\r...
4,Programming,"{'data': {'id': 4, 'type': 'seniority'}}",,,arquitecto-java-bilingue-kibernum-bogota,"{'data': {'id': 1, 'type': 'modality'}}",True,remote_local,,1715899810,,,,<ul><li>Tipo de Trabajo: Remoto </li><li>Tipo ...,Kibernum,CL,,Impulsamos la evolución digital de nuestro ent...
