In [1]:
import requests

base_url = "https://cima.aemps.es/cima/rest/medicamentos"
pagina = 1
tamanio_pagina = 1000  # Ajusta este valor según lo que permita la API
nregistros = []

while True:
    params = {
        "pagina": pagina,
        "tamanioPagina": tamanio_pagina
    }
    print(f"Recuperando página {pagina}...")
    response = requests.get(base_url, params=params)
    data = response.json()
    
    # Verificamos que existan resultados en la respuesta
    resultados = data.get("resultados", [])
    if not resultados:
        break

    # Extraemos el campo nregistro de cada medicamento
    nregistros.extend([med.get("nregistro") for med in resultados])
    
    total_filtrado = data.get("totalFilas", 0)
    # Comprobamos si ya hemos obtenido todos los registros
    if pagina * tamanio_pagina >= total_filtrado:
        break
    pagina += 1

print("Total de nregistro extraídos:", len(nregistros))
print(nregistros)


Recuperando página 1...
Recuperando página 2...
Recuperando página 3...
Recuperando página 4...
Recuperando página 5...
Recuperando página 6...
Recuperando página 7...
Recuperando página 8...
Recuperando página 9...
Recuperando página 10...
Recuperando página 11...
Recuperando página 12...
Recuperando página 13...
Recuperando página 14...
Recuperando página 15...
Recuperando página 16...
Recuperando página 17...
Recuperando página 18...
Recuperando página 19...
Recuperando página 20...
Recuperando página 21...
Recuperando página 22...
Recuperando página 23...
Recuperando página 24...
Recuperando página 25...
Recuperando página 26...
Total de nregistro extraídos: 650
['81012', '84182', '80803', '82913', '87969', '86024', '86037', '07428001', '85180', '1231752001', '65382', '65059', '61836', '61837', '60014', '70452', '70451', '69223', '71437', '79696', '64658', '61791', '68629', '62389', '62390', '66460', '66459', '67763', '66458', '85923', '67621', '67988', '78452', '67874', '64920', '

In [4]:
import requests
import json

base_url = "https://cima.aemps.es/cima/rest/medicamentos"
params = {
    "pagina": 1,
    "tamanioPagina": 100  # Puedes ajustar el tamaño si lo deseas
}
headers = {
    "Accept": "application/json"
}

response = requests.get(base_url, params=params, headers=headers)

print("Código de estado:", response.status_code)
try:
    data = response.json()
    # Imprime de forma formateada para ver mejor la estructura
    print(json.dumps(data, indent=2, ensure_ascii=False))
except Exception as e:
    print("Error al parsear JSON:", e)
    print("Contenido de la respuesta:")
    print(response.text)


Código de estado: 200
{
  "totalFilas": 25066,
  "pagina": 1,
  "tamanioPagina": 25,
  "resultados": [
    {
      "nregistro": "81012",
      "nombre": "ABACAVIR/LAMIVUDINA DR. REDDYS 600 MG/300 MG COMPRIMIDOS RECUBIERTOS CON PELICULA EFG",
      "labtitular": "Reddy Pharma Iberia S.A.",
      "labcomercializador": "Reddy Pharma Iberia S.A.",
      "cpresc": "Uso Hospitalario",
      "estado": {
        "aut": 1466978400000
      },
      "comerc": true,
      "receta": true,
      "generico": true,
      "conduc": false,
      "triangulo": false,
      "huerfano": false,
      "biosimilar": false,
      "nosustituible": {
        "id": 0,
        "nombre": "N/A"
      },
      "psum": false,
      "notas": false,
      "materialesInf": true,
      "ema": false,
      "docs": [
        {
          "tipo": 1,
          "url": "https://cima.aemps.es/cima/pdfs/ft/81012/FT_81012.pdf",
          "urlHtml": "https://cima.aemps.es/cima/dochtml/ft/81012/FT_81012.html",
          "secc": true,

In [9]:
import requests
import pandas as pd

# Parámetros de la petición para una sola página
url = "https://cima.aemps.es/cima/rest/medicamentos"
params = {
    "pagina": 1,
    "tamanioPagina": 25
}
headers = {"Accept": "application/json"}

# Realizar la petición
response = requests.get(url, params=params, headers=headers)
data = response.json()

# Lista para almacenar los registros
registros = []

# Iterar sobre cada medicamento en "resultados"
for med in data.get("resultados", []):
    nregistro = med.get("nregistro")
    nombre_med = med.get("nombre")
    # Principios activos: se encuentra en "vtm" y su campo "nombre"
    principios_activos = med.get("vtm", {}).get("nombre")
    
    # Buscar en la lista "docs" el documento con tipo 1 (ficha técnica en PDF)
    pdf_url = None
    for doc in med.get("docs", []):
        if doc.get("tipo") == 1:
            pdf_url = doc.get("url")
            break

    registros.append({
        "nregistro": nregistro,
        "nombre": nombre_med,
        "principios_activos": principios_activos,
        "pdf_url": pdf_url
    })

# Convertir la lista a un DataFrame
df = pd.DataFrame(registros)
display(df)


Unnamed: 0,nregistro,nombre,principios_activos,pdf_url
0,81012,ABACAVIR/LAMIVUDINA DR. REDDYS 600 MG/300 MG C...,abacavir + lamivudina,https://cima.aemps.es/cima/pdfs/ft/81012/FT_81...
1,84182,ABACAVIR/LAMIVUDINA KERN PHARMA 600 MG/300 MG ...,abacavir + lamivudina,https://cima.aemps.es/cima/pdfs/ft/84182/FT_84...
2,80803,ABACAVIR/LAMIVUDINA SANDOZ 600 MG/300 MG COMPR...,abacavir + lamivudina,https://cima.aemps.es/cima/pdfs/ft/80803/FT_80...
3,82913,ABACAVIR/LAMIVUDINA STADA 600 MG/300 MG COMPRI...,abacavir + lamivudina,https://cima.aemps.es/cima/pdfs/ft/82913/FT_82...
4,87969,ABIRATERONA NORMON 500 MG COMPRIMIDOS RECUBIER...,abiraterona,https://cima.aemps.es/cima/pdfs/ft/87969/FT_87...
5,86024,ABIRATERONA SANDOZ 500 MG COMPRIMDOS RECUBIERT...,abiraterona,https://cima.aemps.es/cima/pdfs/ft/86024/FT_86...
6,86037,ABIRATERONA STADA 500 MG COMPRIMIDOS RECUBIERT...,abiraterona,https://cima.aemps.es/cima/pdfs/ft/86037/FT_86...
7,7428001,ABRAXANE 5 MG/ML POLVO PARA DISPERSION PARA PE...,paclitaxel,https://cima.aemps.es/cima/pdfs/ft/07428001/FT...
8,85180,ABRILIA 20 MG COMPRIMIDOS EFG,bilastina,https://cima.aemps.es/cima/pdfs/ft/85180/FT_85...
9,1231752001,ABRYSVO POLVO Y DISOLVENTE PARA SOLUCION INYEC...,vacuna anti virus respiratorio sincitial,https://cima.aemps.es/cima/pdfs/ft/1231752001/...


In [13]:
import requests
import pandas as pd
import math

url = "https://cima.aemps.es/cima/rest/medicamentos"
headers = {"Accept": "application/json"}
tamanioPagina = 25

# Primera petición para conocer totalFilas
try:
    params = {
        "pagina": 1,
        "tamanioPagina": tamanioPagina
    }
    response = requests.get(url, params=params, headers=headers)
    data = response.json()
    totalFilas = data.get("totalFilas", 0)
except Exception as e:
    print("Error en la solicitud inicial:", e)
    totalFilas = 0

if totalFilas == 0:
    print("No se han obtenido resultados.")
    registros = []
else:
    total_paginas = math.ceil(totalFilas / tamanioPagina)
    print("Total de medicamentos:", totalFilas)
    print("Total de páginas:", total_paginas)

    registros = []
    for pagina in range(1, total_paginas + 1):
        params = {
            "pagina": pagina,
            "tamanioPagina": tamanioPagina
        }
        print(f"Recuperando página {pagina} de {total_paginas}...")
        try:
            response = requests.get(url, params=params, headers=headers)
            data = response.json()
        except Exception as e:
            print(f"Error en la página {pagina}: {e}")
            continue  # Salta a la siguiente página si hay error
        
        for med in data.get("resultados", []):
            try:
                nregistro = med.get("nregistro")
                nombre_med = med.get("nombre")
                # Extraer el nombre de los principios activos desde "vtm"
                principios_activos = med.get("vtm", {}).get("nombre")
                
                # Buscar en "docs" el documento de tipo 1 (ficha técnica en PDF)
                pdf_url = None
                for doc in med.get("docs", []):
                    if doc.get("tipo") == 1:
                        pdf_url = doc.get("url")
                        break

                registros.append({
                    "nregistro": nregistro,
                    "nombre": nombre_med,
                    "principios_activos": principios_activos,
                    "pdf_url": pdf_url
                })
            except Exception as e:
                print("Error procesando medicamento:", e)
    
df = pd.DataFrame(registros)
display(df)
print("Total de registros procesados:", len(registros))

Total de medicamentos: 25066
Total de páginas: 1003
Recuperando página 1 de 1003...
Recuperando página 2 de 1003...
Recuperando página 3 de 1003...
Recuperando página 4 de 1003...
Recuperando página 5 de 1003...
Recuperando página 6 de 1003...
Recuperando página 7 de 1003...
Recuperando página 8 de 1003...
Recuperando página 9 de 1003...
Recuperando página 10 de 1003...
Recuperando página 11 de 1003...
Recuperando página 12 de 1003...
Recuperando página 13 de 1003...
Recuperando página 14 de 1003...
Recuperando página 15 de 1003...
Recuperando página 16 de 1003...
Recuperando página 17 de 1003...
Recuperando página 18 de 1003...
Recuperando página 19 de 1003...
Recuperando página 20 de 1003...
Recuperando página 21 de 1003...
Recuperando página 22 de 1003...
Recuperando página 23 de 1003...
Recuperando página 24 de 1003...
Recuperando página 25 de 1003...
Recuperando página 26 de 1003...
Recuperando página 27 de 1003...
Recuperando página 28 de 1003...
Recuperando página 29 de 1003...


Unnamed: 0,nregistro,nombre,principios_activos,pdf_url
0,81012,ABACAVIR/LAMIVUDINA DR. REDDYS 600 MG/300 MG C...,abacavir + lamivudina,https://cima.aemps.es/cima/pdfs/ft/81012/FT_81...
1,84182,ABACAVIR/LAMIVUDINA KERN PHARMA 600 MG/300 MG ...,abacavir + lamivudina,https://cima.aemps.es/cima/pdfs/ft/84182/FT_84...
2,80803,ABACAVIR/LAMIVUDINA SANDOZ 600 MG/300 MG COMPR...,abacavir + lamivudina,https://cima.aemps.es/cima/pdfs/ft/80803/FT_80...
3,82913,ABACAVIR/LAMIVUDINA STADA 600 MG/300 MG COMPRI...,abacavir + lamivudina,https://cima.aemps.es/cima/pdfs/ft/82913/FT_82...
4,87969,ABIRATERONA NORMON 500 MG COMPRIMIDOS RECUBIER...,abiraterona,https://cima.aemps.es/cima/pdfs/ft/87969/FT_87...
...,...,...,...,...
24970,98071001IP,XENICAL 120 mg capsulas duras,orlistat,https://cima.aemps.es/cima/pdfs/ft/98071001IP/...
24971,98071002IP1,XENICAL 120 mg capsulas duras,orlistat,https://cima.aemps.es/cima/pdfs/ft/98071002IP1...
24972,98071003IP5,XENICAL 120 mg capsulas duras,orlistat,https://cima.aemps.es/cima/pdfs/ft/98071003IP5...
24973,98071003IP4,XENICAL 120mg capsulas duras,orlistat,https://cima.aemps.es/cima/pdfs/ft/98071003IP4...


Total de registros procesados: 24975


In [20]:
df_filtrado = df[df['nombre'] == 'XENICAL 120 mg capsulas duras']
display(df_filtrado)

Unnamed: 0,nregistro,nombre,principios_activos,pdf_url
24970,98071001IP,XENICAL 120 mg capsulas duras,orlistat,https://cima.aemps.es/cima/pdfs/ft/98071001IP/...
24971,98071002IP1,XENICAL 120 mg capsulas duras,orlistat,https://cima.aemps.es/cima/pdfs/ft/98071002IP1...
24972,98071003IP5,XENICAL 120 mg capsulas duras,orlistat,https://cima.aemps.es/cima/pdfs/ft/98071003IP5...


In [21]:
df_filtrado['pdf_url']

24970    https://cima.aemps.es/cima/pdfs/ft/98071001IP/...
24971    https://cima.aemps.es/cima/pdfs/ft/98071002IP1...
24972    https://cima.aemps.es/cima/pdfs/ft/98071003IP5...
Name: pdf_url, dtype: object