# Chatpdf

Before asking questions to a PDF, you need to add it to ChatPDF as a source. There are three ways to do so:
- Upload the PDF on ChatPDF.com manually
- Add a PDF from a publicly accessible URL via API
- Upload a PDF file from your computer via API
- PDFs are limited to 2,000 pages or 32 MB per file.

Free Plan Limits:

- 5000 PDF pages
- 500 AI messages

Source: https://www.chatpdf.com/docs/api/backend

### 0)Setup

In [1]:
# # Create .env file
# with open('.env', 'w') as f:
#     f.write(r'CHATPDF_API_KEY=api_key')

In [2]:
import os
work_dir = "C:/Users/danie/OneDrive/Escritorio/Data Science/1. Python Projects/chatpdf"
os.chdir(work_dir)

In [3]:
import requests
from pprint import pprint
from dotenv import load_dotenv
load_dotenv() 

True

In [4]:
api_key = os.getenv('CHATPDF_API_KEY')
headers = {
          'x-api-key': api_key
          }

In [6]:
data_dir = "./data"
file_name = "programa_electoral_pp.pdf"

### 1)Add PDF via File Upload

In [7]:
files = [
    ('file', ('file', open(os.path.join(data_dir, file_name), 'rb'), 'application/octet-stream'))
        ]

endpoint = 'https://api.chatpdf.com/v1/sources/add-file'

In [8]:
response = requests.post(endpoint,
                         headers=headers,
                         files=files
                         )

In [10]:
if response.status_code == 200:
    print('Source ID:', response.json()['sourceId'])
    source_id = response.json()['sourceId']
else:
    print('Status:', response.status_code)
    print('Error:', response.text)

Source ID: src_DgeWMFUAsAjI1y77Dj3kx


### 2)Chat with PDF

In [23]:
queries = [
        "¿Qué propone el PP para combatir el desempleo juvenil y la precariedad laboral?",
        "¿Qué propone el PP para combatir el problema de vivienda en España?",
        "¿Qué propone el PP para combatir el abandono del campo?"
          ]

messages = [{'role': "user",'content': query} for query in queries]

In [45]:
#Input sample
messages[0]

{'role': 'user',
 'content': '¿Qué propone el PP para combatir el desempleo juvenil y la precariedad laboral?'}

In [35]:
endpoint = 'https://api.chatpdf.com/v1/chats/message'

In [38]:
results = []
for message in messages:
    data = {
            'sourceId': source_id,
            'messages': [message]
            }
    response = requests.post(endpoint,
                            headers=headers,
                            json=data
                            )
                            
    if response.status_code == 200:
        result = response.json()['content']
        results.append(result)
    else:
        print('Status:', response.status_code)
        print('Error:', response.text)

In [46]:
msg_id = 0

print(f"Questions:{messages[msg_id]['content']}\nAnswer:")
pprint(results[msg_id])

Questions:¿Qué propone el PP para combatir el desempleo juvenil y la precariedad laboral?
Answer:
('El Partido Popular propone una reforma integral de las políticas activas de '
 'empleo, basada en la ampliación y mejora de la calidad de la oferta de '
 'formación, otorgando mayor libertad de elección al trabajador desempleado. '
 'También promoverán el acceso de los desempleados a orientación laboral '
 'individualizada a través del perfilado estadístico y herramientas de Big '
 'Data que identifiquen las mejores alternativas de formación a su '
 'disposición. Además, quieren alcanzar niveles de empleo equiparables a los '
 'del resto de la Unión Europea, especialmente en lo relativo al empleo de los '
 'jóvenes y de las mujeres.')


In [47]:
msg_id = 1

print(f"Questions:{messages[msg_id]['content']}\nAnswer:")
pprint(results[msg_id])

Questions:¿Qué propone el PP para combatir el problema de vivienda en España?
Answer:
('El Partido Popular propone varias medidas para combatir el problema de '
 'vivienda en España, entre ellas: un programa de avales destinado a jóvenes '
 'de hasta 35 años para garantizar la concesión de créditos hipotecarios por '
 'valor de hasta un 95% de la totalidad del precio de la vivienda, una ley de '
 'seguridad jurídica en materia de urbanismo que garantice la perdurabilidad '
 'de los planes urbanísticos cuando se impugnen cuestiones no estructurantes '
 'de los mismos, la movilización del suelo de titularidad pública destinado a '
 'redes públicas de vivienda, tanto patrimonial como demanial, con destino a '
 'fórmulas de promoción de vivienda en alquiler asequible, y la promoción de '
 'la vivienda social como elemento fundamental para hacer frente al problema '
 'de la vivienda en España. Estas propuestas se encuentran en la página 34 del '
 'Programa del Partido Popular.')


In [48]:
msg_id = 2

print(f"Questions:{messages[msg_id]['content']}\nAnswer:")
pprint(results[msg_id])

Questions:¿Qué propone el PP para combatir el abandono del campo?
Answer:
('El PP propone un Plan de apoyo a la España despoblada que garantizará los '
 'servicios básicos del Estado del bienestar y servirá de estímulo a las '
 'familias y a los profesionales que decidan vivir, ganarse la vida y ejercer '
 'su actividad en el medio rural. Además, crearán un Foro permanente para '
 'conectar las políticas de todas las administraciones públicas que afecten al '
 'rural y mejorarán la fiscalidad específica en el medio rural. También '
 'impulsarán políticas de rehabilitación de viviendas en los pueblos. (Page 32 '
 'and 80)')


### 3)Delete PDF

In [None]:
# data = {
#         'sources': [os.path.join(data_dir, file_name)],
#        }

In [None]:
# endpoint = 'https://api.chatpdf.com/v1/sources/delete'

In [None]:
# try:
#   response = requests.post(endpoint,
#                            json=data,
#                            headers=headers
#                            )
#   response.raise_for_status()
#   print('Success')
# except requests.exceptions.RequestException as error:
#   print('Error:', error)
#   print('Response:', error.response.text)