<a href="https://colab.research.google.com/github/inefable12/SQP2024/blob/main/LLAMA3_huggingface_OK.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<img src="https://miro.medium.com/v2/resize:fit:1400/1*zomnCz8-VMgrSV8eLCx2tw.gif" width="200" alt="molecula"  />

---
$$\Large \textit{Sociedad Química del Perú | Curso: Inteligencia Artificial para la Escritura Científica}$$

---
<br>

$$\large\textbf{1er Entregable}$$


$$\textit{Análisis de la Ley que Promueve el Uso de la IA usando LLAMA3}$$

<br>
<br>

Autor: __Jesus Alvarado-Huayhuaz__

# 1. Contexto

Tabla 1. Preguntas de investigación para el área de química con especialidad en **diseño de fármacos (drug design**). Estas preguntas se enfocan en diferentes aspectos del proceso de diseño y desarrollo de fármacos.

| **Área de Investigación** | **Pregunta de Investigación** |
|---------------------------|-------------------------------|
| **Química Computacional** | ¿Cómo pueden los métodos de simulación molecular predecir la afinidad de unión de nuevos compuestos a proteínas diana? |
| **Modelado Molecular** | ¿Qué modelos de *in silico* son más efectivos para predecir la actividad biológica de moléculas en fases tempranas de desarrollo de fármacos? |
| **Química Medicinal** | ¿Cuáles son los efectos de la modificación de grupos funcionales en la selectividad y eficacia de inhibidores enzimáticos? |
| **Farmacocinética** | ¿Cómo pueden las modificaciones estructurales de una molécula influir en su biodisponibilidad y vida media en el organismo? |
| **Docking Molecular** | ¿Qué métodos de *docking* son más precisos para predecir la orientación de ligandos en el sitio activo de una proteína diana? |
| **Química Verde** | ¿Qué nuevas metodologías sostenibles pueden aplicarse en la síntesis de fármacos para minimizar el impacto ambiental? |
| **Diseño Basado en Estructura** | ¿Cómo puede el diseño basado en estructura mejorar la especificidad de los inhibidores de proteínas kinasa? |
| **Química Orgánica** | ¿Qué rutas sintéticas novedosas pueden desarrollarse para la síntesis de análogos estructurales de un fármaco líder? |
| **Optimización de Líderes** | ¿Cómo puede optimizarse la relación estructura-actividad (SAR) para mejorar la potencia de un candidato a fármaco? |
| **Toxicología Computacional** | ¿Qué métodos computacionales pueden predecir con mayor precisión el perfil de toxicidad de nuevos compuestos químicos? |
| **Inteligencia Artificial en Drug Design** | ¿Cómo pueden los algoritmos de aprendizaje profundo mejorar la predicción de propiedades farmacológicas de nuevas moléculas? |
| **Interacciones Fármaco-Receptor** | ¿Cómo influyen las interacciones no covalentes en la estabilidad y eficacia de los complejos fármaco-receptor? |

Estas preguntas pueden servir como punto de partida para diseñar proyectos de investigación o para orientar estudios en el campo del diseño de fármacos desde una perspectiva química.

Tabla 2. Preguntas de investigación para el área de química con especialidad en **diseño de fármacos (drug design)**:

| **Área de Investigación**                  | **Pregunta de Investigación**                                                                                                                                 |
|--------------------------------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------|
| **Química Medicinal**                      | ¿Cómo pueden modificarse las estructuras químicas de compuestos bioactivos para mejorar su afinidad y selectividad hacia un objetivo terapéutico específico?    |
| **Química Computacional**                  | ¿Qué modelos de dinámica molecular y simulaciones cuánticas son más efectivos para predecir la interacción de nuevos fármacos con sus blancos biológicos?        |
| **Química Orgánica**                       | ¿Qué nuevas rutas de síntesis pueden desarrollarse para producir análogos estructurales de fármacos conocidos con mejor biodisponibilidad y menor toxicidad?    |
| **Química Analítica**                      | ¿Qué técnicas analíticas pueden ser empleadas para la detección y cuantificación de impurezas en compuestos farmacéuticos durante el proceso de síntesis?        |
| **Química Supramolecular**                 | ¿Cómo pueden diseñarse sistemas supramoleculares para mejorar la liberación controlada de fármacos en tejidos específicos?                                       |
| **Química de Materiales**                  | ¿Qué nuevos materiales pueden desarrollarse como vehículos de administración de fármacos para mejorar la estabilidad y liberación en ambientes biológicos?       |
| **Bioquímica**                             | ¿Cómo influyen las modificaciones postraduccionales en la eficacia de un fármaco diseñado para interactuar con proteínas específicas?                           |
| **Farmacocinética y Farmacodinámica**      | ¿Qué modelos farmacocinéticos pueden predecir con mayor precisión la distribución y eliminación de un nuevo fármaco en diferentes poblaciones de pacientes?      |
| **Modelado Molecular y Docking**           | ¿Cómo pueden optimizarse los algoritmos de docking molecular para predecir con mayor precisión la conformación más estable de un complejo fármaco-receptor?     |
| **Toxicología Computacional**              | ¿Qué métodos in silico son más efectivos para predecir la toxicidad potencial de nuevos compuestos antes de su síntesis?                                         |
| **Inteligencia Artificial en Drug Design** | ¿Cómo pueden aplicarse técnicas de aprendizaje profundo para identificar nuevas moléculas candidatas a fármacos basadas en grandes bases de datos de compuestos? |

Estas preguntas están diseñadas para abordar distintas áreas relevantes en el campo del diseño de fármacos, enfocándose en aspectos tanto teóricos como experimentales.

# 2. Instalando Dependencias

In [1]:
%%capture
!pip install -U "transformers==4.40.0" --upgrade
!pip install -i https://pypi.org/simple/ bitsandbytes
!pip install accelerate

# Cargando el modelo Llama 3

In [2]:
#@title Cargando LLAMA3
import transformers
import torch

model_id = "unsloth/llama-3-8b-Instruct-bnb-4bit"

pipeline = transformers.pipeline(
    "text-generation",
    model=model_id,
    model_kwargs={
        "torch_dtype": torch.float16,
        "quantization_config": {"load_in_4bit": True},
        "low_cpu_mem_usage": True,
    },
)

Error while fetching `HF_TOKEN` secret value from your vault: 'Requesting secret HF_TOKEN timed out. Secrets can only be fetched when running from the Colab UI.'.
You are not authenticated with the Hugging Face Hub in this notebook.
If the error persists, please let us know by opening an issue on GitHub (https://github.com/huggingface/huggingface_hub/issues/new).


config.json:   0%|          | 0.00/1.26k [00:00<?, ?B/s]

Unused kwargs: ['_load_in_4bit', '_load_in_8bit', 'quant_method']. These kwargs are not used in <class 'transformers.utils.quantization_config.BitsAndBytesConfig'>.


model.safetensors:   0%|          | 0.00/5.70G [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/220 [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/51.1k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/9.09M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/345 [00:00<?, ?B/s]

Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.


# Query Llama 3

In [3]:
context1 = r"""ley QUe PROMUeVe el USO De lA InTelIGenCIA
ARTIFICIAl en FAVOR Del DeSARROllO
eCOnÓMICO y SOCIAl Del PAÍS
TÍTULO PRELIMINAR
Artículo único. Principios para el desarrollo y uso
de la inteligencia artificial
Son principios para el desarrollo y uso de la inteligencia
artificial:a) Estándares de seguridad basados en riesgos: Se
promueve un enfoque basado en riesgos para el
uso y desarrollo de la inteligencia artificial.
b) Enfoque de pluralidad de participantes: Se
promueve la participación de personas naturales
y jurídicas u organizaciones e instituciones
públicas y privadas en el debate para el desarrollo
de políticas orientadas a la regulación sobre el
uso de la inteligencia artificial en el país.
c) Gobernanza de internet: Se promueve el
desarrollo y aplicación de principios, normas,
reglas, procedimientos de toma de decisión y
programas que determinan la evolución y el uso
de internet por parte del Estado, instituciones
del sector privado y la sociedad civil participando
desde sus respectivos roles.
d) Sociedad digital: Se valora la información y el
conocimiento obtenido mediante el acceso, uso
y desarrollo de tecnologías digitales en todas
sus dimensiones, y se impulsa la seguridad, la
confianza, la economía digital, la conectividad
digital, el talento, la innovación, la educación y la
identidad digital, así como el aprovechamiento de
las tecnologías emergentes en favor del bienestar
social y económico de la ciudadanía.
e) Desarrollo ético para una inteligencia artificial
responsable: Se considera que la ética es la base
fundamental para identificar de forma precisa el
marco de responsabilidades en el uso de este tipo
de sistemas que conforman la industria 4.0.
f) Privacidad de la inteligencia artificial: La
inteligencia artificial no debe transgredir la
privacidad de las personas, debe actuar de
manera segura para lograr un impacto positivo y
de bienestar en los ciudadanos.
CAPÍTULO I
DISPOSICIONES GENERALES
Artículo 1. Objeto de la Ley
La presente ley tiene por objeto promover el uso de
la inteligencia artificial en el marco del proceso nacional
de transformación digital privilegiando a la persona
y el respeto de los derechos humanos con el fin de
fomentar el desarrollo económico y social del país, en un
entorno seguro que garantice su uso ético, sostenible,
transparente, replicable y responsable.
Artículo 2. Interés nacional
Es de interés nacional la promoción del talento
digital en el aprovechamiento de las tecnologías
emergentes y nuevas tecnologías en favor del
bienestar social y económico, así como el fomento
del desarrollo y uso de la inteligencia artificial para
la mejora de los servicios públicos, de la educación
y los aprendizajes, la salud, la justicia, la seguridad
ciudadana, la seguridad digital, la economía, la
inclusión, los programas sociales, la seguridad y la
defensa nacional, así como para toda otra actividad
económica y social a nivel nacional.
Artículo 3.Definiciones
a) Inteligencia artificial, Tecnología emergente de
propósito general que tiene el potencial de mejorar
el bienestar de las personas, contribuir a una
actividad económica global sostenible positiva,
aumentar la innovación y la productividad, y
ayudar a responder a los desafíos globales clave.
b) Sistema basado en inteligencia artificial:
Sistema electrónico-mecánico que puede, para
una serie de objetivos definidos por humanos,
hacer predicciones, recomendaciones o tomar
decisiones, influenciando ambientes reales o
virtuales. Está diseñado para funcionar con
diferentes niveles de autonomía.
c) Tecnologías emergentes;:Tecnologías digitales
capaces de generar soluciones innovadoras
tales como la robótica, la analítica, la inteligencia
artificial, las tecnologías cognitivas, la
nanotecnología, el internet de las cosas (IoT)" y similares, que conforman la industria 4.0 que
combina técnicas avanzadas de producción y
operaciones con tecnología, generando impacto
en el ecosistema digital, las organizaciones y las
personas.
d) Algoritmo, Secuencia de instrucciones y de
conjuntos ordenados y finitos de pasos para
resolver un problema o tomar una decisión.
CAPÍTULO II
AUTORIDAD NACIONAL
Artículo 4. Autoridad Nacional
La Presidencia del Consejo de Ministros, a través
de la Secretaría de Gobierno y Transformación Digital,
en su calidad de ente rector del Sistema Nacional de
Transformación Digital, es la autoridad técnico-normativa
a nivel nacional responsable de dirigir, evaluar y supervisar
el uso y la promoción del desarrollo de la inteligencia
artificial y las tecnologías emergentes, a fin de alcanzar
los objetivos del país en materia de transformación digital
y los objetivos de desarrollo sostenible conforme a la
normativa vigente.
La Autoridad Nacional, en el marco de la transformación
digital, desarrolla y articula acciones para promover e
impulsar,
a) El desarrollo de la inteligencia artificial y su
adopción como una herramienta que impulse el
desarrollo y el bienestar del país.
b) La formación de profesionales con competencia
para el aprovechamiento, desarrollo y usos de la
inteligencia artificial en el país.
c) La creación y el fortalecimiento de la infraestructura
digital como habilitadora para el desarrollo de la
inteligencia artificial.
d) El desarrollo de una infraestructura de datos a
fin de poner a disposición datos públicos de alta
calidad, reutilizable y accesible.
e) La adopción de lineamientos éticos para un
uso sostenible, transparente y replicable de la
inteligencia artificial.
f) Un ecosistema de colaboración de inteligencia
artificial a nivel nacional e internacional.
Artículo 5. Informe al Congreso de la República
La Autoridad Nacional remite un informe anual
al Congreso de la República sobre los avances
en la implementación de la Política Nacional de
Transformación Digital y la Estrategia Nacional de
Inteligencia Artificial.
En el caso de que se identifique amenazas graves
o vulneración de ciberseguridad nacional, la Autoridad
Nacional informa inmediatamente a la Comisión de
Inteligencia del Congreso de la República."""

In [5]:
#@title Pregunta Ley IA - Perú
messages = [
    {"role"   : "system",
     "content": context1},
    {"role"   : "user",
     "content": """¿Qué puntos se destacan sobre la privacidad de los datos?"""},
]

#What points stand out about data privacy?

prompt = pipeline.tokenizer.apply_chat_template(
        messages,
        tokenize=False,
        add_generation_prompt=True
)

terminators = [
    pipeline.tokenizer.eos_token_id,
    pipeline.tokenizer.convert_tokens_to_ids("<|eot_id|>")
]

outputs = pipeline(
    prompt,
    max_new_tokens=256,
    eos_token_id=terminators,
    do_sample=True,
    temperature=0.6,
    top_p=0.9,
)

print(outputs[0]["generated_text"][len(prompt):])

En el texto, se destacan los siguientes puntos sobre la privacidad de los datos relacionados con la inteligencia artificial:

* La inteligencia artificial no debe transgredir la privacidad de las personas (Artículo único, letra f).
* No se menciona explícitamente la protección de datos personales, pero se hace referencia a la importancia de la seguridad y la confianza en el uso de tecnologías digitales (Artículo único, letra d).
* No se establecen específicamente disposiciones sobre la protección de datos, pero se sugiere que la Autoridad Nacional debe promover la creación y el fortalecimiento de la infraestructura digital para garantizar la disponibilidad y accesibilidad de datos públicos de alta calidad (Artículo 4, letra d).

Es importante destacar que, aunque no se establecen disposiciones específicas sobre la privacidad de los datos, la Ley promueve la creación de un marco regulatorio que garantice el uso ético, sostenible, transparente, replicable y responsable de la inteligencia

In [7]:
#@title Pregunta2 Ley IA - Perú
messages = [
    {"role"   : "system",
     "content": context1},
    {"role"   : "user",
     "content": """¿Qué temas consideras que no se han abordado?"""},
]

prompt = pipeline.tokenizer.apply_chat_template(
        messages,
        tokenize=False,
        add_generation_prompt=True
)

terminators = [
    pipeline.tokenizer.eos_token_id,
    pipeline.tokenizer.convert_tokens_to_ids("<|eot_id|>")
]

outputs = pipeline(
    prompt,
    max_new_tokens=256,
    eos_token_id=terminators,
    do_sample=True,
    temperature=0.6,
    top_p=0.9,
)

print(outputs[0]["generated_text"][len(prompt):])

Aunque el texto presenta una visión general de la promoción del uso de la inteligencia artificial en el país, hay algunos temas que no se han abordado o que requieren mayor atención. A continuación, se presentan algunos de estos temas:

1. **Accesibilidad y equidad**: La ley no explora cómo garantizar la accesibilidad y equidad en el uso de la inteligencia artificial, especialmente para personas con discapacidad, minorías y grupos vulnerables.
2. **Transparencia y responsabilidad**: Aunque se menciona la importancia de la transparencia y la responsabilidad en el uso de la inteligencia artificial, no se establecen mecanismos claros para garantizar la transparencia en la toma de decisiones y la responsabilidad en caso de errores o daños causados por sistemas de inteligencia artificial.
3. **Privacidad y protección de datos**: La ley no aborda de manera explícita la protección de datos personales y la privacidad en el contexto de la inteligencia artificial. Es importante establecer normas

# Química Bioinorgánica

In [None]:
entrada = """What is the meaning of bioinorganic chemistry?"""

In [None]:
messages = [
    {"role"   : "system",
     "content": "You are a helpful assistant, specialist in medicinal chemistry"},
    {"role"   : "user",
     "content": entrada},
]

prompt = pipeline.tokenizer.apply_chat_template(
        messages,
        tokenize=False,
        add_generation_prompt=True
)

terminators = [
    pipeline.tokenizer.eos_token_id,
    pipeline.tokenizer.convert_tokens_to_ids("<|eot_id|>")
]

outputs = pipeline(
    prompt,
    max_new_tokens=256,
    eos_token_id=terminators,
    do_sample=True,
    temperature=0.6,
    top_p=0.9,
)

print(outputs[0]["generated_text"][len(prompt):])

Bioinorganic chemistry is a subfield of chemistry that deals with the study of the interactions between metal ions and biological systems. It is an interdisciplinary field that combines concepts from biochemistry, inorganic chemistry, and biology to understand the roles of metal ions in biological processes.

In bioinorganic chemistry, researchers investigate the ways in which metal ions, such as iron, copper, zinc, and others, interact with biomolecules, including proteins, nucleic acids, and lipids. This field is concerned with understanding how metal ions are transported, stored, and utilized by living organisms, as well as how they can be used as therapeutic agents or diagnostic tools.

Some of the key areas of focus in bioinorganic chemistry include:

1. Metal ion transport and homeostasis: How metal ions are absorbed, transported, and regulated within the body.
2. Metal ion-protein interactions: How metal ions bind to and interact with proteins, influencing their structure, funct

# Código SMILES

In [None]:
entrada = """Escribe el código SMILES de los principales fármacos utilizados contra la tuberculosis"""

In [None]:
messages = [
    {"role"   : "system",
     "content": "You are a helpful assistant, specialist in medicinal chemistry"},
    {"role"   : "user",
     "content": entrada},
]

prompt = pipeline.tokenizer.apply_chat_template(
        messages,
        tokenize=False,
        add_generation_prompt=True
)

terminators = [
    pipeline.tokenizer.eos_token_id,
    pipeline.tokenizer.convert_tokens_to_ids("<|eot_id|>")
]

outputs = pipeline(
    prompt,
    max_new_tokens=256,
    eos_token_id=terminators,
    do_sample=True,
    temperature=0.6,
    top_p=0.9,
)

print(outputs[0]["generated_text"][len(prompt):])

¡Claro! A continuación, te proporciono el código SMILES de algunos de los principales fármacos utilizados contra la tuberculosis:

1. Isoniazida (INH): CC(=O)Nc1ccc(cc1)N
2. Rifampicina: CC(=O)Nc1ccc(cc1)N(C)C(=O)Nc2ccc(cc2)N
3. Rifabutina: CC(=O)Nc1ccc(cc1)N(C)C(=O)Nc2ccc(cc2)N(C)C
4. Ethambutol: CC(=O)Nc1ccc(cc1)N(C)C(=O)Nc2ccc(cc2)N(C)CC
5. Pyrazinamida (PZA): CC(=O)Nc1ccc(cc1)N
6. Ethionamida: CC(=O)Nc1ccc(cc1)N(C)C
7. Streptomicina: CC(=O)Nc1ccc(cc1)N(C)C(=O)Nc2ccc(cc2)N(C)C
8. Capreomicina: CC(=O)N


# EJERCICIOS

Emplea las preguntas de investigación del apartado 1 para generar texto y elabora mapas mentales/diagramas de procesos usando **https://edotor.net/** y **https://xmind.ai/**