<a href="https://colab.research.google.com/github/rafaeljosem/MNA-ProyectoIntegrador_EQ10/blob/main/Avance-3/JSON_creation.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Configuración del notebook

In [None]:
"""
Install the Google AI Python SDK

$ pip install google-generativeai

See the getting started guide for more information:
https://ai.google.dev/gemini-api/docs/get-started/python
"""

In [1]:
%%capture
!pip install -q -U google-generativeai

In [2]:
import os
import google.generativeai as genai
from google.colab import userdata
%load_ext cudf.pandas
import pandas as pd

In [None]:
"""
Set the 'GEMINI_API_KEY' in your Google Colab's Secrets tab to access Gemini.
"""

In [3]:
GEMINI_API_KEY = userdata.get('GEMINI_API_KEY')

In [4]:
genai.configure(api_key=GEMINI_API_KEY)

In [5]:
# Create the model
# See https://ai.google.dev/api/python/google/generativeai/GenerativeModel

generation_config = {
  "temperature": 1,
  "top_p": 0.95,
  "top_k": 64,
  "max_output_tokens": 8192,
  "response_mime_type": "text/plain",
}

safety_settings = [
  {
    "category": "HARM_CATEGORY_HARASSMENT",
    "threshold": "BLOCK_MEDIUM_AND_ABOVE",
  },
  {
    "category": "HARM_CATEGORY_HATE_SPEECH",
    "threshold": "BLOCK_MEDIUM_AND_ABOVE",
  },
  {
    "category": "HARM_CATEGORY_SEXUALLY_EXPLICIT",
    "threshold": "BLOCK_MEDIUM_AND_ABOVE",
  },
  {
    "category": "HARM_CATEGORY_DANGEROUS_CONTENT",
    "threshold": "BLOCK_MEDIUM_AND_ABOVE",
  },
]

# Código Civil Federal

In [None]:
"""
Load 'CÓDIGO CIVIL FEDERAL_texto (1).txt' file into Google Colab file directory
"""

In [6]:
with open('CÓDIGO CIVIL FEDERAL_texto (1).txt') as file:
  text_data = file.read()

# Print first 10 lines
for line in text_data.splitlines()[55:70]:
  print(line)



  

CÓDIGO CIVIL FEDERAL 
 

Nuevo Código publicado en el Diario Oficial de la Federación en cuatro partes 
los días 26 de mayo, 14 de julio, 3 y 31 de agosto de 1928 

 
TEXTO VIGENTE 

Última reforma publicada DOF 09-03-2018 

 


In [7]:
model = genai.GenerativeModel(
  model_name="gemini-1.5-flash-latest",
  safety_settings=safety_settings,
  generation_config=generation_config,
  system_instruction="""Eres un experto en inteligencia artificial, trabajas en el desarrollo de Large Language Models. \
  Estás encargado del desarrollo de un modelo de lenguaje experto en el dominio de las leyes mexicanas, para lo cual estás creando un dataset de tipo instruction tuning. \
  Hasta el momento, has recabado más de 300 leyes mexicanas, de las cuales requieres extraer información relevante y generar el dataset con preguntas y \
  respuestas basados en los documentos legislativos. Te estoy compartiendo la primera ley, vas a analizarla, entender la estructura general el documento, \
  y vas a generar un JSON donde cada registro contenga información de un artículo, y donde cada registro contenga \n\n

  'ley': Se refiere al nombre de la ley, por ejemplo, \"Código Federal de Procedimientos Civiles\"\n
  'libro_no': Se refiere al número de libro al que pertenece, por ejemplo, \"LIBRO SEGUNDO\"\n
  'libro_nombre': Se refiere al nombre del libro, por ejemplo, \"De los Bienes\"\n
  'titulo_no' Se refiere al número de título, por ejemplo, \"TITULO SEGUNDO\"\n
  'titulo_nombre' Se refiere al nombre del título, por ejemplo, \"De la Sucesión por Testamento\"\n
  'capitulo_no': Se refiere al número de capítulo (solo si aplica, en caso de no pertenecer a un capítulo, declarar \"N/A\"), por ejemplo, \"CAPITULO I\"\n
  'capitulo_nombre': Se refiere al nombre del capítulo, por ejemplo, \"De los Testamentos en General\"\n
  'articulo_no': Se refiere al número de artículo, por ejemplo, \"Artículo 1413\n
  'articulo_contenido': Se refiere al contenido del artículo, por ejemplo, \"Queda también sin efecto el legado, si el testador enajena la cosa legada; \
  pero vale si la recobra por un título legal.\"\n\n

  Por ejemplo:
  [
    {
      "ley": "Código Civil Federal",
      "libro_no": "LIBRO TERCERO",
      "libro_nombre": "De las Sucesiones",
      "titulo_no": "TITULO SEGUNDO",
      "titulo_nombre": "De la Sucesión por Testamento",
      "capitulo_no": "CAPITULO I",
      "capitulo_nombre": "N/A",
      "articulo_no": "Artículo 1295",
      "articulo_contenido": "Testamento es un acto personalísimo, revocable y libre, por el cual una persona capaz dispone de sus bienes y derechos, y declara o cumple deberes para después de su muerte."
    }
  ]

  Extrae un JSON con solamente 10 registros, elige los artículos de forma aleatoria.""",
)

In [8]:
chat_session = model.start_chat(
  history=[
    {
      "role": "user",
      "parts": [
        "¿Quién eres?",
      ],
    },
    {
      "role": "model",
      "parts": [
        "Soy un experto en inteligencia artificial, trabajo en el desarrollo de Large Language Models.",
      ],
    },
  ]
)

json_output = chat_session.send_message("A continuación encontrarás la ley de la cual extraerás el JSON:\n---\n" + text_data + "---")

In [9]:
print(json_output.text)

```json
[
  {
    "ley": "Código Civil Federal",
    "libro_no": "LIBRO PRIMERO",
    "libro_nombre": "De las Personas",
    "titulo_no": "TITULO PRIMERO",
    "titulo_nombre": "De las Personas Físicas",
    "capitulo_no": "N/A",
    "capitulo_nombre": "N/A",
    "articulo_no": "Artículo 22",
    "articulo_contenido": "La capacidad jurídica de las personas físicas se adquiere por el nacimiento y se pierde por la muerte; pero desde el momento en que un individuo es concebido, entra bajo la protección de la ley y se le tiene por nacido para los efectos declarados en el presente Código."
  },
  {
    "ley": "Código Civil Federal",
    "libro_no": "LIBRO PRIMERO",
    "libro_nombre": "De las Personas",
    "titulo_no": "TITULO SEGUNDO",
    "titulo_nombre": "De las Personas Morales",
    "capitulo_no": "N/A",
    "capitulo_nombre": "N/A",
    "articulo_no": "Artículo 26",
    "articulo_contenido": "Las personas morales pueden ejercitar todos los derechos que sean necesarios para realizar e

In [11]:
prompt_2 = """Ahora, tomando en cuenta el contenido de la ley compartida anteriormente, por favor genera 5 ejemplos de plantillas de tipo "Question Answering (QA)", "Summarization", "Legal Advice Generation" y "Legal Document Drafting", siguiendo el formato de pares instruction-output.
Ejemplo de Question Answering (QA):
[
{
"instruction": "Según el artículo 22 del Código Civil Federal, ¿desde qué momento entra el individuo concebido bajo la protección de la ley?",
"output": "De acuerdo al artículo 22 del Código Civil Federal, desde el momento en que un individuo es concebido, entra bajo la protección de la ley y se le tiene por
nacido para los efectos declarados en el presente Código."
},
{
"instruction": "¿Qué establece el artículo 23 del Código Civil Federal sobre el ejercicio de derechos de los incapaces?",
"output": "Según el artículo 23 del Código Civil Federal, la minoría de edad, el estado de interdicción y demás incapacidades establecidas por la ley, son
restricciones a la personalidad jurídica que no deben menoscabar la dignidad de la persona ni atentar contra la integridad de la familia; pero los incapaces pueden ejercitar sus derechos o contraer obligaciones por medio de sus representantes."
}
]
Ejemplos de Summarization:
[
{
"instruction": "Resume las obligaciones del Juez del Registro Civil respecto a las actas, según los artículos 43 a 49 del Código Civil Federal.",
"output": "De acuerdo a los artículos 43 a 49 del Código Civil Federal, el Juez del Registro Civil tiene las siguientes obligaciones respecto a las actas: asentar sólo lo
declarado para el acto y previsto en la ley; permitir la representación por mandatario especial; preferir testigos designados por los interesados; evitar falsificación o
inserción de circunstancias prohibidas; corregir vicios o defectos no sustanciales; dar testimonio de actas; y autorizar actas de su propia familia en la adscripción
más próxima."
},
{
"instruction": "Sintetiza lo que establece el Código Civil Federal en los artículos del 86 al 88 sobre la adopción plena.",
"output": "Los artículos 86, 87 y 88 del Código Civil Federal establecen que en la adopción plena se levantará un acta como si fuera de nacimiento, se harán
anotaciones en el acta de nacimiento originaria, la cual quedará reservada. No se publicará ni expedirá constancia alguna que revele el origen del adoptado ni su
condición, salvo providencia judicial. El artículo 88 fue derogado."
}
]
Ejemplos de Legal Advice Generation:
[
{
"instruction": "Si dos personas quieren contraer matrimonio siendo menores de edad, ¿qué requisitos deben cumplir según el Código Civil Federal?",
"output": "De acuerdo al Código Civil Federal, si dos personas menores de edad quieren contraer matrimonio, deben cumplir los siguientes requisitos: 1) Tener al
menos 16 años el hombre y 14 la mujer (art. 148); 2) Obtener el consentimiento de sus padres, abuelos paternos o tutores (arts. 149-155); 3) Solicitar la dispensa del
juez de lo familiar (art. 151); 4) Presentar su solicitud ante el Juez del Registro Civil (art. 97) con la documentación requerida (art. 98). Se recomienda consultar a un
abogado especializado para recibir orientación específica a su caso."
},
{
"instruction": "¿Qué pasos debe seguir una persona para solicitar una acta de nacimiento según el Código Civil Federal?",
"output": "Para solicitar un acta de nacimiento, el Código Civil Federal establece en sus artículos 54 a 76 el siguiente procedimiento: 1) Presentar al recién nacido
ante el Juez del Registro Civil en su oficina o lugar de nacimiento; 2) Los padres o abuelos declaran el nacimiento dentro de los 6 meses siguientes; 3) Si nace en
casa, el jefe de familia tiene obligación de dar aviso; 4) Si nace en un sanatorio,el director o administrador dará aviso; 5) Se levantará el acta de nacimiento con
asistencia de dos testigos, expresándose todos los datos requeridos por la ley. Es importante cumplir los plazos y proporcionar información veraz para evitar
contratiempos posteriores."
}
]
Ejemplos de Legal Document Drafting:
[
{
"instruction": "Redacta una cláusula para un contrato de compraventa de un inmueble, estipulando que las partes se someten a las leyes mexicanas según el
Código Civil Federal.",
"output": "CLÁUSULA DÉCIMA.- LEY APLICABLE. Para todo lo relativo a la interpretación, cumplimiento y ejecución del presente contrato, las partes acuerdan
someterse a las leyes federales de los Estados Unidos Mexicanos, en particular a las disposiciones del Código Civil Federal, según lo establecido en sus artículos 12,
13 y demás relativos y aplicables, renunciando expresamente a cualquier otra ley, fuero o jurisdicción que pudiera corresponderles en virtud de sus domicilios
presentes o futuros."
},
{
"instruction": "Elabora una cláusula para un contrato de arrendamiento especificando que la renta se incrementará anualmente conforme al Código Civil Federal.",
"output": "CLÁUSULA DÉCIMA.- INCREMENTO DE LA RENTA. Las partes acuerdan que la renta pactada en la cláusula X del presente contrato se incrementará anualmente
de manera automática, aplicando el porcentaje de aumento que corresponda al Índice Nacional de Precios al Consumidor (INPC) publicado por el Banco de México.
Lo anterior con fundamento en lo dispuesto por el artículo 2448-J del Código Civil Federal. El arrendador notificará por escrito al arrendatario, con al menos 30
días de anticipación, el monto de la renta actualizada que entrará en vigor en la fecha de aniversario del contrato."
}
]
Por cada registro del JSON que se encuentra a continuación, genera un par instruction-output de cada tipo ("Question Answering (QA)", "Summarization", "Legal Advice Generation" y "Legal Document Drafting"):
""" + json_output.text

In [14]:
chat_session = model.start_chat(
  history=[
    {
      "role": "user",
      "parts": [
        "¿Quién eres?",
      ],
    },
    {
      "role": "model",
      "parts": [
        "Soy un experto en inteligencia artificial, trabajo en el desarrollo de Large Language Models.",
      ],
    },
    {
      "role": "user",
      "parts": [
        "A continuación encontrarás la ley de la cual extraerás el JSON:\n---\n" + text_data + "---",
      ],
    },
    {
      "role": "model",
      "parts": [
        json_output.text,
      ],
    },
  ]
)

json_output2 = chat_session.send_message(prompt_2)

In [15]:
print(json_output2.text)

```json
[
  {
    "ley": "Código Civil Federal",
    "libro_no": "LIBRO PRIMERO",
    "libro_nombre": "De las Personas",
    "titulo_no": "TITULO PRIMERO",
    "titulo_nombre": "De las Personas Físicas",
    "capitulo_no": "N/A",
    "capitulo_nombre": "N/A",
    "articulo_no": "Artículo 22",
    "articulo_contenido": "La capacidad jurídica de las personas físicas se adquiere por el nacimiento y se pierde por la muerte; pero desde el momento en que un individuo es concebido, entra bajo la protección de la ley y se le tiene por nacido para los efectos declarados en el presente Código."
  },
  {
    "instruction": "Según el artículo 22 del Código Civil Federal, ¿desde qué momento entra el individuo concebido bajo la protección de la ley?",
    "output": "De acuerdo al artículo 22 del Código Civil Federal, desde el momento en que un individuo es concebido, entra bajo la protección de la ley y se le tiene por nacido para los efectos declarados en el presente Código."
  },
  {
    "instruct