# 8 - Cadena TEXT2SQL

<img src="https://raw.githubusercontent.com/Hack-io-AI/ai_images/main/langchain.jpeg" style="width:400px;"/>

<h1>Tabla de Contenidos<span class="tocSkip"></span></h1>
<div class="toc"><ul class="toc-item"><li><span><a href="#1---Cadena-TEXT2SQL" data-toc-modified-id="1---Cadena-TEXT2SQL-1">1 - Cadena TEXT2SQL</a></span></li></ul></div>

## 1 - Cadena TEXT2SQL

Podemos usar LangChain para consultar una base de datos SQL y generar consultas SQL basadas en las preguntas del usuario. Requiere de dos partes, una que genera la query de SQL y otra que la ejecuta e interpreta el resultado. Veamos un ejemplo.


In [1]:
# cargamos la API KEY de OpenAI

from dotenv import load_dotenv 
import os

# carga de variables de entorno
load_dotenv()


# api key openai, nombre que tiene por defecto en LangChain
OPENAI_API_KEY = os.getenv('OPENAI_API_KEY')

In [2]:
# importamos librerias

from langchain_openai import ChatOpenAI

from langchain.prompts import ChatPromptTemplate

from langchain.schema.output_parser import StrOutputParser

from langchain.utilities import SQLDatabase

from langchain.schema.runnable import RunnablePassthrough

In [3]:
# iniciamos el modelo de OpenAI

modelo = ChatOpenAI()

In [4]:
# parser de salida, transforma la salida a string

parser = StrOutputParser()

In [5]:
# definimos el primer prompt

plantilla_sql = '''Basado en el esquema de la tabla a continuación, escribe una consulta SQL 
                   que responda a la pregunta del usuario:
              
                   {esquema}
              
                   Pregunta: {pregunta}
              
                   Query SQL:'''


prompt_sql = ChatPromptTemplate.from_template(plantilla_sql)

In [6]:
# conexion a la base de datos mysql

uri = 'mysql+pymysql://root:password@localhost:3306/publications'

db = SQLDatabase.from_uri(uri)

In [7]:
# descripcion de la base de datos

db.get_table_info()[:300].split('\n')

['',
 'CREATE TABLE authors (',
 '\tau_id VARCHAR(11) NOT NULL, ',
 '\tau_lname VARCHAR(40) NOT NULL, ',
 '\tau_fname VARCHAR(20) NOT NULL, ',
 '\tphone CHAR(12) NOT NULL, ',
 '\taddress VARCHAR(40), ',
 '\tcity VARCHAR(20), ',
 '\tstate CHAR(2), ',
 '\tzip CHAR(5), ',
 '\tcontract TINYINT NOT NULL, ',
 '\tPRIMARY KEY (au_id)',
 ')ENGINE=InnoDB DEFAULT CHARS']

In [8]:
# cadena creadora de queries

cadena_sql = (RunnablePassthrough.assign(esquema=lambda _: db.get_table_info())
              
              | prompt_sql
              
              | modelo.bind(stop=["\nSQLResult:"])
              
              | parser
             
             )

In [9]:
# respuesta de la cadena sql

respuesta_sql = cadena_sql.invoke({'pregunta': '¿cuantos empleados hay?'})

respuesta_sql

'SELECT COUNT(*) AS total_empleados\nFROM employee;'

In [10]:
# ejecucion de la query

db.run(respuesta_sql)

'[(43,)]'

In [11]:
# definimos el segundo prompt

plantilla = '''Basado en el esquema de la tabla a continuación, 
               la pregunta, la consulta SQL y la respuesta SQL, 
               escribe una respuesta en lenguaje natural:
               
               {esquema}

               Pregunta: {pregunta}
               Query SQL: {query}
               Respuesta SQL: {respuesta}'''


prompt = ChatPromptTemplate.from_template(plantilla)

In [12]:
# cadena completa

cadena = (RunnablePassthrough.assign(query=cadena_sql)
          
          | RunnablePassthrough.assign(esquema=lambda _: db.get_table_info(),
                                       respuesta=lambda x: db.run(x['query']))
          
          | prompt
          
          | modelo
          
          | parser
         
         )

In [13]:
# respuesta de la cadena completa

cadena.invoke({'pregunta': '¿cuantos empleados hay?'})

'Hay un total de 43 empleados.'