In [2]:
import guidance
import os
from dotenv import load_dotenv
load_dotenv('./env.txt')

True

## Algunos patterns

### Generar text dentro de variable

{{gen 'variable' **kwargs}}

example:<br> 
{{gen 'name' temperature=0.0 max_tokens=10 stop=","}}

### Elegir entre opciones
options = ["A", "B", "C", "D"] <br>
{{select 'RESPUESTA' options=options}}



In [3]:
llm = guidance.llms.OpenAI("text-davinci-003")

In [4]:
llm.api_key = os.environ['OPENAI_API_KEY']

# Simple token constraints

In [5]:
options = ["A", "B", "C", "D"]

tipo_test = guidance("""\
Pregunta: Sevilla es una ciudad ubicada en que parte de Espana
A) Sur
B) Norte
C) Este
D) Afuera de Espana
Respuesta: "{{select 'RESPUESTA' options=options}}"\
""")

In [6]:
a = tipo_test(llm=llm, options=options)

In [7]:
a.variables().get('RESPUESTA')

'A'

# Distribution

In [8]:
# Does not work, is an active issue: https://github.com/guidance-ai/guidance/issues/381

sentiment = guidance("""
    Por favor, describe el sentimiento de la siguiente frase como positivo, neutral o negativo:
    
    {{input}}
    
    El sentimento de la frase es {{#select "SENTIMENT" logprobs='logprobs' temperature=0.001}} Positivo{{or}} Neutral{{or}} Negativo{{/select}}
""")

In [9]:
a = sentiment(input='Hoy estoy muy feliz!', llm=llm)

In [11]:
logits = a.variables()
logits

{'llm': <guidance.llms._openai.OpenAI at 0x7f52bab1b5b0>,
 'logging': False,
 'input': 'Hoy estoy muy feliz!',
 '@raw_prefix': '\n    Por favor, describe el sentimiento de la siguiente frase como positivo, neutral o negativo:\n    \n    {{!--GMARKER_START_variable_ref$&#123;&#123;input&#125;&#125;$--}}Hoy estoy muy feliz!{{!--GMARKER_END_variable_ref$$--}}\n    \n    El sentimento de la frase es {{!--GMARKER_START_select$&#123;&#123;#select "SENTIMENT" logprobs=\'logprobs\' temperature=0.001&#125;&#125; Positivo&#123;&#123;or&#125;&#125; Neutral&#123;&#123;or&#125;&#125; Negativo&#123;&#123;/select&#125;&#125;$--}}'}

# JSON

In [12]:
jsonize = guidance("""\
Por favor, coloca el texto a continuación en un formato JSON estructurado:

IA Generativa Sevilla es un grupo de meetup colocada en Sevilla, Espana. El organizador es Mathias.
El evento de hoy trata de dominando un LLM utilizando Guidance

```json
{
    "meetup-name": {{gen 'name' temperature=0.01 max_tokens=10 stop=","}},
    "organizer": {{gen 'organizadores' temperature=0.01 max_tokens=7 stop=","}},
    "event-description": {{gen 'description' temperature=0.01 max_tokens=20 stop=","}}
}```             
""")

In [13]:
a = jsonize(llm=llm)

In [14]:
a.variables()

{'llm': <guidance.llms._openai.OpenAI at 0x7f52bab1b5b0>,
 'logging': False,
 '@raw_prefix': 'Por favor, coloca el texto a continuación en un formato JSON estructurado:\n\nIA Generativa Sevilla es un grupo de meetup colocada en Sevilla, Espana. El organizador es Mathias.\nEl evento de hoy trata de dominando un LLM utilizando Guidance\n\n```json\n{\n    "meetup-name": {{!--GMARKER_START_gen$&#123;&#123;gen \'name\' temperature=0.01 max_tokens=10 stop=","&#125;&#125;$--}} "IA Generativa Sevilla"{{!--GMARKER_END_gen$$--}},\n    "organizer": {{!--GMARKER_START_gen$&#123;&#123;gen \'organizadores\' temperature=0.01 max_tokens=7 stop=","&#125;&#125;$--}} "Mathias"{{!--GMARKER_END_gen$$--}},\n    "event-description": {{!--GMARKER_START_gen$&#123;&#123;gen \'description\' temperature=0.01 max_tokens=20 stop=","&#125;&#125;$--}} "Dominando un LLM utilizando Guidance"{{!--GMARKER_END_gen$$--}}\n}```             \n',
 'name': ' "IA Generativa Sevilla"',
 'organizadores': ' "Mathias"',
 'descripti

# Python functions

In [15]:
def get_length(word):
    return len(word)

In [16]:
pf = guidance('''
La palabra mas larga en Espanol que conozco es: {{gen 'word' temperature=1.0 stop=" "}}

Esta palabra tiene {{get_length word}} letras
''')

In [17]:
a = pf(llm=llm, get_length=get_length)

In [18]:
a.variables()

{'llm': <guidance.llms._openai.OpenAI at 0x7f52bab1b5b0>,
 'logging': False,
 'get_length': <function __main__.get_length(word)>,
 '@raw_prefix': '\nLa palabra mas larga en Espanol que conozco es: {{!--GMARKER_START_gen$&#123;&#123;gen \'word\' temperature=1.0 stop=" "&#125;&#125;$--}}\n\nanticonstitucionalmente.{{!--GMARKER_END_gen$$--}}\n\nEsta palabra tiene {{!--GMARKER_START_get_length$&#123;&#123;get_length word&#125;&#125;$--}}26{{!--GMARKER_END_get_length$$--}} letras\n',
 'word': '\n\nanticonstitucionalmente.'}

# Control flows

In [22]:
# If

ifs = guidance('''
La palabra mas larga en Espanol que conozco es: {{gen 'word' temperature=1.0 stop=" "}}

{{#if len(word) > 10}}Esta palabra es super larga{{/if}}
               
{{#if len(word) < 10}}Esta palabra es no tan larga{{/if}}
''')

In [23]:
a = ifs(llm=llm, get_length=get_length)

# Open Source models

In [24]:
llama = guidance.llms.Transformers("meta-llama/Llama-2-7b-chat-hf", token=os.environ['HUGGINGFACE_TOKEN'])

Downloading (…)okenizer_config.json:   0%|          | 0.00/776 [00:00<?, ?B/s]

Downloading tokenizer.model:   0%|          | 0.00/500k [00:00<?, ?B/s]

Downloading (…)/main/tokenizer.json:   0%|          | 0.00/1.84M [00:00<?, ?B/s]

Downloading (…)cial_tokens_map.json:   0%|          | 0.00/414 [00:00<?, ?B/s]

Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]



In [25]:
a = jsonize(llm=llama)

In [26]:
a = pf(llm=llama, get_length=get_length)

In [47]:
# Does not work, is an active issue: https://github.com/guidance-ai/guidance/issues/381

a = sentiment(input='Hoy estoy muy feliz!', llm=llama)