In [1]:
texto = """A Microsoft foi fundada em 4 de abril de 1975 por Bill Gates e Paul Allen, 
em Albuquerque, no estado do Novo M√©xico. O nome "Microsoft" √© uma combina√ß√£o das palavras 
"microcomputador" e "software", refletindo o foco da empresa em software para computadores 
pessoais.
O primeiro grande projeto da Microsoft foi a cria√ß√£o de um sistema operacional para o computador 
Altair 8800, um dos primeiros microcomputadores dispon√≠veis comercialmente. O sistema, denominado 
Altair BASIC, foi desenvolvido em parceria com a MITS (Micro Instrumentation and Telemetry Systems) 
e foi um marco inicial para a Microsoft.
Em 1980, a empresa firmou um contrato significativo com a IBM para fornecer o sistema operacional para 
o novo PC da IBM, o que levou √† cria√ß√£o do MS-DOS. Esse contrato foi um ponto de virada para a Microsoft, 
impulsionando sua expans√£o e dominando o mercado de sistemas operacionais para PCs nos anos seguintes.
Com o sucesso do MS-DOS, a Microsoft se consolidou como l√≠der no setor de software e, em 1985, lan√ßou o Windows, 
um sistema operacional gr√°fico que viria a se tornar a base de sua supremacia no mercado de sistemas operacionais para desktop."""

In [3]:
from langchain.pydantic_v1 import BaseModel, Field
from typing import List
from langchain_core.utils.function_calling import convert_to_openai_function


For example, replace imports like: `from langchain.pydantic_v1 import BaseModel`
with: `from pydantic import BaseModel`
or the v1 compatibility namespace if you are working in a code base that has not been fully upgraded to pydantic 2 yet. 	from pydantic.v1 import BaseModel

  exec(code_obj, self.user_global_ns, self.user_ns)


In [3]:
class Event(BaseModel):
    """Informa√ß√µes sobre um evento ocorrido"""
    date: str = Field(description="Data do evento no formato YYYY-MM-DD")
    event: str = Field(description="Descri√ß√£o do evento extraido do texto")

class EventsList(BaseModel):
    """Lista de eventos para extra√ß√£o"""
    events: List[Event] = Field(description="Conjunto de eventos encontrados no texto fornecido")

tool_events = convert_to_openai_function(EventsList)
tool_events

{'name': 'EventsList',
 'description': 'Lista de eventos para extra√ß√£o',
 'parameters': {'type': 'object',
  'properties': {'events': {'description': 'Conjunto de eventos encontrados no texto fornecido',
    'type': 'array',
    'items': {'description': 'Informa√ß√µes sobre um evento ocorrido',
     'type': 'object',
     'properties': {'date': {'description': 'Data do evento no formato YYYY-MM-DD',
       'type': 'string'},
      'event': {'description': 'Descri√ß√£o do evento extraido do texto',
       'type': 'string'}},
     'required': ['date', 'event']}}},
  'required': ['events']}}

In [4]:
from langchain.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI

prompt = ChatPromptTemplate.from_messages([
    ("system", "Extraia as frases de acontecimento e as extraia integralmente"),
    ("user", "{input}")
])              

chat = ChatOpenAI()

chain = (prompt | chat.bind(functions=[tool_events], 
                            function_call = {"name": "EventsList"}))

In [5]:
chain.invoke({"input": texto})

AIMessage(content='', additional_kwargs={'function_call': {'arguments': '{"events":[{"date":"1975-04-04","event":"A Microsoft foi fundada por Bill Gates e Paul Allen em Albuquerque, Novo M√©xico."},{"date":"1980","event":"A Microsoft firmou um contrato significativo com a IBM para fornecer o sistema operacional para o novo PC da IBM, levando √† cria√ß√£o do MS-DOS."},{"date":"1985","event":"A Microsoft lan√ßou o Windows, um sistema operacional gr√°fico que se tornou a base de sua supremacia no mercado de sistemas operacionais para desktop."}]}', 'name': 'EventsList'}, 'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 118, 'prompt_tokens': 420, 'total_tokens': 538, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'id': 'chatcmpl-C1vzUcpZ32sxVTkiZ

In [6]:
from langchain.output_parsers.openai_functions import JsonOutputFunctionsParser

chain = (prompt |
         chat.bind(functions=[tool_events], function_call={"name": "EventsList"}) |
         JsonOutputFunctionsParser())

chain.invoke({"input": texto})

{'events': [{'date': '1975-04-04',
   'event': 'Microsoft foi fundada por Bill Gates e Paul Allen em Albuquerque, Novo M√©xico.'},
  {'date': '1980',
   'event': 'Microsoft firmou contrato com a IBM para fornecer o sistema operacional para o novo PC da IBM, resultando no MS-DOS.'},
  {'date': '1985',
   'event': 'Microsoft lan√ßou o Windows, sistema operacional gr√°fico.'}]}

### Dados da Web


In [1]:
from langchain_community.document_loaders.web_base import WebBaseLoader

loader = WebBaseLoader("https://www.techtudo.com.br")
page = loader.load()
page

[Document(metadata={'source': 'https://www.techtudo.com.br', 'title': 'TechTudo: tecnologia, celular, computador e games', 'description': 'O TechTudo re√∫ne as principais not√≠cias de tecnologia, reviews de celulares, TVs e computadores, al√©m de dicas sobre aparelhos, aplicativos e softwares.', 'language': 'pt-BR'}, page_content=" TechTudo: tecnologia, celular, computador e games                top e √∫ltimas       Voltar     top e √∫ltimas    √∫ltimas do techtudo     not√≠cias     comparativos     dicas e tutoriais     guias     listas     reviews     v√≠deos     tudo sobre     webstories       celulares e tablets       Voltar     celulares e tablets    not√≠cias de celulares     celulares     tablets     telefonia     smartwatches     e-reader     android     iOS     f√≥rum     --     iPhone 14     iphone 13     galaxy s22 ultra     moto g stylus     redmi note 10       jogos       Voltar     jogos    not√≠cias de jogos     jogos casuais     jogos de esportes     jogos de terror    

In [4]:
class BlogPost(BaseModel):
    """Detalhes sobre uma postagem de Blog"""
    title: str = Field(description="T√≠tulo da postagem do Blog")
    author: str = Field(description="Nome do autor da postagem do blog")

class BlogSite(BaseModel):
    """Conjunto de postagem de um Blog de um site espec√≠fico"""
    posts: List[BlogPost] = Field(description="Cole√ß√£o de postagens de blog do site")

tool_blog = convert_to_openai_function(BlogSite)
tool_blog

{'name': 'BlogSite',
 'description': 'Conjunto de postagem de um Blog de um site espec√≠fico',
 'parameters': {'type': 'object',
  'properties': {'posts': {'description': 'Cole√ß√£o de postagens de blog do site',
    'type': 'array',
    'items': {'description': 'Detalhes sobre uma postagem de Blog',
     'type': 'object',
     'properties': {'title': {'description': 'T√≠tulo da postagem do Blog',
       'type': 'string'},
      'author': {'description': 'Nome do autor da postagem do blog',
       'type': 'string'}},
     'required': ['title', 'author']}}},
  'required': ['posts']}}

In [6]:
from langchain.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI
from langchain.output_parsers.openai_functions import JsonOutputFunctionsParser

prompt = ChatPromptTemplate.from_messages([
    ("system", "Extraia da pagina os posts do blog com as informa√ß√µes especificadas"),
    ("user", "{input}")
])              

chat = ChatOpenAI()

chain = (prompt | chat.bind(functions=[tool_blog], 
                            function_call = {"name": "BlogSite"}) | 
                            JsonOutputFunctionsParser(key_name='posts'))

In [7]:
chain.invoke({"input": page})

{'posts': [{'title': 'TELAS DE CINEMA: Smart TV 4K: conhe√ßa 6 op√ß√µes com √≥timo custo-benef√≠cio',
   'author': 'TechTudo'},
  {'title': 'EA FC 26 CHEGANDO: 10 coisas para aproveitar no finalzinho do EA FC 25',
   'author': 'TechTudo'},
  {'title': 'J√Å TESTOU? 7 extens√µes do Google Chrome que o deixam mais seguro',
   'author': 'TechTudo'},
  {'title': 'BATALHA DE INTERMEDI√ÅRIOS: Galaxy A36 vs Galaxy A56: veja o que muda entre os celulares Samsung',
   'author': 'TechTudo'}]}