<h1 align="center"><font color="red">OpenAI Function Calling Tutorial</font></h1>

<font color="yellow">Data Scientist.: Dr. Eddy Giusepe Chirinos Isidro</font>

Learn how OpenAI's new Function Calling capability enables GPT models to generate structured JSON output, resolving common dev issues caused by irregular outputs.

# <font color="red">What is OpenAI Function Calling?</font>

The [OpenAI API](https://www.datacamp.com/cheat-sheet/the-open-ai-api-in-python) is great at generating the response in a systematic way. You can manage your prompts, optimize the model output, and perform, build, and language applications with few lines of code.

Even with all the good stuff, the OpenAI API was a nightmare for the developers and engineers. Why? They are accustomed to working with structured data types, and working with unstructured data like string is hard.

To get consistent results, developers have to use regular expressions (RegEx) or [prompt engineering](https://www.datacamp.com/blog/what-is-prompt-engineering-the-future-of-ai-communication) to extract the information from the text string.

This is where OpenAI's function calling capability comes in. It allows GPT-3.5 and GPT-4 models to take user-defined functions as input and generate structure output. With this, you don't need to write RegEx or perform prompt engineering.

In this tutorial, we will explore how OpenAI function calling can help resolve common developer problems caused by irregular model outputs.

If you are just starting out with ChatGPT and the OpenAI API, consider taking a look at the [Getting Started with the OpenAI API and ChatGPT](https://www.datacamp.com/code-along/ungated-getting-started-with-the-openai-api-and-chatgpt) webinar. This resource can guide you through language and coding generation and help you perform basic tasks using Python API.

# <font color="red">Using OpenAI Without Function Calling</font>

In this section, we will generate responses using the GPT-3.5-Turbo model without function calling to see if we get consistent output or not.

Before installing the OpenAI Python API, you must obtain an API key and set it up on your local system. Follow the [GPT-3.5 and GPT-4 via the OpenAI API in Python](https://www.datacamp.com/tutorial/using-gpt-models-via-the-openai-api-in-python) tutorial to learn how to get the API key and set it up. The tutorial also includes examples of setting up environment variables in DataCamp Workspace.

For further assistance, check out the Notebook with outputs at [OpenAI Function Calling Workspace](https://app.datacamp.com/workspace/w/3e8b01b3-c46b-42c2-bd38-f3d95ade5d01).

In [None]:
%pip install openai -q

<font color="orange">Escreveremos uma descrição aleatória do aluno. Você pode criar seu próprio texto ou usar o ChatGPT para gerar um para você.</font>

In [9]:
student_1_description = "David Nguyen está no segundo ano com especialização em ciência da computação na Universidade de Stanford. Ele é asiático-americano e \
    tem um GPA de 3,8. David é conhecido por suas habilidades de programação e é um membro ativo do Clube de Robótica da universidade. Ele espera seguir carreira em inteligência artificial depois de se formar."

<font color="orange">Na próxima parte, escreveremos um prompt para extrair informações do aluno do texto e retornar a saída como um objeto JSON. Extrairemos o nome, curso, escola, notas e clubes na descrição do aluno.</font>

In [10]:
# A simple prompt to extract information from "student_description" in a JSON format.
prompt1 = f'''
Extraia as seguintes informações do texto fornecido e retorne-as como um objeto JSON:

nome
curso
Universidade
Notas
clube

Este é o corpo do texto do qual você deve extrair as informações:
{student_1_description}
'''

<font color="orange">Adicione o prompt ao módulo de conclusão (`completion`) de bate-papo da API OpenAI para gerar a resposta.</font>

In [11]:
# Substitua sua chave de API OpenAI:
import openai
import os
from dotenv import load_dotenv, find_dotenv
_ = load_dotenv(find_dotenv()) # read local .env file
openai.api_key  = os.environ['OPENAI_API_KEY']
Eddy_WEAVIATE_API_KEY = os.environ["WEAVIATE_API_KEY"]

In [12]:
import openai

# Gerando resposta de gpt-3.5-turbo:
openai_response = openai.ChatCompletion.create(
    model = 'gpt-3.5-turbo',
    messages = [{'role': 'user', 'content': prompt1}]
)


openai_response['choices'][0]['message']['content']

'{\n  "nome": "David Nguyen",\n  "curso": "ciência da computação",\n  "universidade": "Universidade de Stanford",\n  "notas": "GPA de 3,8",\n  "clube": "Clube de Robótica da universidade"\n}'

<font color="orange">Usaremos a biblioteca json para converter o texto em um objeto `JSON`.</font>

In [13]:
import json

# Carregando a resposta como um objeto JSON:
json_response = json.loads(openai_response['choices'][0]['message']['content'])
json_response

{'nome': 'David Nguyen',
 'curso': 'ciência da computação',
 'universidade': 'Universidade de Stanford',
 'notas': 'GPA de 3,8',
 'clube': 'Clube de Robótica da universidade'}

<font color="orange">Vamos tentar o mesmo prompt, mas usando uma descrição de aluno diferente.</font>

In [14]:
student_2_description="Ravi Patel está no segundo ano com especialização em ciência da computação na Universidade de Michigan. Ele é indiano-americano do sul da Ásia e tem um GPA de 3.7. \
    Ravi é um membro ativo do Clube de Xadrez da universidade e da Associação de Estudantes do Sul da Ásia. Ele espera seguir carreira em engenharia de software após se formar."

Iremos apenas alterar o texto da descrição do aluno no prompt.

In [15]:
prompt2 = f'''
Extraia as seguintes informações do texto fornecido e retorne-as como um objeto JSON:

nome
curso
Universidade
Notas
clube

Este é o corpo do texto do qual você deve extrair as informações:
{student_2_description}
'''

E execute a função de conclusão do chat usando o segundo prompt.

In [16]:
openai_response = openai.ChatCompletion.create(
    model = 'gpt-3.5-turbo',
    messages = [{'role': 'user', 'content': prompt2 }]
)


# Carregando a resposta como um objeto JSON:
json_response = json.loads(openai_response['choices'][0]['message']['content'])
json_response

{'nome': 'Ravi Patel',
 'curso': 'ciência da computação',
 'universidade': 'Universidade de Michigan',
 'notas': 3.7,
 'clube': 'Clube de Xadrez da universidade'}

<font color="orange">Como você pode ver, não é consistente.

* A nota do primeiro aluno é “3,8 GPA”, enquanto na solicitação do segundo aluno obtivemos apenas o número “3,7”. É muito importante quando você está construindo um sistema estável.

* Em vez de devolver um clube, devolveu a lista de clubes aos quais Ravi se juntou. Também é diferente do primeiro aluno. (`Isso aconteceu quando executei várias vezes`)</font>

# <font color="yellow">Exemplo de chamada de função OpenAI</font>

Para resolver esse problema, usaremos agora um recurso introduzido recentemente chamado chamada de função (`Function calling`). É essencial criar uma função customizada para adicionar as informações necessárias a uma lista de dicionários para que a API OpenAI possa compreender sua funcionalidade.

* name: escreva o nome da função Python que você criou recentemente.

* description: a funcionalidade da função.

* parâmetros: dentro das “propriedades”, escreveremos o nome dos argumentos, tipo e descrição. Isso ajudará a API OpenAI a identificar o mundo que procuramos.


`Observação`: certifique-se de seguir o padrão correto. Saiba mais sobre chamadas de funções lendo a [documentação oficial](https://platform.openai.com/docs/guides/function-calling).

In [17]:
student_custom_functions = [
    {
        'name': 'extract_student_info',
        'description': 'Obtenha as informações do aluno no corpo do texto de entrada',
        'parameters': {
            'type': 'object',
            'properties': {
                'name': {
                    'type': 'string',
                    'description': 'Nome do estudante.'
                },
                'major': {
                    'type': 'string',
                    'description': 'Curso que estuda.'
                },
                'school': {
                    'type': 'string',
                    'description': 'Nome da Universidade.'
                },
                'grades': {
                    'type': 'integer',
                    'description': 'GPA do estudante.'
                },
                'club': {
                    'type': 'string',
                    'description': 'Clube escolar para atividades extracurriculares.'
                }
                
            }
        }
    }
]



<font color="orange">A seguir, geraremos respostas para duas descrições de alunos usando uma função personalizada adicionada ao argumento "funções". Depois disso, converteremos a resposta de texto em um objeto JSON e a imprimiremos.</font>

In [18]:
student_description = [student_1_description, student_2_description]

for sample in student_description:
    response = openai.ChatCompletion.create(
        model = 'gpt-3.5-turbo',
        messages = [{'role': 'user', 'content': sample}],
        functions = student_custom_functions,
        function_call = 'auto'
    )


    # Carregando a resposta como um objeto JSON:
    json_response = json.loads(response['choices'][0]['message']['function_call']['arguments'])
    print(json_response)
    

{'name': 'David Nguyen', 'major': 'ciência da computação', 'school': 'Universidade de Stanford', 'grades': 3.8, 'club': 'Clube de Robótica'}
{'name': 'Ravi Patel', 'major': 'Ciência da Computação', 'school': 'Universidade de Michigan', 'grades': 3.7, 'club': 'Clube de Xadrez'}


<font color="orange">Como podemos ver, obtivemos uma produção uniforme. Até obtivemos notas em números em vez de strings. A produção consistente é essencial para criar aplicativos de IA livres de bugs.</font>

# <font color="yellow">Várias funções personalizadas</font>

Você pode adicionar várias funções personalizadas à função de conclusão do bate-papo. Nesta seção, veremos os recursos mágicos da API OpenAI e como ela seleciona automaticamente a função correta e retorna os argumentos corretos.

Na lista Python do dicionário, adicionaremos outra função chamada “extract_school_info”, que nos ajudará a extrair informações universitárias do texto.

Para conseguir isso, você deve adicionar outro dicionário de uma função com nome, descrição e parâmetros.

In [19]:
custom_functions = [
    {
        'name': 'extract_student_info',
        'description': 'Obtenha as informações do aluno no corpo do texto de entrada',
        'parameters': {
            'type': 'object',
            'properties': {
                'name': {
                    'type': 'string',
                    'description': 'Nome do estudante.'
                },
                'major': {
                    'type': 'string',
                    'description': 'Curso que estuda.'
                },
                'school': {
                    'type': 'string',
                    'description': 'Nome da Universidade.'
                },
                'grades': {
                    'type': 'integer',
                    'description': 'GPA do estudante.'
                },
                'club': {
                    'type': 'string',
                    'description': 'Clube escolar para atividades extracurriculares. '
                }
                
            }
        }
    },
    {
        'name': 'extract_school_info',
        'description': 'Obtenha as informações da escola no corpo do texto de entrada',
        'parameters': {
            'type': 'object',
            'properties': {
                'name': {
                    'type': 'string',
                    'description': 'Nome da Universidade.'
                },
                'ranking': {
                    'type': 'integer',
                    'description': 'Ranking mundial QS da Universidade.'
                },
                'country': {
                    'type': 'string',
                    'description': 'País da Universidade.'
                },
                'no_of_students': {
                    'type': 'integer',
                    'description': 'Número de alunos matriculados na Universidade.'
                }
            }
        }
    }
]

<font color="orange">Geraremos uma descrição da “Universidade de Stanford” usando ChatGPT para testar nossa função.</font>

In [20]:
school_1_description = "A Universidade de Stanford é uma universidade privada de pesquisa localizada em Stanford, Califórnia, Estados Unidos. Foi fundada em \
    1885 por Leland Stanford e sua esposa, Jane Stanford, em memória de seu único filho, Leland Stanford Jr. A universidade está classificada em 5º lugar no \
        mundo pelo QS World University Rankings. Tem mais de 17 mil alunos, incluindo cerca de 7.600 alunos de graduação e 9.500 graduados23."


Crie a lista de descrições de alunos e escolas e passe-a pela função de completion de chat OpenAI para gerar a resposta. Certifique-se de ter fornecido a função personalizada atualizada.

In [21]:
description = [student_1_description, school_1_description]

for i in description:
    response = openai.ChatCompletion.create(
        model = 'gpt-3.5-turbo',
        messages = [{'role': 'user', 'content': i}],
        functions = custom_functions,
        function_call = 'auto'
    )

    # Carregando a resposta como um objeto JSON:
    json_response = json.loads(response['choices'][0]['message']['function_call']['arguments'])
    print(json_response)
    

{'name': 'David Nguyen', 'major': 'Ciência da Computação', 'school': 'Universidade de Stanford', 'grades': 3.8, 'club': 'Clube de Robótica'}
{'name': 'Universidade de Stanford', 'ranking': 5, 'country': 'Estados Unidos', 'no_of_students': 17000}


<font color="orange">O modelo GPT-3.5-Turbo selecionou automaticamente a função correta para diferentes tipos de descrição. Obtemos uma saída JSON perfeita para o aluno e para a escola.</font>

# <font color="pink">Aplicativo usando chamada de função</font>

<font color="orange">Nesta seção, construiremos um resumo de texto estável que resumirá as informações da escola e dos alunos de uma determinada maneira.

Primeiro, criaremos duas funções `Python`, `extract_student_info` e `extract_school_info`, que pegam os argumentos da chamada da função e retornam uma string resumida.</font>

In [22]:
def extract_student_info(name, major, school, grades, club):
    
    """Obtenha as informações do aluno"""

    return f"{name} está se formando em {major} na {school}. Ele tem {grades} GPA e é membro ativo do conselho da universidade {club}."


def extract_school_info(name, ranking, country, no_of_students):
    
    """Obtenha as informações da escola"""

    return f"{name} está localizado no {country}. A universidade está classificada #{ranking} no mundo com {no_of_students} alunos."

1. Crie a lista Python, que consiste na descrição do aluno um, no prompt aleatório e na descrição da escola um. O prompt aleatório é adicionado para validar a mecânica de chamada automática de função.


2. Iremos gerar a resposta usando cada texto da lista `descrições`.


3. Se for usada uma chamada de função, obteremos o nome da função e, com base nele, aplicaremos os argumentos relevantes à função usando a resposta. Caso contrário, retorne a resposta normal.


4. Imprima as saídas de todas as três amostras.

In [23]:
descriptions = [
    student_1_description, 
    "Quem foi Abraham Lincoln?",
    school_1_description
                ]


for i, sample in enumerate(descriptions):
    response = openai.ChatCompletion.create(
        model = 'gpt-3.5-turbo',
        messages = [{'role': 'user', 'content': sample}],
        functions = custom_functions,
        function_call = 'auto'
    )
    
    response_message = response["choices"][0]["message"]
    

    if response_message.get('function_call'):
        
        # Qual chamada de função foi invocada:
        function_called = response_message['function_call']['name']
        
        # Extraindo os argumentos:
        function_args  = json.loads(response_message['function_call']['arguments'])
        
        # Nomes de funções:
        available_functions = {
            "extract_school_info": extract_school_info,
            "extract_student_info": extract_student_info
        }
        
        fuction_to_call = available_functions[function_called]
        response_message = fuction_to_call(*list(function_args .values()))
        
    else:
        response_message = response_message['content']
    
    print(f"\nSample#{i+1}\n")

    print(response_message)

    


Sample#1

David Nguyen está se formando em ciência da computação na Universidade de Stanford. Ele tem 3.8 GPA e é membro ativo do conselho da universidade Clube de Robótica.

Sample#2

Abraham Lincoln foi o 16º Presidente dos Estados Unidos, servindo de 1861 até o seu assassinato em 1865. Ele nasceu em 12 de fevereiro de 1809 e era membro do Partido Republicano. Lincoln é lembrado por sua liderança durante a Guerra Civil Americana, durante a qual ele preservou a União, aboliu a escravidão e fortaleceu o governo federal. Ele é amplamente reconhecido como um dos maiores presidentes da história dos Estados Unidos.

Sample#3

Universidade de Stanford está localizado no Estados Unidos. A universidade está classificada #5 no mundo com 17000 alunos.


<font color="orange">`Amostra#1`: O modelo GPT selecionou “extract_student_info” e obtivemos um breve resumo sobre o aluno.


`Amostra#2`: O modelo GPT não selecionou nenhuma função e tratou o prompt como uma pergunta normal e, como resultado, obtivemos a biografia de Abraham Lincoln.


`Amostra#3`: O modelo GPT selecionou “extract_school_info” e obtivemos um breve resumo sobre a Universidade de Stanford.</font>