Importação de Dependências

In [None]:
from transformers import AutoTokenizer
import gem
from gem.tools.python_code_tool import PythonCodeTool
from gem.tools.tool_env_wrapper import ToolEnvWrapper
from gem.wrappers.wrapper_factory import WRAPPER_FACTORY

Na primeira execução, o modelo será baixado, o que pode levar algum tempo.

Isto ocorre via linha de comando:

```python
AutoTokenizer.from_pretrained(model)
```

Durante sua execução, o modelo baixado do Hugging Face será armazenado em cache no diretório `~/.cache/huggingface/transformers`.


In [3]:
env = gem.make("math:GSM8K")
tool = PythonCodeTool()
wrapped_env = ToolEnvWrapper(env, tools=[tool])

models = [
  "microsoft/Phi-4-mini-instruct",
  "Qwen/Qwen3-0.6B",
  "deepseek-ai/DeepSeek-R1"
]

for model in models:  
  print(f"=== Using model: {model} ===")
  wrapped_env = WRAPPER_FACTORY["concat_chat"](
    wrapped_env, tokenizer=AutoTokenizer.from_pretrained(model)
  )
  obs, info = wrapped_env.reset()

  # we ignore the obs and use a dummy action
  dummy_action = "<think>Let me compare 9.9 and 9.11 using python.</think><python>print('9.9 > 9.11?', 9.9 > 9.11)</python>"
  obs, reward, terminated, truncated, info = wrapped_env.step(dummy_action)
  print(obs)
  # continue to sample the next response given the tool results ...

  wrapped_env.close()
  print(f"=== Finished using model: {model} ===")

=== Using model: microsoft/Phi-4-mini-instruct ===
<|user|>Three siblings are born 5 years apart, each. If the eldest child is 20 years old now, what's the total of the ages of the three siblings 10 years from now?
Solve the above problem step by step. You now have the ability to selectively write executable Python code to enhance your reasoning process. The Python code will be executed by an external sandbox, and the output (after "Code execution result: ") is returned to aid your reasoning and help you arrive at the final answer. The Python code should be complete scripts, including necessary imports, wrapped within <python>...</python> tags or using ```python...``` code block. Return your final answer within \boxed{}.<|end|><|assistant|><think>Let me compare 9.9 and 9.11 using python.</think><python>print('9.9 > 9.11?', 9.9 > 9.11)</python><|end|><|tool|>Code execution result: 9.9 > 9.11? True

<|end|><|assistant|>
=== Finished using model: microsoft/Phi-4-mini-instruct ===
=== Usin

O exemplo acima demonstra como utilizar diferentes modelos de linguagem para interagir com um ambiente de resolução de problemas matemáticos, utilizando ferramentas de código Python para auxiliar na resolução.

Ao executar o código, cada modelo será carregado, e uma ação dummy será enviada ao ambiente, ilustrando a integração entre o modelo de linguagem e a ferramenta de código Python.