# Azure OpenAI

Los recursos de Azure OpenAI difieren de los recursos de OpenAI estándar, ya que no se pueden generar incrustaciones a menos que se use un modelo de incrustación. Las regiones donde están disponibles estos modelos se pueden encontrar aquí: https://learn.microsoft.com/en-us/azure/cognitive-services/openai/concepts/models#embeddings-models

Además, las regiones que admiten modelos de incrustación lamentablemente no admiten las últimas versiones (<*>-003) de los modelos de OpenAI, por lo que nos vemos obligados a usar una región para incrustaciones y otra para la generación de texto.

Necesitarás instalar LlamaIndex 🦙.

In [1]:
%pip install llama-index-embeddings-azure-openai
%pip install llama-index-llms-azure-openai

Collecting llama-index-embeddings-azure-openai
  Downloading llama_index_embeddings_azure_openai-0.2.5-py3-none-any.whl.metadata (796 bytes)
Collecting llama-index-core<0.12.0,>=0.11.0 (from llama-index-embeddings-azure-openai)
  Downloading llama_index_core-0.11.21-py3-none-any.whl.metadata (2.4 kB)
Collecting llama-index-embeddings-openai<0.3.0,>=0.2.3 (from llama-index-embeddings-azure-openai)
  Downloading llama_index_embeddings_openai-0.2.5-py3-none-any.whl.metadata (686 bytes)
Collecting llama-index-llms-azure-openai<0.3.0,>=0.2.0 (from llama-index-embeddings-azure-openai)
  Downloading llama_index_llms_azure_openai-0.2.2-py3-none-any.whl.metadata (4.0 kB)
Collecting dataclasses-json (from llama-index-core<0.12.0,>=0.11.0->llama-index-embeddings-azure-openai)
  Downloading dataclasses_json-0.6.7-py3-none-any.whl.metadata (25 kB)
Collecting dirtyjson<2.0.0,>=1.0.8 (from llama-index-core<0.12.0,>=0.11.0->llama-index-embeddings-azure-openai)
  Downloading dirtyjson-1.0.8-py3-none-an

In [2]:
!pip install llama-index

Collecting llama-index
  Downloading llama_index-0.11.21-py3-none-any.whl.metadata (11 kB)
Collecting llama-index-agent-openai<0.4.0,>=0.3.4 (from llama-index)
  Downloading llama_index_agent_openai-0.3.4-py3-none-any.whl.metadata (728 bytes)
Collecting llama-index-cli<0.4.0,>=0.3.1 (from llama-index)
  Downloading llama_index_cli-0.3.1-py3-none-any.whl.metadata (1.5 kB)
Collecting llama-index-indices-managed-llama-cloud>=0.3.0 (from llama-index)
  Downloading llama_index_indices_managed_llama_cloud-0.4.0-py3-none-any.whl.metadata (3.8 kB)
Collecting llama-index-legacy<0.10.0,>=0.9.48 (from llama-index)
  Downloading llama_index_legacy-0.9.48.post3-py3-none-any.whl.metadata (8.5 kB)
Collecting llama-index-multi-modal-llms-openai<0.3.0,>=0.2.0 (from llama-index)
  Downloading llama_index_multi_modal_llms_openai-0.2.3-py3-none-any.whl.metadata (729 bytes)
Collecting llama-index-program-openai<0.3.0,>=0.2.0 (from llama-index)
  Downloading llama_index_program_openai-0.2.0-py3-none-any.whl

In [3]:
from llama_index.llms.azure_openai import AzureOpenAI
from llama_index.embeddings.azure_openai import AzureOpenAIEmbedding
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader
import logging
import sys

logging.basicConfig(
    stream=sys.stdout, level=logging.INFO
)  # logging.DEBUG for more verbose output
logging.getLogger().addHandler(logging.StreamHandler(stream=sys.stdout))

Configuramos el modelo de incrustación (para la recuperación) y llm (para la generación de texto). Tenga en cuenta que no solo necesita los nombres de los modelos (por ejemplo, "text-embedding-ada-002"), sino también los nombres de implementación del modelo (el que eligió al implementar el modelo en Azure). Debe pasar el nombre de la implementación como parámetro cuando inicialice `AzureOpenAI` y `OpenAIEmbedding`.

In [4]:
api_key = "XXXX"
azure_endpoint = "https://<--->.openai.azure.com/"
api_version = "2023-07-01-preview"

llm = AzureOpenAI(
    model="gpt-4o", #usar nombre del modelo
    deployment_name="gpt-4o", #usar nombre del deployment
    api_key=api_key,
    azure_endpoint=azure_endpoint,
    api_version=api_version,
)

In [5]:
# You need to deploy your own embedding model as well as your own chat completion model
embed_model = AzureOpenAIEmbedding(
    model="text-embedding-ada-002", #usar nombre del modelo
    deployment_name="text-embedding-ada-002", #usar nombre del deployment
    api_key=api_key,
    azure_endpoint=azure_endpoint,
    api_version=api_version,
)

In [6]:
from llama_index.core import Settings

Settings.llm = llm
Settings.embed_model = embed_model

In [7]:
documents = SimpleDirectoryReader(
    input_files=["prueba_txt_file.txt"]
).load_data()

ValueError: File prueba_txt_file.txt does not exist.

In [None]:
documents

[Document(id_='bee77497-d4ee-4ea4-a18d-51731f53cc43', embedding=None, metadata={'file_path': 'prueba_txt_file.txt', 'file_name': 'prueba_txt_file.txt', 'file_type': 'text/plain', 'file_size': 910, 'creation_date': '2024-10-18', 'last_modified_date': '2024-10-18'}, excluded_embed_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], excluded_llm_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], relationships={}, text='La ciudad de Chernóbil fue evacuada el 27 de abril de 1986, un día después del accidente nuclear sucedido en la central nuclear Vladímir Ilich Lenin (a 3 kilómetros de la ciudad de Prípiat, actual Ucrania), considerado como el más grave en la Escala Internacional de Accidentes Nucleares (el accidente mayor, nivel 7). Como consecuencia , las personas tuvieron que abandonar sus hogares, personas muertas y heridas, radioactividad liberada, áreas cont

In [None]:
index = VectorStoreIndex.from_documents(documents)

INFO:httpx:HTTP Request: POST https://data-tribe-openai.openai.azure.com//openai/deployments/text-embedding-ada-002/embeddings?api-version=2023-07-01-preview "HTTP/1.1 200 OK"
HTTP Request: POST https://data-tribe-openai.openai.azure.com//openai/deployments/text-embedding-ada-002/embeddings?api-version=2023-07-01-preview "HTTP/1.1 200 OK"


In [None]:
query = "En español, qué ocurrió en Chernóbil?"
query_engine = index.as_query_engine()
answer = query_engine.query(query)

print(answer.get_formatted_sources())
print(f"La consulta fue: {query} \n")
print(f"La respeusta fue: {answer} \n")

INFO:httpx:HTTP Request: POST https://data-tribe-openai.openai.azure.com//openai/deployments/text-embedding-ada-002/embeddings?api-version=2023-07-01-preview "HTTP/1.1 200 OK"
HTTP Request: POST https://data-tribe-openai.openai.azure.com//openai/deployments/text-embedding-ada-002/embeddings?api-version=2023-07-01-preview "HTTP/1.1 200 OK"
INFO:httpx:HTTP Request: POST https://data-tribe-openai.openai.azure.com//openai/deployments/gpt-4o/chat/completions?api-version=2023-07-01-preview "HTTP/1.1 200 OK"
HTTP Request: POST https://data-tribe-openai.openai.azure.com//openai/deployments/gpt-4o/chat/completions?api-version=2023-07-01-preview "HTTP/1.1 200 OK"
> Source (Doc id: 62ad6999-1669-485d-9341-2750f37898e3): La ciudad de Chernóbil fue evacuada el 27 de abril de 1986, un día después del accidente nuclear ...
La consulta fue: En español, qué ocurrió en Chernóbil? 

La respeusta fue: En Chernóbil ocurrió un accidente nuclear el 26 de abril de 1986 en la central nuclear Vladímir Ilich Len