# Voz - Texto

In [None]:
import sounddevice as sd
from scipy.io.wavfile import write

# Parámetros de grabación
fs = 44100  # Frecuencia de muestreo
duration = 5  # Duración en segundos
filename = "grabacion.wav"

print("🎤 Grabando...")
audio = sd.rec(int(duration * fs), samplerate=fs, channels=1)
sd.wait() 
write(filename, fs, audio)
print(f"✅ Grabación finalizada. Archivo guardado como '{filename}'")


🎤 Grabando...
✅ Grabación finalizada. Archivo guardado como 'grabacion.wav'


In [None]:
import subprocess

# Ver si ffmpeg está disponible y que no cause errores 
try:
    subprocess.run(["ffmpeg", "-version"], check=True)
    print("✅ ffmpeg está instalado correctamente.")
except FileNotFoundError:
    print("❌ ffmpeg NO está instalado o no está en el PATH.")


✅ ffmpeg está instalado correctamente.


In [10]:
import whisper

# Cargar el modelo ("base","small", "medium", o "large")
model = whisper.load_model("medium")

# Transcribir el audio
result = model.transcribe("grabacion.wav", language="es")

# Mostrar el resultado
print("📝 Texto transcrito:")
print(result["text"])


📝 Texto transcrito:
 Esta es una pequeña prueba a ver si Whispers es capaz de pasar la voz al texto


# Texto - Texto (LLM o Transformers)

## LM Studio 

In [2]:
from openai import OpenAI

client = OpenAI(base_url="http://localhost:1234/v1", api_key="lm-studio")


entrada_texto = "Puedes ayudarme a traducir a inglés lo siguiente: La inteligencia artificial permite que las máquinas tomen decisiones complejas. Actualmente, se usa en áreas como medicina, finanzas y transporte."

completion = client.chat.completions.create(
    model="local-model",
    messages=[
        {"role": "system", "content": "Eres un asistente útil y amable que responde en español."},
        {"role": "user", "content": entrada_texto}
    ],
    temperature=0.7,
    # max_tokens=100, # Limitar la longitud de la respuesta.
)

# 4. Mostrar el resultado
print("✨ Respuesta del LLM:")
print(completion.choices[0].message.content)

✨ Respuesta del LLM:
Claro, aquí tienes la traducción al inglés:

"Artificial intelligence enables machines to make complex decisions. Currently, it is used in areas such as medicine, finance, and transportation." 

Si necesitas más ayuda o alguna otra traducción, no dudes en decírmelo.


In [3]:
from openai import OpenAI

client = OpenAI(base_url="http://localhost:1234/v1", api_key="lm-studio")


entrada_texto = "Puedes ayudarme a resumir lo siguiente: El machine learning, o aprendizaje automático, es una rama de la inteligencia artificial que permite a las computadoras aprender de los datos sin ser programadas explícitamente para cada tarea. En lugar de recibir instrucciones detalladas, los sistemas de machine learning identifican patrones en los datos y hacen predicciones o toman decisiones basadas en ese aprendizaje. "

completion = client.chat.completions.create(
    model="local-model",
    messages=[
        {"role": "system", "content": "Eres un asistente útil y amable que responde en español."},
        {"role": "user", "content": entrada_texto}
    ],
    temperature=0.7,
    # max_tokens=100, # Limitar la longitud de la respuesta.
)

# 4. Mostrar el resultado
print("✨ Respuesta del LLM:")
print(completion.choices[0].message.content)

✨ Respuesta del LLM:
Claro, aquí tienes un resumen del texto:

El machine learning es una parte de la inteligencia artificial que permite a las computadoras aprender por sí mismas sin programación específica para cada tarea. En lugar de seguir instrucciones detalladas, estos sistemas identifican patrones en los datos y realizan predicciones o decisiones basándose en el aprendizaje adquirido.

Si necesitas más detalles o aclaraciones sobre este tema, no dudes en preguntar.


In [4]:
from openai import OpenAI

client = OpenAI(base_url="http://localhost:1234/v1", api_key="lm-studio")


entrada_texto = "Que es el Deep Learning y como se relaciona con el Machine Learning y la Inteligencia Artificial."

completion = client.chat.completions.create(
    model="local-model",
    messages=[
        {"role": "system", "content": "Eres un asistente útil y amable que responde en español."},
        {"role": "user", "content": entrada_texto}
    ],
    temperature=0.7,
    # max_tokens=100, # Limitar la longitud de la respuesta.
)

# 4. Mostrar el resultado
print("✨ Respuesta del LLM:")
print(completion.choices[0].message.content)

✨ Respuesta del LLM:
El *Deep Learning* (aprendizaje profundo) es una subdisciplina de las ciencias computacionales que forma parte del campo más amplio del *Machine Learning* (aprendizaje automático), el cual a su vez se sitúa dentro del dominio de la Inteligencia Artificial (IA).

### Deep Learning
El Deep Learning utiliza redes neuronales artificiales con múltiples capas, lo que le permite aprender patrones complejos en grandes volúmenes de datos. Estas "capas" permiten a las redes identificar características a diferentes niveles de abstracción.

#### Características clave:
- **Redes Neuronales Profundas**: Compuestas por varias capas ocultas entre la entrada y la salida.
- **Capacidad de Aprendizaje Automático**: Pueden ajustarse automáticamente para predecir resultados a partir de datos, mejorando su precisión con el tiempo.

### Machine Learning
El Machine Learning es una rama de la IA que se centra en crear algoritmos capaces de aprender y mejorar con experiencia sin ser explíci

In [None]:
# from openai import OpenAI
# import ipywidgets as widgets
# from IPython.display import display, clear_output

# # Configura tu cliente de OpenAI
# client = OpenAI(base_url="http://localhost:1234/v1", api_key="lm-studio")

# # 1. Crea los widgets
# text_input = widgets.Textarea(
#     value='',
#     placeholder='Escribe tu pregunta aquí...',
#     description='Tu Pregunta:',
#     disabled=False,
#     layout=widgets.Layout(width='auto', height='80px')
# )

# output_area = widgets.Output(
#     layout=widgets.Layout(
#         border='1px solid #ddd',        # Borde para visualizar el área
#         max_height='300px',             # Altura máxima antes de scroll vertical
#         overflow_y='auto',              # Scroll vertical si el contenido excede la altura
   
#         overflow_x='hidden',            # Oculta el scroll horizontal si aparece (preferiblemente se evita)
#         white_space='pre-wrap',         # Permite que el texto se envuelva y respete los saltos de línea del modelo
#         word_wrap='break-word',         # Rompe palabras largas si exceden el ancho

#         padding='10px',
#         margin='10px 0'
#     )
# )

# send_button = widgets.Button(
#     description='Enviar',
#     button_style='success',
#     tooltip='Haz clic para enviar tu pregunta',
#     icon='send'
# )

# # 2. Define la función que se ejecutará al hacer clic en el botón
# def on_send_button_clicked(b):
#     with output_area:
#         clear_output()
#         user_question = text_input.value
        
#         if not user_question:
#             print("Por favor, escribe algo para enviar.")
#             return

#         print("Generando respuesta... Por favor, espera.")
        
#         try:
#             completion = client.chat.completions.create(
#                 model="local-model",
#                 messages=[
#                     {"role": "system", "content": "Eres un asistente útil y amable que responde en español."},
#                     {"role": "user", "content": user_question}
#                 ],
#                 temperature=0.7,
#                 # max_tokens=None, # Asegúrate de que no haya un max_tokens bajo aquí
#             )
            
#             clear_output()
#             print("✨ Respuesta del LLM:")
#             # Aquí no necesitamos formatear la cadena, widgets.Output ya maneja los saltos de línea
#             print(completion.choices[0].message.content) 
            
#         except Exception as e:
#             clear_output()
#             print(f"Ocurrió un error: {e}")
#             print("Asegúrate de que tu servidor local de OpenAI esté funcionando.")

# # 3. Asocia la función al evento de clic del botón
# send_button.on_click(on_send_button_clicked)

# # 4. Muestra los widgets en el notebook
# display(text_input, send_button, output_area)

Textarea(value='', description='Tu Pregunta:', layout=Layout(height='80px', width='auto'), placeholder='Escrib…

Button(button_style='success', description='Enviar', icon='send', style=ButtonStyle(), tooltip='Haz clic para …

Output(layout=Layout(border='1px solid #ddd', margin='10px 0', max_height='300px', overflow_x='hidden', overfl…

## Transformers

In [2]:
from transformers import pipeline

# Texto base en español
texto = """
La inteligencia artificial permite que las máquinas tomen decisiones complejas.
Actualmente, se usa en áreas como medicina, finanzas y transporte.
"""

In [5]:
# Crear el pipeline de resumen con BART
resumidor = pipeline("summarization", model="facebook/bart-large-cnn", framework="pt")

# Generar resumen
resumen = resumidor(texto, max_length=60, min_length=10, do_sample=False)

# Mostrar resumen
print("📝 Resumen:", resumen[0]['summary_text'])


Device set to use cuda:0
Your max_length is set to 60, but your input_length is only 51. Since this is a summarization task, where outputs shorter than the input are typically wanted, you might consider decreasing max_length manually, e.g. summarizer('...', max_length=25)


📝 Resumen: La inteligencia artificial permite que las máquinas tomen decisiones complejas. Se usa en áreas como medicina, finanzas y transporte.


In [6]:
# Crear el pipeline de traducción
traductor = pipeline("translation", model="Helsinki-NLP/opus-mt-es-en", framework="pt")

# Traducir el resumen al inglés
traduccion = traductor(resumen[0]['summary_text'])


# Mostrar traducción
print("🌍 Traducción:", traduccion[0]['translation_text'])


Device set to use cuda:0


🌍 Traducción: Artificial intelligence allows machines to make complex decisions. It is used in areas such as medicine, finance and transportation.


In [21]:
# Crear el pipeline de generación de texto con GPT-2
generador = pipeline(
"text-generation",
    model="gpt2",
    framework="pt"
)

# Texto de entrada traducido al inglés (por ejemplo, un resumen)
entrada = traduccion[0]['translation_text'] + " Let's explore its future possibilities."
#entrada = texto 

# Generar continuación del texto con parámetros ajustados
continuacion = generador(
    entrada,
    max_new_tokens=100,        # Número de palabras nuevas a generar
    temperature=0.9,           # Controla la creatividad (0.7-1.0 recomendado)
    top_p=0.95,                # Genera usando solo el top p% de palabras más probables.
    do_sample=True             # Activa el uso de muestreo probabilístico (necesario para temperature y top_p).
)

# Mostrar el resultado
print("✨ Continuación:", continuacion[0]['generated_text'])


Device set to use cuda:0
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


✨ Continuación: Artificial intelligence allows machines to make complex decisions. It is used in areas such as medicine, finance and transportation. Let's explore its future possibilities.

The future of AI in medicine

The technology that creates medicine is already being developed. In fact, many research projects of this sort are being financed in a number of countries. These collaborations are supported by the US, UK, France and Germany. The big universities are all involved in developing AI technologies. In other words, they are funding the development of artificial intelligence and robotics in medicine.

The future of AI in finance and government

A recent study by McKinsey Global Institute


In [None]:
# Recordatorio si llega a molestar por la gpu pipeline("summarization", model="facebook/bart-large-cnn", device=-1)

# Texto - Voz

In [None]:
from gtts import gTTS
from IPython.display import Audio

# Texto a convertir
texto = "Hola, esta es una prueba de texto a voz usando gTTS de Google."

# Crear el objeto de voz en español
tts = gTTS(text=texto, lang='es')

# Guardar el archivo de audio
tts.save("voz.mp3")

# Reproducir el audio (funciona en Jupyter, Colab o VSCode con IPython)
Audio("voz.mp3")
