# Capítulo 1. El panorama del aprendizaje automático  



No hace mucho, si hubieras cogido tu teléfono y le hubieras pedido que te indicara el camino a casa, te habría ignorado y la gente habría cuestionado tu cordura. 

Pero el aprendizaje automático ya no es ciencia ficción: miles de millones de personas lo usan a diario. 

Y lo cierto es que lleva décadas presente en algunas aplicaciones especializadas, como el reconocimiento óptico de caracteres (OCR). 

La primera aplicación de aprendizaje automático que realmente se popularizó, mejorando la vida de cientos de millones de personas, se apoderó discretamente del mundo en la década de 1990: el filtro de spam. 

No es exactamente un robot consciente de sí mismo, pero técnicamente se considera aprendizaje automático: ha aprendido tan bien que ya casi no es necesario marcar un correo electrónico como spam. 

Después, gracias al big data, las mejoras de hardware y algunas innovaciones algorítmicas, cientos de aplicaciones de aprendizaje automático le siguieron y ahora, silenciosamente, impulsan cientos de productos y funciones que utilizamos habitualmente: indicaciones de voz, traducción automática, búsqueda de imágenes, recomendaciones de productos y muchas más. 

Y finalmente llegaron ChatGPT, Gemini (anteriormente Bard), Claude, Perplexity y muchos otros chatbots: la IA ya no solo impulsa los servicios en segundo plano, sino que es el servicio en sí mismo.

¿Dónde empieza y dónde termina el aprendizaje automático? 

¿Qué significa exactamente que una máquina aprenda algo? 

Si descargo una copia de todos los artículos de Wikipedia, ¿mi ordenador realmente ha aprendido algo? 

¿Es de repente más inteligente? 

En este capítulo, Géron comenzará aclarando qué es el aprendizaje automático y por qué podría interesarte usarlo.


Luego, antes de explorar el mundo del aprendizaje automático, revisaremos el mapa y aprenderemos sobre las principales regiones y los puntos de referencia más destacados: aprendizaje supervisado vs. no supervisado y sus variantes, aprendizaje en línea vs. por lotes, aprendizaje basado en instancias vs. basado en modelos. 

Después, analizaremos el flujo de trabajo de un proyecto típico de aprendizaje automático, analizaremos los principales desafíos que puedes enfrentar y explicaremos cómo evaluar y perfeccionar un sistema de aprendizaje automático.


Este capítulo presenta muchos conceptos fundamentales (y jerga) que todo científico de datos debería conocer de memoria. 

Será un resumen general (es el único capítulo sin mucho código), bastante simple, pero mi objetivo es asegurarme de que todo te quede clarísimo antes de continuar con el resto del libro.

 ¡Así que tómate un café y comencemos!

# CONSEJO


Si ya está familiarizado con los fundamentos del aprendizaje automático, puede pasar directamente al Capítulo 2. 

Si no está seguro, intente responder todas las preguntas que aparecen al final del capítulo antes de continuar.


¿Qué es el aprendizaje automático?


El aprendizaje automático es la ciencia (y el arte) de programar computadoras para que puedan aprender de los datos.


Aquí tiene una definición un poco más general:
[El aprendizaje automático es el] campo de estudio que otorga a las computadoras la capacidad de aprender sin ser programadas explícitamente.


—Arthur Samuel, 1959


Y una más orientada a la ingeniería:  
Se dice que un programa de computadora aprende de la experiencia E con respecto a una tarea T y una medida de rendimiento P, si su rendimiento en T, medido por P, mejora con la experiencia E.  
—Tom Mitchell, 1997  

# ¿Por qué usar aprendizaje automático?
Considere cómo crearía un filtro de spam utilizando técnicas de programación tradicionales (Figura 1-1):  

1. Primero, examinaría el aspecto típico del spam. Podría notar que algunas palabras o frases (como "4U", "tarjeta de crédito", "gratis" e "increíble") suelen aparecer con frecuencia en el asunto. Quizás también observe otros patrones en el nombre del remitente, el cuerpo del correo electrónico y otras partes del mismo.


2. Desarrollaría un algoritmo de detección para cada uno de los patrones detectados y su programa marcaría los correos electrónicos como spam si se detectaran varios de estos patrones.


3. Probaría su programa y repetiría los pasos 1 y 2 hasta que fuera lo suficientemente bueno como para ejecutarlo.

Dado que el problema es complejo, es probable que su programa se convierta en una larga lista de reglas complejas, bastante difíciles de mantener.


En cambio, un filtro de spam basado en técnicas de aprendizaje automático aprende automáticamente qué palabras y frases son buenos predictores de spam al detectar patrones de palabras inusualmente frecuentes en los ejemplos de spam en comparación con los ejemplos de radioaficionados (Figura 1-2). 

El programa es mucho más corto, más fácil de mantener y, muy probablemente, más preciso.

¿Qué pasa si los spammers se dan cuenta de que todos sus correos electrónicos con "Para ti" están bloqueados? 

Podrían empezar a escribir "Para ti". Un filtro de spam que utilice técnicas de programación tradicionales tendría que actualizarse para marcar los correos "Para ti". Si los spammers siguen eludiendo tu filtro de spam, tendrás que seguir creando nuevas reglas constantemente.


Por el contrario, un filtro de spam basado en técnicas de aprendizaje automático detecta automáticamente que "Para ti" se ha vuelto inusualmente frecuente en el spam marcado por los usuarios y empieza a marcarlos sin tu intervención (Figura 1-3).

figura 1.3
<img src = ''>

Otra área donde el aprendizaje automático destaca es en problemas que son demasiado complejos para los enfoques tradicionales o que no cuentan con un algoritmo conocido. 

Por ejemplo, considere el reconocimiento de voz. 

Supongamos que desea comenzar con algo simple y escribir un programa capaz de distinguir las palabras "uno" y "dos".

Podría notar que la palabra "dos" comienza con un sonido agudo ("T"), por lo que podría codificar un algoritmo que mida la intensidad del sonido agudo y usarla para distinguir unos y doses; sin embargo, obviamente, esta técnica no se adaptará a miles de palabras pronunciadas por millones de personas muy diferentes en entornos ruidosos y en docenas de idiomas. 

La mejor solución (al menos hoy en día) es escribir un algoritmo que aprenda por sí solo, dadas muchas grabaciones de ejemplo de cada palabra.


Finalmente, el aprendizaje automático puede ayudar a los humanos a aprender (Figura 1-4). 

Los modelos de aprendizaje automático pueden inspeccionarse para ver qué han aprendido (aunque para algunos modelos esto puede ser complicado). 

Por ejemplo, una vez que un filtro de spam ha sido entrenado con suficiente spam, puede inspeccionarse fácilmente para revelar la lista de palabras y combinaciones de palabras que considera los mejores predictores de spam. 

A veces, esto revelará correlaciones insospechadas o nuevas tendencias, lo que permitirá comprender mejor el problema. 

Analizar grandes cantidades de datos para descubrir patrones ocultos se denomina minería de datos, y el aprendizaje automático es experto en ello.

En resumen, el aprendizaje automático es excelente para:


• Problemas para los que las soluciones existentes requieren mucho trabajo y mantenimiento, como largas listas de reglas (un modelo de aprendizaje automático a menudo puede simplificar el código y ofrecer un mejor rendimiento que el enfoque tradicional).


• Problemas complejos para los que el uso de un enfoque tradicional no ofrece una buena solución (las mejores técnicas de aprendizaje automático quizás puedan encontrar una solución).


• Entornos fluctuantes (un sistema de aprendizaje automático puede reentrenarse fácilmente con nuevos datos, manteniéndolo siempre actualizado).


* Obtener información sobre problemas complejos y grandes cantidades de datos.

# Ejemplos de aplicaciones


Veamos algunos ejemplos concretos de tareas de aprendizaje automático, junto con las técnicas que pueden abordarlas:


* Análisis de imágenes de productos en una línea de producción para clasificarlos automáticamente.
Esto es la clasificación de imágenes, que generalmente se realiza mediante redes neuronales convolucionales (CNN; véase el capítulo 12) o transformadores de visión (véase el capítulo 16).


* Detección de tumores en escáneres cerebrales.
Esto es la segmentación semántica de imágenes, donde se clasifica cada píxel de la imagen (ya que queremos determinar la ubicación exacta y la forma de los tumores), generalmente mediante CNN o transformadores de visión.


* Clasificación automática de artículos periodísticos.
Esto es el procesamiento del lenguaje natural (PLN), y más específicamente, la clasificación de texto, que puede abordarse mediante redes neuronales recurrentes (RNN) y CNN,
pero los transformadores funcionan aún mejor (véase el capítulo 15).


* Marcado automático de comentarios ofensivos en foros de discusión.
Esto también es clasificación de texto, utilizando las mismas herramientas de PLN. Resumir documentos largos automáticamente
Esta es una rama del PLN llamada resumen de texto, que también utiliza las mismas herramientas.


* Estimar el riesgo genético de una persona a padecer una enfermedad determinada mediante el análisis de una secuencia de ADN muy larga.
Esta tarea requiere descubrir patrones dispersos en secuencias muy largas,
donde los modelos de espacio de estados (SSM) destacan especialmente (véase “Modelos de espacio de estados (SSM)” en https://homl.info).


* Crear un chatbot o un asistente personal
Esto implica muchos componentes del PLN, como la comprensión del lenguaje natural (NLU) y los módulos de preguntas y respuestas. Pronosticar los ingresos de su empresa el próximo año basándose en diversas métricas de rendimiento.


Esta es una tarea de regresión (es decir, predecir valores) que puede abordarse mediante cualquier modelo de regresión, como una regresión lineal o un modelo de regresión polinómica (véase el Capítulo 4), una máquina de vectores de soporte de regresión (véase el apéndice en línea sobre máquinas de vectores de soporte en https://homl.info), un bosque aleatorio de regresión (véase el Capítulo 6) o una red neuronal artificial (véase el Capítulo 9). Si desea tener en cuenta secuencias de métricas de rendimiento pasadas, puede utilizar RNN, CNN o transformadores (véanse los Capítulos 13 a 15).

* Hacer que tu app reaccione a comandos de voz
Esto es reconocimiento de voz, que requiere procesar muestras de audio. Al ser secuencias largas y complejas, se suelen procesar mediante RNN, CNN o transformadores (véanse los capítulos 13 a 15).


* Detección de fraudes con tarjetas de crédito
Esto es detección de anomalías, que puede abordarse mediante bosques de aislamiento, modelos de mezcla gaussiana (véase el capítulo 8) o autocodificadores (véase el capítulo 18).


* Segmentación de clientes según sus compras para diseñar una estrategia de marketing diferente para cada segmento
Esto es agrupamiento, que puede lograrse mediante k-medias, DBSCAN y más
(véase el capítulo 8).


* Representación de un conjunto de datos complejo y de alta dimensión en un diagrama claro y esclarecedor
Esto es visualización de datos, que a menudo implica técnicas de reducción de dimensionalidad
(véase el capítulo 7).


* Recomendar un producto que pueda interesar a un cliente, basándose en compras anteriores
Esto es un sistema de recomendación. Un enfoque consiste en introducir compras pasadas (y otra información sobre el cliente) en una red neuronal artificial (véase el Capítulo 9) y hacer que muestre la próxima compra más probable. Esta red neuronal se suele entrenar con secuencias de compras pasadas de todos los clientes.


* Creación de un bot inteligente para un juego
Esto se suele abordar mediante el aprendizaje por refuerzo (RL; véase el Capítulo 19), que es una rama del aprendizaje automático que entrena a los agentes (como los bots) para que elijan las acciones que maximizan sus recompensas a lo largo del tiempo (por ejemplo, un bot puede obtener una recompensa cada vez que el jugador pierde puntos de vida), dentro de un entorno determinado (como el juego). El famoso programa AlphaGo que venció al campeón mundial de Go se creó utilizando RL.


Esta lista podría ser interminable, pero esperamos que les dé una idea de la increíble amplitud y complejidad de las tareas que el aprendizaje automático puede abordar y de los tipos de técnicas que se pueden utilizar para cada tarea.