# Introduction  

El aprendizaje automático es la base de la mayoría de las soluciones de inteligencia artificial. La creación de una solución inteligente a menudo comienza con el uso de aprendizaje automático para entrenar modelos predictivos utilizando datos históricos que ha recopilado.

Azure Machine Learning es un servicio en la nube que puede usar para entrenar y administrar modelos de aprendizaje automático.

En este módulo, aprenderá a:

Identificar el proceso de aprendizaje automático.
Comprender las capacidades de Azure Machine Learning.
Utilice el aprendizaje automático automatizado en Azure Machine Learning Studio para entrenar e implementar un modelo predictivo.

# ¿Qué Azure Machine Learning Studio?

Capacitar e implementar un modelo efectivo de aprendizaje automático implica mucho trabajo, gran parte del cual requiere mucho tiempo y recursos. Azure Machine Learning es un servicio basado en la nube que ayuda a simplificar algunas de las tareas necesarias para preparar datos, entrenar un modelo e implementar un servicio predictivo.

Lo que es más importante, Azure Machine Learning ayuda a los científicos de datos a aumentar su eficiencia al automatizar muchas de las tareas que requieren mucho tiempo asociadas con los modelos de entrenamiento; y les permite usar recursos informáticos basados en la nube que se escalan de manera efectiva para manejar grandes volúmenes de datos mientras incurren en costos solo cuando realmente se usan.

### ¿Qué son los Workspaces?
Para usar Azure Machine Learning, primero debe crear un recurso de área de trabajo en su suscripción de Azure. Luego puede usar este espacio de trabajo para administrar datos, recursos informáticos, código, modelos y otros artefactos relacionados con sus cargas de trabajo de aprendizaje automático.

Una vez que haya creado un área de trabajo de Azure Machine Learning, puede desarrollar soluciones con el servicio de aprendizaje automático de Azure, ya sea con las herramientas para desarrolladores o el portal web del estudio de Azure Machine Learning.

### Estudio de aprendizaje automático de Azure
Azure Machine Learning Studio es un portal web para soluciones de aprendizaje automático en Azure. Incluye una amplia gama de características y capacidades que ayudan a los científicos de datos a preparar datos, entrenar modelos, publicar servicios predictivos y monitorear su uso. Para comenzar a usar el portal web, debe asignar el espacio de trabajo que creó en Azure Portal a Azure Machine Learning Studio.

![](./img/studio-home.png)

### Cómputo de Azure Machine Learning
En esencia, Azure Machine Learning es un servicio para entrenar y administrar modelos de aprendizaje automático, para lo cual necesita computación sobre la cual ejecutar el proceso de entrenamiento.

Los destinos informáticos son recursos basados en la nube en los que puede ejecutar procesos de exploración de datos y entrenamiento de modelos.

En Azure Machine Learning Studio , puede administrar los objetivos de proceso para sus actividades de ciencia de datos. Hay cuatro tipos de recursos informáticos que puede crear:

Instancias informáticas: estaciones de trabajo de desarrollo que los científicos de datos pueden usar para trabajar con datos y modelos.
Compute Clusters : clústeres escalables de máquinas virtuales para el procesamiento bajo demanda de código de experimento.
Clústeres de inferencia : destinos de implementación para servicios predictivos que usan sus modelos entrenados.
Cómputo adjunto : vínculos a recursos informáticos de Azure existentes, como máquinas virtuales o clústeres de Azure Databricks.

# ¿Qué es el aprendizaje automático automatizado?
Azure Machine Learning incluye una capacidad de aprendizaje automático automatizado que prueba automáticamente varias técnicas de preprocesamiento y algoritmos de entrenamiento de modelos en paralelo. Estas capacidades automatizadas utilizan el poder de la computación en la nube para encontrar el modelo de aprendizaje automático supervisado de mejor rendimiento para sus datos.

El aprendizaje automático automatizado le permite entrenar modelos sin conocimientos extensos de ciencia de datos o programación. Para las personas con experiencia en ciencia de datos y programación, proporciona una forma de ahorrar tiempo y recursos al automatizar la selección de algoritmos y el ajuste de hiperparámetros.

Puede crear un trabajo de aprendizaje automático automatizado en Azure Machine Learning Studio.

![](./img/automated-machine-learning-portal.png)

En Azure Machine Learning, las operaciones que ejecuta se denominan trabajos . Puede configurar varios ajustes para su trabajo antes de iniciar una ejecución de aprendizaje automático automatizado. La configuración de ejecución proporciona la información necesaria para especificar su script de entrenamiento, destino de proceso y entorno de Azure ML en su configuración de ejecución y ejecutar un trabajo de entrenamiento.

![](./img/start-job-machine-learning-studio.png)

# Comprender el proceso de AutoML
Puede pensar en los pasos de un proceso de aprendizaje automático como:

* Preparar datos : identifique las características y la etiqueta en un conjunto de datos. Procese previamente, o limpie y transforme, los datos según sea necesario.
* Entrene el modelo : divida los datos en dos grupos, un conjunto de entrenamiento y otro de validación. Entrene un modelo de aprendizaje automático con el conjunto de datos de entrenamiento. Pruebe el rendimiento del modelo de aprendizaje automático utilizando el conjunto de datos de validación.
* Evalúe el rendimiento : compare qué tan cerca están las predicciones del modelo de las etiquetas conocidas.
* Implemente un servicio predictivo : después de entrenar un modelo de aprendizaje automático, puede implementar el modelo como una aplicación en un servidor o dispositivo para que otros puedan usarlo.

Estos son los mismos pasos en el proceso de aprendizaje automático automatizado con Azure Machine Learning 

### Preparar datos
Los modelos de aprendizaje automático deben entrenarse con los datos existentes. Los científicos de datos dedican mucho esfuerzo a explorar y preprocesar datos, y prueban varios tipos de algoritmos de entrenamiento de modelos para producir modelos precisos, lo que lleva mucho tiempo y, a menudo, hace un uso ineficiente de hardware informático costoso.

En Azure Machine Learning, los datos para el entrenamiento de modelos y otras operaciones generalmente se encapsulan en un objeto denominado conjunto de datos . Puede crear su propio conjunto de datos en Azure Machine Learning Studio.

![](./img/4auto-machine-learning-select-data.png)

### Modelado
La capacidad de aprendizaje automático automatizado de Azure Machine Learning admite modelos de aprendizaje automático supervisado ; en otras palabras, modelos para los que los datos de entrenamiento incluyen valores de etiqueta conocidos. Puede usar el aprendizaje automático automatizado para entrenar modelos para:

* Clasificación (predicción de categorías o clases )
* Regresión (predicción de valores numéricos)
* Pronóstico de series de tiempo (predicción de valores numéricos en un momento futuro)

En Automated Machine Learning puede seleccionar entre varios tipos de tareas:

![](./img/5choose-task-settings.png)

En Aprendizaje automático automatizado, puede seleccionar configuraciones para la métrica principal, el tipo de modelo utilizado para el entrenamiento, los criterios de salida y los límites de concurrencia.


![](./img/6machine-learning-run-configurations.png)

Es importante destacar que AutoML dividirá los datos en un conjunto de entrenamiento y un conjunto de validación. Puede configurar los detalles en la configuración antes de ejecutar el trabajo.

![](./img/7training-validation.png)       

### Evaluar el desempeño

Una vez finalizado el trabajo, puede revisar el modelo con mejor rendimiento. En este caso, usó criterios de salida para detener el trabajo. Por lo tanto, el "mejor" modelo que generó el trabajo podría no ser el mejor modelo posible, sino simplemente el mejor encontrado dentro del tiempo permitido para este ejercicio.

El mejor modelo se identifica en función de la métrica de evaluación que especificó, error cuadrático medio normalizado .

Se utiliza una técnica llamada validación cruzada para calcular la métrica de evaluación. Una vez que el modelo se entrena con una parte de los datos, la parte restante se usa para probar iterativamente o realizar una validación cruzada del modelo entrenado. La métrica se calcula comparando el valor predicho de la prueba con el valor real conocido o etiqueta.

La diferencia entre el valor pronosticado y el real, conocida como residual , indica la cantidad de error en el modelo. La métrica de rendimiento particular que usó, el error cuadrático medio normalizado, se calcula elevando al cuadrado los errores en todos los casos de prueba, encontrando la media de estos cuadrados y luego sacando la raíz cuadrada. Lo que todo esto significa es que cuanto menor sea este valor, más precisas serán las predicciones del modelo.

El histograma residual muestra la frecuencia de los rangos de valores residuales. Los residuos representan la variación entre los valores predichos y los verdaderos que el modelo no puede explicar, en otras palabras, los errores. Debería esperar ver los valores residuales que ocurren con mayor frecuencia agrupados alrededor de cero. Quiere errores pequeños con menos errores en los extremos de la escala.

![](./img/8residual-histogram.png)

El gráfico Pronosticado vs. Verdadero debe mostrar una tendencia diagonal en la que el valor pronosticado se correlaciona estrechamente con el valor verdadero. La línea punteada muestra cómo debe funcionar un modelo perfecto. Cuanto más cerca esté la línea del valor pronosticado promedio de su modelo de la línea punteada, mejor será su rendimiento. Un histograma debajo del gráfico de líneas muestra la distribución de los valores reales.

![](./img/9predicted-vs-true.png)

Una vez que haya utilizado el aprendizaje automático automatizado para entrenar algunos modelos, puede implementar el modelo de mejor rendimiento como un servicio para que lo usen las aplicaciones cliente.

### Implementar un servicio predictivo

En Azure Machine Learning, puede implementar un servicio como Azure Container Instances (ACI) o en un clúster de Azure Kubernetes Service (AKS). Para escenarios de producción, se recomienda una implementación de AKS, para la cual debe crear un destino de proceso de clúster de inferencia . En este ejercicio, utilizará un servicio ACI, que es un destino de implementación adecuado para las pruebas y no requiere que cree un clúster de inferencia..






