# Reconocimiento de patrones: Contexto
### Ramón Soto C. [(rsotoc@moviquest.com)](mailto:rsotoc@moviquest.com/)
![ ](images/blank.png)
![agents](images/binary_data_under_a_magnifying.jpg)
[ver en nbviewer](http://nbviewer.ipython.org/github/rsotoc/pattern-recognition/blob/master/Intro%201.%20Bases%20cognitivas.ipynb)

![ ](images/blank.png)
## Relación del RP con otras disciplinas

El **Reconocimiento de patrones** (**RP**) es una de las disciplinas en Ciencias de la Computación relacionadas con el análisis inteligente de datos.

![](images/rp_y_otros.png)


Los límites específicos de estas disciplinas no están bien definidos, como puede apreciarse de los siguientes esquemas, encontrados en la Web:

[![](images/ai-infographic.gif)](http://www.firstalign.com/services/artificial-intelligence.html)

[![](images/main-qimg.png)](https://www.quora.com/What-is-machine-learning-and-how-it-is-linked-to-Big-Data-Data-Mining)

[![](images/ds-disciplines.png)](https://www.altexsoft.com/whitepapers/machine-learning-bridging-between-business-and-data-science/)


## Industria 4.0 y la popularización de la IA

La inteligencia artificial y otras áreas relacionadas, particularmente bajo las etiquetas de "*Machine Learning*", "*Data Mining*" y "*Data Science*", está viviendo una nueva etapa de popularidad, que en esta ocasión viene acompañada de un gran interés por parte de la industria. Este "resurgimiento" del área está fuertemente vinculada a la llamada "economía de la información" y a la creciente **Industria 4.0**. 

[![](images/Industry_4.0.png)](https://en.wikipedia.org/wiki/Industry_4.0)

La adopción de las técnicas de inteligencia artificial se ha realizado en todos los ámbitos de la industria y con la participación de las empresas más importantes:

[![](images/ia_landscape.png)](https://www.techemergence.com/artificial-intelligence-industry-an-overview-by-segment/)

<br><br>En la siguiente gráfica se presenta un panorama sobre tendencias del uso de la IA en la industria para los próximos años:

[![](images/te_research.png)](https://www.techemergence.com/ai-founders-and-executives-predict-5-year-trends-on-consumer-tech/)

<br><br>Por otra parte, el interés de la insudtria en la IA se evidencia a través de las adquisiciones de empresas de AI realizadas por los gigantes tecnológicos:

[![](images/ai_buys_giants.jpg)](https://twitter.com/MrJoseHernandez/status/939235139355398149)

## CRISP-DM

El crecimiento del interés de la industria en las metodologías de inteligencia artificial, particularmente para el caso de análisis de datos, ha venido acompañado de una formalización del proceso de desarrollo de soluciones. 

El modelo más conocido y utilizado en la industria para el desarrollo de proyectos de innovación para el análisis inteligente de datos es **CRISP-DM** (*Cross-Industry Standard Process for Data Mining*). Aunque este modelo ha sido criticado debido a diversas limitantes y ha venido siendo reemplazado por otras metodologías (principalmente [TDSP](https://azure.microsoft.com/en-gb/documentation/learning-paths/data-science-process/),pero también otras como [KDD](https://decisionstats.com/2009/08/13/interview-gregory-piatetsky-kdnuggets-com/) o [SEMMA](https://en.wikipedia.org/wiki/SEMMA)), el modelo más reconocido, suficientemente simple y suficientemente poderoso y general para fines de este curso, sigue siendo CRISP-DM.

**CRISP-DM** es un marco de referencia que permite planificar el desarrollo de un proyecto de minería de datos (y asociados) a partir de 6 fases: 1) *Comprensión del negocio*, 2) *Comprensión de los datos*, 3) *Preparación de los datos*, 4) *Modelado*, 5) *Evaluación* y 6) *Despliegue* (implementación/puesta en marcha).

[![](images/crisp_dm_diagram.png)](https://www.datasciencecentral.com/profiles/blogs/crisp-dm-a-standard-methodology-to-ensure-a-good-outcome) <br><br>

* **Comprensión del negocio**<br>
La fase inicial de un proyecto de minería de datos (y similares) se enfoca en entender los objetivos y requerimientos del proyecto, desde la perspectiva del *negocio*: *a*) identificar las características del problema que se quiere resolver, *b*) identificar cuáles son las necesidades prioritarias que el *cliente* quiere satisfacer y *c*) cuáles son los costos que el cliente está dispuesto a *pagar*. El resultado de esta fase debe ser la definición de un problema en términos técnicos (un problema de minería de datos, por ejemplo) y un plan preliminar de como alcanzar los objetivos.<br><br>Las actividades en esta fase con sus respectivos resultados esperados son:
    * Establecimiento de los objetivos del negocio. El objetivo de este conjunto de actividades es conocer las características del cliente: ¿Cuáles son sus antecedentes?, ¿Cuales son sus objetivos de negocio?, ¿Cuáles son los criterios de éxito del negocio?
    * Evaluación de la situación. Con estas actividades se busca conocer la situación de la empresa para determinar su capacidad para explotar los datos con que cuenta. Entre las preguntas que hay que responder se encuentran las siguientes: ¿Cuáles son los términos más importantes para describir el negocio?, ¿Con qué recursos humanos y materiales cuenta la empresa para completar el proyecto?, ¿Qué tipos de datos están disponibles para el proyecto?, ¿Cuáles son los principales factores de riesgo?, ¿Cuáles son los planes de contingencia para cada factor de riesgo?, ¿Cuáles son los potenciales costos y beneficios del proyecto?
    * Establecimiento de los objetivos de la minería de datos. Aquí se busca determinar los objetivos del proyecto de minería de datos (¿qué se espera obtener con el proyecto?: ¿Una nueva herramienta o servicio? ¿Información para planificación estratégica?) y los criterios que permiten evaluar el éxito del proyecto.
    * Generación del plan del proyecto. La fase de comprensión del negocio debe concretarse en una determinación de intervención (hasta este punto, ¿se considera viable la realización del proyecto?) y en caso de ser positiva, en un plan de como realizar las siguientes fases de intervención (recursos a utilizar, compromisos, indicadores de avances, etc.).

![](images/crisp_dm_flow01.png)<br><br>

* **Comprensión de los datos**<br>

![](images/crisp_dm_flow02.png)

* **Preparación de los datos**<br>
The data preparation phase covers all activities needed to construct the final dataset [data that will be fed into the
modeling tool(s)] from the initial raw data. Data preparation tasks are likely to be performed multiple times and not
in any prescribed order. Tasks include table, record, and attribute selection, as well as transformation and cleaning
of data for modeling tools.

![](images/crisp_dm_flow03.png)<br><br>

* **Modelado**<br>
In this phase, various modeling techniques are selected and applied, and their parameters are calibrated to optimal
values. Typically, there are several techniques for the same data mining problem type. Some techniques have specific
requirements on the form of data. Therefore, going back to the data preparation phase is often necessary.

![](images/crisp_dm_flow04.png)<br><br>

* **Evaluación**<br>
At this stage in the project, you have built a model (or models) that appears to have high quality from a data analysis
perspective. Before proceeding to final deployment of the model, it is important to thoroughly evaluate it and review
the steps executed to create it, to be certain the model properly achieves the business objectives. A key objective is
to determine if there is some important business issue that has not been sufficiently considered. At the end of this
phase, a decision on the use of the data mining results should be reached.

![](images/crisp_dm_flow05.png)<br><br>

* **Despliegue**<br>
Creation of the model is generally not the end of the project. Even if the purpose of the model is to increase knowledge
of the data, the knowledge gained will need to be organized and presented in a way that the customer can use it. It
often involves applying “live” models within an organization’s decision making processes—for example, real-time
personalization of Web pages or repeated scoring of marketing databases. Depending on the requirements, the
deployment phase can be as simple as generating a report or as complex as implementing a repeatable data mining
process across the enterprise. In many cases, it is the customer, not the data analyst, who carries out the deployment
steps. However, even if the analyst will carry out the deployment effort, it is important for the customer to understand
up front what actions need to be carried out in order to actually make use of the created models.

![](images/crisp_dm_flow06.png)<br><br>

![](images/crisp_dm_diagram_notes.png)

<hr style="border-width: 3px;">

### Tarea 1

Describa un problema de reconocimiento de patrones de su interés y explique por qué un modelo tradicional sería inapropiado para resolverlo (utilice la celda siguiente, en esta libreta, para presentar su problema seleccionado).

**Fecha de entrega**: Viernes 18 de agosto.

<hr style="border-width: 3px;">

### Problema: xxxxx
#### Autor: xxxxx

...