# Guía para Análisis de Herramientas de Minería de Datos y Publicación en GitHub Pages
Este notebook es una guía para que desarrollen una comparación entre WEKA, KNIME, Orange y RapidMiner, creen un análisis de eficiencia y aprendan a publicar su trabajo en GitHub Pages.

---
---

## 1. Objetivos de la Actividad
- Elaborar un cuadro comparativo de herramientas de minería de datos.
- Crear un análisis de eficiencia.
- Asociar cada herramienta con 5 empresas reales.
- Publicar el contenido en una página web usando GitHub Pages.

## 2. Cuadro Comparativo de Herramientas
Ejemplo de criterios para la tabla:
- Licencia
- Facilidad de uso
- Funciones principales
- Ventajas y desventajas
- Usuarios ideales

In [16]:
import pandas as pd
pd.set_option('display.max_colwidth', 1000)
estilo = [
    dict(selector="td", props=[("text-align", "left")])
]
herramientas = pd.DataFrame({
    'Herramienta': ['WEKA','KNIME','Orange','RapidMiner'],
    'Licencia': ['El clúster verifica su validez comparando sus condiciones con el uso real del clúster. Solo puede haber una licencia activa en un clúster a la vez; al solicitar una nueva, se reemplaza la existente', 'La Licencia Pública General GNU es una licencia libre, con copyleft, para software y otros tipos de obras', 'Ya sea la versión 3.0 de la Licencia o (a tu elección) cualquier versión posterior.', 'Stair AI Studio puede recuperar automáticamente las licencias asociadas a su cuenta de RapidMiner. Si no tiene conexión (por ejemplo, si está bloqueado por un firewall), también puede instalar una licencia manualmente.'],
    'Facilidad de uso': ['Código abierto: al ser de código abierto, Weka es de uso gratuito y la comunidad puede personalizarlo y ampliarlo. ', 'Facilidad de uso debido a su interfaz visual de arrastrar y soltar (GUI), que permite a usuarios con y sin experiencia en programación crear flujos de trabajo complejos', 'Accesible las 24 horas, y en la aplicación gratuita Orange Teléfono para gestionar llamadas no deseadas. Para el análisis de datos, Orange Data Mining ofrece una interfaz intuitiva de "arrastrar y soltar" que no requiere conocimientos de programación', ' Su funcionalidad permite a los usuarios procesar grandes volúmenes de datos, identificar patrones y generar predicciones útiles para la toma de decisiones'],
    'Funciones principales': ['El análisis de datos y la minería de datos mediante algoritmos de aprendizaje automático para tareas como la clasificación, regresión, agrupamiento y descubrimiento de reglas de asociación', 'creación de flujos de trabajo visuales para el procesamiento de datos, la automatización de tareas repetitivas, y la realización de análisis complejos como ETL (Extraer, Transformar, Cargar), minería de datos y aprendizaje automático', ' las funciones principales son la minería de datos, el aprendizaje automático, el análisis y la visualización de datos a través de una interfaz visual basada en componentes (widgets). ', 'procesar grandes volúmenes de datos, identificar patrones y generar predicciones útiles para la toma de decisiones'],
    'Ventajas': ['facilidad de uso con una interfaz gráfica (GUI) para principiantes, y ser una solución de código abierto y multiplataforma que permite su uso gratuito y su ejecución en distintos sistemas operativos', 'Ser una plataforma de código abierto, gratuita y de código bajo/sin código que facilita el análisis de datos y la automatización de tareas para usuarios técnicos y no técnicos','Paneles de datos estructurados y visuales, Actualizaciones periódicas,Integración con más de 100 fuentes de datos,Seguridad y cifrado de datos', 'Ofrece una variedad de algoritmos de aprendizaje automático, técnicas de minería de datos y análisis de texto'],
    'Desventajas': ['No incluye algoritmos para el modelado de secuencias,', 'Al   utilizar   métodos   de   combinación   de   modelos,   los   resultados   tienden   acomplicarse', 'Carece de algunas técnicas de análisis avanzadas ,El software no es apto para principiantes y tiene una curva de aprendizaje pronunciada para los nuevos usuarios,no es adecuada para organizaciones de tamaño mediano a grande.', 'Existen ciertas limitaciones en términos de opciones de personalización o algoritmos específicos que desean implementar,Tiene una curva de aprendizaje pronunciada y no es apto para principiantes']
})
herramientas
herramientas.style.set_table_styles(estilo)

Unnamed: 0,Herramienta,Licencia,Facilidad de uso,Funciones principales,Ventajas,Desventajas
0,WEKA,"El clúster verifica su validez comparando sus condiciones con el uso real del clúster. Solo puede haber una licencia activa en un clúster a la vez; al solicitar una nueva, se reemplaza la existente","Código abierto: al ser de código abierto, Weka es de uso gratuito y la comunidad puede personalizarlo y ampliarlo.","El análisis de datos y la minería de datos mediante algoritmos de aprendizaje automático para tareas como la clasificación, regresión, agrupamiento y descubrimiento de reglas de asociación","facilidad de uso con una interfaz gráfica (GUI) para principiantes, y ser una solución de código abierto y multiplataforma que permite su uso gratuito y su ejecución en distintos sistemas operativos","No incluye algoritmos para el modelado de secuencias,"
1,KNIME,"La Licencia Pública General GNU es una licencia libre, con copyleft, para software y otros tipos de obras","Facilidad de uso debido a su interfaz visual de arrastrar y soltar (GUI), que permite a usuarios con y sin experiencia en programación crear flujos de trabajo complejos","creación de flujos de trabajo visuales para el procesamiento de datos, la automatización de tareas repetitivas, y la realización de análisis complejos como ETL (Extraer, Transformar, Cargar), minería de datos y aprendizaje automático","Ser una plataforma de código abierto, gratuita y de código bajo/sin código que facilita el análisis de datos y la automatización de tareas para usuarios técnicos y no técnicos","Al utilizar métodos de combinación de modelos, los resultados tienden acomplicarse"
2,Orange,Ya sea la versión 3.0 de la Licencia o (a tu elección) cualquier versión posterior.,"Accesible las 24 horas, y en la aplicación gratuita Orange Teléfono para gestionar llamadas no deseadas. Para el análisis de datos, Orange Data Mining ofrece una interfaz intuitiva de ""arrastrar y soltar"" que no requiere conocimientos de programación","las funciones principales son la minería de datos, el aprendizaje automático, el análisis y la visualización de datos a través de una interfaz visual basada en componentes (widgets).","Paneles de datos estructurados y visuales, Actualizaciones periódicas,Integración con más de 100 fuentes de datos,Seguridad y cifrado de datos","Carece de algunas técnicas de análisis avanzadas ,El software no es apto para principiantes y tiene una curva de aprendizaje pronunciada para los nuevos usuarios,no es adecuada para organizaciones de tamaño mediano a grande."
3,RapidMiner,"Stair AI Studio puede recuperar automáticamente las licencias asociadas a su cuenta de RapidMiner. Si no tiene conexión (por ejemplo, si está bloqueado por un firewall), también puede instalar una licencia manualmente.","Su funcionalidad permite a los usuarios procesar grandes volúmenes de datos, identificar patrones y generar predicciones útiles para la toma de decisiones","procesar grandes volúmenes de datos, identificar patrones y generar predicciones útiles para la toma de decisiones","Ofrece una variedad de algoritmos de aprendizaje automático, técnicas de minería de datos y análisis de texto","Existen ciertas limitaciones en términos de opciones de personalización o algoritmos específicos que desean implementar,Tiene una curva de aprendizaje pronunciada y no es apto para principiantes"


## 3. Análisis de Eficiencia
Según el cuadro comparativo anterior, la herramienta más eficiente es RapidMiner debido a que es muy completa en cuanto a funcionalidades, sin embargo, se limitia debido a que no es tan facil de utilizar. Es decir, lo mas conveniente es que sea utilizado por una persona tecnicamente capacitada. Para las otras herramientas tambien son muy completas pero más dinamicas e interactivas por lo que son muy utilizadas para enseñar o otras actividades menos profundas.

## 4. Empresas que Usan Cada Herramienta
Weka : IMC Trading, Bayer, RWTH Aachen University, Universidad de Lausana   
knime: Citi, Procter & Gamble, General Motors, Seagate Technology, Infineon Technologies  
Orange: Eolas Groupe Business & Decision,Air France, ENSIO,Business & Decision, LesJeudis  
RapidMiner: The Virtual Forge, Anblicks,Buckman, FirstEnergy

## 5. Relación con CRISP-DM
En general, las herramientas cargan datos, los transforman con diferentes tecnologías, incluyen varios modelos y tienen utilidades de visualización para mostrar los resultados y dar soluciones a los clientes.

# Publicación en GitHub Pages
A continuación se explica el proceso para publicar este notebook como página web usando GitHub Pages.

## Paso 1: Crear un repositorio en GitHub
1. Ingrese a https://github.com
2. Haga clic en **New Repository**
3. Asigne un nombre (ej. *analitica-mineria*)
4. Marque la opción **Public**
5. Cree el repositorio

## Paso 2: Subir el Notebook
1. En el repositorio, haga clic en **Add file → Upload files**
2. Cargue el archivo `.ipynb`
3. Confirme con **Commit changes**

## Paso 3: Activar GitHub Pages
1. Entre en **Settings** del repositorio
2. En el menú lateral seleccione **Pages**
3. En *Source*, seleccione **GitHubActions** 
4. Guarde.
Tras unos segundos GitHub mostrará la URL pública del sitio.

## Paso 4: Convertir el Notebook a HTML (si lo desea)
Puede convertir el notebook a HTML ejecutando:
```bash
jupyter nbconvert --to html nombre_notebook.ipynb
```
Luego suba el archivo HTML al repositorio.