- Collection of unstructured data from a Web page with the reviews and the label on the evaluation of the review, both positive and negative.
- Data Preparation. Convert unstructured data into a structured format.
- Build training model, obtained the vector of the document and the weights of the attributes. Two Naive Bayes and SVM training algorithms are used.
- Apply the trained model. Using 50% of the original data that was separated for validation tasks it is necessary to validate the trained model.
Link Explanatory Article Medium: https://medium.com/@freddy.abadl/extracci%C3%B3n-an%C3%A1lisis-y-clasificaci%C3%B3n-de-rese%C3%B1as-de-pel%C3%ADculas-usando -rapidminer-miner% C3% ADa-de-texto-92ce23b9d315
- Recopilación de datos no estructurados desde una página Web con las revisiones y la etiqueta sobre la valoración de la revisión ya sean positivas y negativas.
- Preparación de los Datos. Convierte los datos no estructurados en un formato estructurado.
- Construir modelo de entrenamiento, obtenido el vector del documento y los pesos de los atributos. Se usa dos algoritmos de entrenamiento Naive Bayes y SVM.
- Aplicar el modelo entrenado. Usando el 50% de los datos originales que fueron separados para tareas de validación es necesario validar el modelo entrenado.
Link Articulo Explicatorio Medium: https://medium.com/@freddy.abadl/extracci%C3%B3n-an%C3%A1lisis-y-clasificaci%C3%B3n-de-rese%C3%B1as-de-pel%C3%ADculas-usando-rapidminer-miner%C3%ADa-de-texto-92ce23b9d315