David Davó Laviña y Ela K. Shepherd Arévalo
Prácticas de la asignatura Inteligencia Artificial II del Grado en Ingeniería Informática (Rama de Ciencias de la Computación) de la Facultad de Informática de la Universidad Complutense de Madrid. Curso 2019/2020
Prácticas de aprendizaje automático, preparación, representación, análisis, representación y validación de datos. Se han usado árboles de decisión, algoritmos de clústering, redes neuronales...
También se realiza análisis de textos y consultas sobre redes semánticas del conocimiento como WikiData.
Agrupamiento (clústering) sobre el conjunto de datos de cifras de arrestos por cada 100.000 residentes en distintos estados de EEUU.
Análisis del tipo de tumor (benigno o maligno) basado en multitud de características. Se intentó usar un algoritmo de clusterización basado en 2 particiones (k-means con k=2). Para seleccionar las variables más significativas se crearon y compararon varios árboles de decisión.
Regresión del PIB a diversos factores de la economía de un país usando una red neuronal.
Análisis de sentimiento de opiniones positivas/negativas de Yelp. Transformación del texto en bolsa de palabras, vectorización con TF-IDF. Comparamos un clasificador naive bayes con un árbol de decisión.
Se realiza un buscador de mensajes en un foro. Para ello se usa la similitud del coseno para calcular la relevancia de cada mensaje con respecto a la consulta.
Se realizan consultas sobre wikidata en el lenguaje declarativo SPARQL. Las consultas las podemos realizar en ipynb tras registrar un cell_magic
personalizado.
Práctica opcional en la que se implementan funciones para retornar las relaciones (caminos con entidades y propiedades comunes) entre dos entidades.