-
Notifications
You must be signed in to change notification settings - Fork 0
Ementa das aulas e seminários
daltonmartins edited this page Mar 22, 2022
·
41 revisions
1. Introdução (PDF)
- Tópicos: Ementa, objetivos, apresentação dos alunos e docente. Visão geral da Aprendizagem de Máquina (AM) no contexto da Ciência da Informação (temas, aplicações, estudos setoriais, abordagens). Frameworks e ciclos de vida de projetos de AM.
- Artigo 1 - The CRISP-DM Model: The New Blueprint for Data Mining
- Artigo 2 - V. Pontello, H. Beckmann and C. Lanquillon, "Meta-learning approach for implementation of AI methods in the context of CRISP-DM with case studies from master data management," 2021 IEEE International Conference on Engineering, Technology and Innovation (ICE/ITMC), 2021, pp. 1-9, doi: 10.1109/ICE/ITMC52061.2021.9570265.
- Referência técnica:
- Choosing the right estimator (Sci-kit Learn)
- Relatórios técnicos setoriais de aplicações de AM na CI
- Top Data Science and Machine Learning Methods Used in 2018, 2019
- State of Machine Learning and Data Science 2021
2. Pré-processamento de dados (PPT)
- Tópicos: discute o processo e as etapas de pré-processamento de dados. Contextualiza a questão da qualidade dos dados e a necessidade de procedimentos de coleta, tratamento, análise e visualização para a compreensão adequada dos dados e posterior análise em algoritmos de aprendizagem de máquina.
- Artigo 1 - Rahm, E., & Do, H. H. (2000). Data cleaning: Problems and current approaches.. IEEE Data Eng. Bull., 23(4), 3-13.
- Artigo 2 - Wickham, H. (2014). Tidy data. Journal of statistical software, 59(1), 1-23.
- Artigo 3 - Behrens, J. T. (1997). Principles and procedures of exploratory data analysis. Psychological Methods, 2(2), 131.
3. O ambiente de laboratório da disciplina: plataforma KNIME. Laboratórios exemplos de pré-processamento de dados. (PPT)
- Tópicos: discute diferentes abordagens para o desenvolvimento de aplicações para aprendizagem de máquina, justificando a escolha para a disciplina no contexto da Ciência da Informação. Apresenta a plataforma KNIME, suas principais funcionalidades, referências de estudo complementar e abordagens que serão utilizadas nas aulas e projetos da disciplina. Apresenta exemplos e aplicações do KNIME para pré-processamento de dados.
- Artigo 1 - Altalhi, A.H., Luna, J.M., Vallejo, M.A. and Ventura, S. (2017), Evaluation and comparison of open source software suites for data mining and knowledge discovery. WIREs Data Mining Knowl Discov, 7: e1204. https://doi.org/10.1002/widm.1204
- Artigo 2 - Hora, G. S., Menezes, J. S. S., dos Santos Júnior, G. P., & Neto, A. N. R. (2018). Avaliação de ferramentas de mineração de dados: uma abordagem com o modelo tam. Interfaces Científicas-Exatas e Tecnológicas, 2(3), 109-121.
4. Aprendizagem não-supervisionada - parte I - Regras de Associação - Algoritmo APRIORI (PPT)
- Tópicos: Introduz o conceito de aprendizagem não-supervisionada. Discute os princípios dos métodos descritivos. Apresenta os conceitos de regras de associação. Estuda e implementa o algoritmo APRIORI utilizando o KNIME.
- Artigo 1 - CARVALHO, M. B.; TSUNODA, D. F. Análise de dados em artigos recuperados da Web of Science (WoS). Encontros Bibli: Revista Eletrônica de Biblioteconomia e Ciência da Informação, v. 23, n. esp., p. 112-125, 2018. DOI: 10.5007/1518-2924.2018v23nespp112 Acesso em: 02 mar. 2022.
- Artigo 2 - Rim Rekik, Ilhem Kallel, Jorge Casillas, Adel M. Alimi, Assessing web sites quality: A systematic literature review by text and association rules mining, International Journal of Information Management, Volume 38, Issue 1, 2018, Pages 201-216, ISSN 0268-4012, https://doi.org/10.1016/j.ijinfomgt.2017.06.007.
5. Aprendizagem não-supervisionada - parte II - Análise de agrupamento (PPT)
- Tópicos: Apresenta o conceito de análise de agrupamento. Discute definições básicas de tipos de agrupamento e características dos dados. Apresenta as etapas de um projeto aplicado de análise de agrupamento. Apresenta as métricas e medidas de análise.
- Artigo 1 - Lund, B. and Ma, J. (2021), "A review of cluster analysis techniques and their uses in library and information science research: k-means and k-medoids clustering", Performance Measurement and Metrics, Vol. 22 No. 3, pp. 161-173. https://doi.org/10.1108/PMM-05-2021-0026
- Artigo 2 - Xin Gu and Karen L. Blackmore. 2019. Developing a scholar classification scheme from publication patterns in academic science: A cluster analysis approach. J. Assoc. Inf. Sci. Technol. 70, 11 (November 2019), 1262–1276. DOI:https://doi.org/10.1002/asi.24195
6. Aprendizagem não-supervisionada - parte III - Análise de agrupamento: algoritmos K-Means, DBSCAN, Hirárquicos (PPT)
- Tópicos: Apresenta os principais algoritmos para análise de agrupamento: K-means (algoritmo do tipo partição), DBSCAN (algoritmo baseado em densidade de pontos) e os 3 tipos de algoritmos hierárquicos: single-linkage, average-linkage, complete-linkage. Apresenta workflow de implementação dos 3 tipos de algoritmos no Knime a partir de uma base de dados de posts do Facebook.
- Artigo 1 - Ruas, Pedro Henrique B.; Machado, Alan D.; Silva, Michelle C.; Meireles, Magali R. G.; Cardoso, Ana Maria P.; Zárate, Luis E.; Nobre, Cristiane N. Behaviour & Information Technology. Aug2019, Vol. 38 Issue 8, p858-872. 15p. 2 Diagrams, 7 Charts, 2 Graphs. DOI: 10.1080/0144929X.2019.1566498.
- Artigo 2 - Zayani, Corinne Amel; Ghorbel, Leila; Amous, Ikram; Mezghanni, Manel; Péninou, André; Sèdes, Florence. Online Information Review. 2020, Vol. 44 Issue 2, p433-454. 22p. DOI: 10.1108/OIR-02-2017-0068.
Programa de Pós-graduação em Ciência da Informação da Universidade de Brasília