Sergio Serra | Jorge Zavaleta |
---|---|
![]() |
![]() |
serra@pet-si.ufrrj.br | zavaleta@pet-si.ufrrj.br |
Introdução a reprodutibilidade em pesquisa, proveniência de dados e gestão de grandes volumes de dados científicos. Coleta e preparação de dados. Algoritmos de exploração e análise de dados. Métodos de modelagem fluxo de dados. Elaboração de relatórios de resultados através de documentos com código Python incluindo gráficos e tabelas.
Temas | Jupyter Notebook | |
---|---|---|
Reprodutibilidade em Pesquisa Computacional | Reprodutibilidade | ![]() |
Introdução a Proveniência de Dados | Proveniência | ![]() ![]() |
Gestão de Grandes Volumes de Dados de Pesquisa | Gestão | ![]() |
Ambiente de Programação: python 3, jupyter notebook, JupyterLab, Google Colab, DeepNote, pacotes e github | Instalação Anaconda, Jupyter Notebook, Jupyterlab | ![]() |
Python I: tipos de dados, sequências e operações, estruturas de controle e repetição | Tipos de dados. Estruturas de Controle | Exercícios em Jupyter/Colab/Deepnote |
Prática dos conteúdos estudados: construindo e operando listas e strings | Exercícios | Jupyter/ Colab/Deepnote |
Temas | Jupyter Notebook | |
---|---|---|
Técnicas de coleta e preparação de dados | ![]() |
|
Numpy I: array, slicing, fancy index, copy and view | Numpy | ![]() |
Pandas I: dataframes, series, index, Pandas I/O (csv, json, excel) | ![]() |
|
Prática dos conteúdos estudados: Processando e extraindo informações de arquivos csv, Jason, rdf | ![]() |
- Re-run, Repeat, Reproduce, Reuse, Replicate: Transforming Code into Scientific Contributions Fabien C. Y. Benureau and Nicolas P. Rougier.
- Provenance and the Different Flavors of Computational Reproducibility J. Freire and F. Chirigati In IEEE Data Engineering Bulletin, 41(1), pp. 15-26, 201.
- Web Semãntica: Uma introdução.
Critérios de aprovação são os do PPGI/UFRJ. A avaliação consiste em participação em sala de aula (P); exercícios e/ou protótipos desenvolvidos (E); apresentações/ /escritas de artigos (A).
Básica
- National Academies of Sciences, Engineering, andMedicine. Reproducibility and Replicability in Science. Washington, DC: The National Academies Press, 1st Edition, 2019.
- Victoria Stodden, Friedrich Leisch, Roger D. Peng, Implementing Reproducible Research, CRC Press, 1st Edition, 2014.
- Kleppmann, M., Designing Data-Intensive Applications: The Big Ideas Behind Reliable, Scalable, and Maintainable Systems, O’Reilly, 2017.
- Taylor, E. Deelman, D.B. Gannon, M. Shields (Eds.), Workflows for e-Science: Scientific Workflows for Grids, Springer, 2006.
- Wes McKinny, Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython, 2nd edition O'Reilly Media, 2017
- Mark Lutz, Learning Python, 5th Edition, O'Reilly Media, 2013
- Jonh Hearty, Advanced Machine Learning with Python. Packt Publishing, 2016.
- Andreas C. Mueller and Sarah Guido, Machine Learning with Python. O'Reilly Media, 2016.
- John D. Kelleher, Brian Mac Namee, and Aoife DArcy. Fundamentals of machine learning for predictive data analytics: algorithms, worked examples, and case studies. MIT, 2015.
- Artigos Selecionados
Complementar
- Christopher Gandrud, Reproducible Research with R and R Studio (Chapman & Hall/CRC The R Series) 1st Edition
- Garret Christense, Jeremy Freese, Edward Miguel, Transparent and Reproducible Social Science Research, University of Californy Press, 1st edition, 2019
- Justin Kitzes (Editor), Daniel Turek (Editor), Fatma Deniz (Editor), The Practice of Reproducible Research Case Studies and Lessons from the Data-Intensive Sciences, University of Californy Press, 1st edition, 2017
- Aurélien Géron, Hands-On Machine Learning with Scikit-Learn and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems. O'Reilly Media, 2017.
- Aurélio Géron, Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow. Concepts, Tools, and Techniques to Build Intelligent Systems. O'Reilly Media, 2019.
- Manohar Swamynathan, Mastering Machine Learning with Python in Six Steps. Apress, 2017.
- Michel Bowles, Machine Learning in Python®: Essential Techniques for Predictive Analysis. John Wiley & Sons, Inc. 2015.
- The Open Science Training - Handbook https://book.fosteropenscience.eu/en/01Introduction/
- Recursos indicados em sala de aula