Por José Vitor, Claudiano Lima, Eugenio Dorneles e Júlia Aguiar.
- Mineração de Dados;
- Aprendizado de Máquina;
- Ciência de Dados;
- Ferramentas de Mineração e Análise de Dados;
- Análises Estatísticas;
- Desenvolvimento de Aplicações em Problemas Reais que Demandam Análises no Cenário de Big Data.
Ementa
Permitir que os estudantes aprendam a aplicar ferramentas e métodos de ciência de dados em problemas reais, integrando suas soluções em projetos de sistemas de informação.
- Introduzir conceitos de mineração de dados, aprendizado de máquina e estatística;
- Apresentar técnicas básicas relacionadas a estatística e aprendizado de máquina;
- Investigar problemas e conjuntos de dados que podem contribuir para um trabalho unificado para as demais disciplinas cursadas pelos estudantes;
- Introduzir conceitos gerais relacionados ao desenvolvimento de software em equipes, como a análise estática de código e o uso de ferramentas de versionamento.
- Identificação de problemas que podem ser investigados com ciência de dados;
- Investigação de técnicas de estatística e de aprendizado de máquina que mais se adéquam à solução proposta;
- Apresentação dos resultados;
- Ferramentas e métodos para desenvolvimento de software em time;
- Documentação do Pandas. Disponível em https://pandas.pydata.org/
- Documentação do Scikit-Learn. Disponível em https://scikit-learn.org/
- Documentação do Streamlit. Disponível em https://streamlit.io/
- Grus, Joel. Data science from scratch: first principles with python. O'Reilly Media, 2019.
- Géron, Aurélien. Hands-on machine learning with Scikit-Learn, Keras, and TensorFlow: Concepts, tools, and techniques to build intelligent systems. O'Reilly Media, 2019.
- WITTEN, I. H; FRANK, Eibe; HALL, Mark A. Data mining: practical machine learning tools and techniques. 3rd ed. Burlington, MA: Elsevier Morgan Kaufmann,
- xxxi, 629 p. (The Morgan Kaufmann series in data management systems) ISBN 9780123748560.
- ELMASRI, Ramez; NAVATHE, Shamkant B. Sistemas de banco de dados. 6.ed. São Paulo: Pearson Addison Wesley, 2011. 788 p. ISBN 9788579360855.
- RUSSELL, S.; NORVIG, P. Inteligência artificial. 2 ed. Elsevier, 2004.
RECIFE, 15 de fevereiro de 2022
Gabriel Alves de Albuquerque Júnior Docente Responsável
Este repositório dedicasse a versionar o conteúdo das atividades práticas da disciplina de PISI III, ofertada pelo curso de Bacharelado em Sistemas de Informação da UFRPE. Caso você queira saber mais detalhes sobre esta disciplina, acesse a página ou vá ao branch gh-pages.
👉🏼 Neste branch e, em outros do repositório (com exceção do
gh-pages
), você encontrará o versionamento do projetoHeart disease data analysis
. Que servirá como a inteligência do aplicativo Unleash Health, desenvolvido com Flutter, como requisito avaliativo da disciplina de Desenvolvimento de Sistemas de Informação.
.
├── data
│ ├── personal-key-indicators-of-heart-disease-dataset.csv
│ └── personal-key-indicators-of-heart-disease-data-dictionary.md
├── pipeline # These could be docker containers related code, scripts, workflow related code, etc.
│ ├── dags
│ │ ├── ingestion_dag.py
│ │ ├── validation_dag.py
│ │ ├── regretion_dag.py
│ │ ├── forecasting_dag.py
│ │ └── clustering_dag.py
| └── ...
│
├── models # The folder that consists of files representing trained/retrained models as part of build jobs, etc
│ ├── project_build_id # the result of the model
│ ├── projectname_date_time
│ └── ...
│
├── src # The folder that consists of the source code related to data gathering, data preparation, feature extraction, etc.
│ ├── data_gathering.py
│ ├── data_preparation.py
│ └── feature_extraction.py
├── Dockerfile
├── docker-compose.yml
├── .gitignore
├── requirements.txt
├── .editorconfig
└── README.md