Desafio Técnico - Cientista de Dados Júnior

Descrição

Bem-vindo! Este é um fork do repositório original do desafio e aqui estão as minhas respostas para o desafio técnico para a vaga de Cientista de Dados Júnior no Escritório Municipal de Dados do Rio de Janeiro. Este desafio tem o objetivo de avaliar habilidades técnicas em manipulação de dados, consulta SQL, análise de dados e visualização de dados utilizando ferramentas como BigQuery e Python. Para a visualização dos dados, criei uma aplicação local usando Streamlit.

Objetivo

O objetivo deste desafio é realizar análises exploratórias em conjuntos de dados públicos disponíveis no BigQuery, responder a perguntas específicas sobre esses dados utilizando SQL e Python, e criar visualizações informativas e visualmente atraentes. Nessa branch, você encontrará somente as consultas e respostas das perguntas dos desafios.

As perguntas estão disponíveis em perguntas_desafio.md;
As respostas estão disponíveis no arquivo Analise Python/analise_python.py;
As querys para as respostas estão disponíveis no arquivo Analise Python/analise_sql.py;
Todas as importações necessárias já foram feitas. Para visualizar os prints de resposta, você deve "descomentá-los" a medida que passa pela resolução das questões em analise_python.py, de acordo com o que deseja ver.

Conjunto de Dados

Os conjuntos de dados utilizados neste desafio são:

Chamados do 1746: Dados relacionados a chamados de serviços públicos na cidade do Rio de Janeiro. O caminho da tabela é : datario.administracao_servicos_publicos.chamado_1746
Bairros do Rio de Janeiro: Dados sobre os bairros da cidade do Rio de Janeiro - RJ. O caminho da tabela é: datario.dados_mestres.bairro
Ocupação Hoteleira em Grandes Eventos no Rio: Dados contendo o período de duração de alguns grandes eventos que ocorreram no Rio de Janeiro em 2022 e 2023 e a taxa de ocupação hoteleira da cidade nesses períodos. O caminho da tabela é: datario.turismo_fluxo_visitantes.rede_hoteleira_ocupacao_eventos

Todos esses caminhos já estão salvos em variáveis para que não haja erro de digitação ou repetição de código ao longo das consultas.

Ferramentas e Recursos

Você precisará de acesso ao Google Cloud Platform (GCP) para utilizar o BigQuery e consultar os dados públicos disponíveis no projeto datario. Além disso, vamos utilizar a biblioteca basedosdados em Python para acessar os dados do BigQuery.

Tutorial para acessar dados no BigQuery, desde a criação da conta no GCP até consultar os dados utilizando SQL e Python: Como acessar dados no BigQuery

Perguntas do Desafio

As perguntas do desafio estão detalhadas no arquivo perguntas_desafio.md. As respostas das perguntas estão nesta branch e a visualização dos dados podem ser acessadas na branch dashboards [certifique-se de ler o readme para acessar com sucesso a aplicação Streamlit].

Etapas

Siga o tutorial acima para criar sua conta no GCP e aprender como utilizar o BigQuery para consultar os dados. Você precisa ter um id válido de projeto para conseguir fazer as consultas do arquivo querys.py.
Com o Google Cloud Studio e BigQuery já configurados, é possível fazer as consultas disponíveis nos arquivos para construir a visualização dos dados (querys.py, alterando somente o id do projeto no início dos arquivos). A consulta só funcionará mediante a prévia configuração nas plataformas mencionadas e autenticação de conta.
Tenha certeza de que todos os pacotes listados em requirements.txt estão instalados e configurados propriamente nas variáveis do sistema. Para facilitar o processo, você pode criar e ativar o ambiente virtual e rodar o comando pip install -r requirements.txt, baixando tudo que é necessário de uma só vez.
Pronto. Agora podemos visualizar as respostas no arquivo de respostas já mencionado.

Possíveis problemas

Se as querys não estiverem funcionando corretamente, certifique-se de alterar o id da variável project_id pelo id do seu projeto criado na conta do Google Cloud no arquivo Dashboard/funcoes. Esse é o único dado que precisa ser alterado para que elas funcionem.

Contribuições

Para contribuir, sinta-se livre para criar issues no projeto e/ou entrar em contato.

Autoria

Por Milena Maia.
Email: milenamaiaaraujo@gmail.com

Name		Name	Last commit message	Last commit date
Latest commit History 46 Commits
Analise Python		Analise Python
README.md		README.md
faq.md		faq.md
perguntas_desafio.md		perguntas_desafio.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Desafio Técnico - Cientista de Dados Júnior

Descrição

Objetivo

Conjunto de Dados

Ferramentas e Recursos

Perguntas do Desafio

Etapas

Possíveis problemas

Contribuições

Autoria

About

Releases

Packages

Languages

mill3na/emd-desafio-junior-data-scientist

Folders and files

Latest commit

History

Repository files navigation

Desafio Técnico - Cientista de Dados Júnior

Descrição

Objetivo

Conjunto de Dados

Ferramentas e Recursos

Perguntas do Desafio

Etapas

Possíveis problemas

Contribuições

Autoria

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages