No mundo atual bilhões de dados são gerados diariamente por aplicativos, redes sociais, pesquisas na web, dispositivos de Internet das Coisas (IOT), entre outros. A análise desse grande volume de dados, que são variados e gerados velozmente, pode fornecer insights importantes sobre como tornar os serviços mais personalizáveis, aperfeiçoar as estratégias de marketing, gerar previsões em diversos contextos, como o risco de um indivíduo desenvolver determinado tipo de doença, além otimizar o funcionamento de diversos aparelhos, desde geladeiras até sensores.
No presente estudo vamos analisar os dados gerados por sensores de um detector de fumaça, a fim de encontrar relações entre os dados que ele gera e determinar técnicas que otimizem o seu processamento, reduzindo a ocorrência de falhas, a fim de torná-lo mais preciso e eficaz no controle de incêndios. Para isso serão utilizadas técnicas de ciência de dados, como análises estatísticas, análises gráficas e aplicação de algoritmos de machine learning, utilizando o Google Colab e bibliotecas da linguagem de programação Python, como numpy, scikit learn, scipy, pingouin, seaborn e matplotlib. Essa análise será feita com base em dados disponibilizados no Kaggle sobre um dispositivo IOT composto por sensores integrados para coleta de dados sobre a qualidade do ar em um determinado ambiente.
Essa análise possibilita a aquisição de conhecimentos fundamentais para análise de dados, como a estatística descritiva e inferencial, que são fundamentais para observar a presença de padrões e correlações entre os dados, possibilitando a compreensão dos fatores que levam a ocorrência de fenômenos e a possibilidade de executar previsões sobre situações futuras com base no comportamento do presente momento. Isso tem um grande impacto positivo para a sociedade, tendo em vista que no caso em questão, por exemplo, as previsões corretas podem evitar perdas humanas, animais e materiais.
Leia o relatório completo aqui.