# Calculadora Estatística 
###### v: 4.3
Programa desenvolvido para utilização na analíse de dados dentro do Laboratório de Física I e para introdução a linguagem de programação, podendo ter outras utilidades.<br>
 **Autor**: Carlos Augusto  Rodrigues de Oliveira <br>**Orientadoras:** Mariana Pojar & Eliane de Fátima Chinaglia
 ## Contato

Caso queira enviar sugestões ou reportar algum problema entre em contato em: 

* Email: uniecaoliveira@fei.edu.br
* GitHub: [carlos-metalzin](https://github.com/carlos-metalzin)
* Redes sociais:  
    - __[Twitter](https://twitter.com/gustc_carlos)__
    - __[Instagram](https://www.instagram.com/gustc_carlos/)__
    
## Instruções
Algumas instruções para utilizar o programa corretamente: 
1. Para utilizar as linhas de codigo selecione-a e utilize o comando "run" no canto superior da sua pagina ou pressionando a tecla f5 
2. Lembre-se sempre de deixar o arquivo de dados junto com o arquivo do programa (na mesma pasta)
3. Para mais instruções acesse: __[Tutorial](https://github.com/carlos-metalzin/Calculadora-Estatistica_4.3)__

# Hello World 
##  Importando as bibliotecas utilizadas
Para otimizar o código utilizamos bibliotecas externas com funcionalides diversas, para consulta-las acesse: 
- statistics: https://docs.python.org/3.9/library/statistics.html
- Pandas: https://pandas.pydata.org/
- Numpy: https://numpy.org/
- Matplotlib: https://matplotlib.org/
- Plotly: https://plotly.com/python/

In [2]:
import numpy as np
import statistics as st
import pandas as pd
import matplotlib.pyplot as plt 
!pip install plotly
import plotly.express as px
%matplotlib inline 



## Criando as funções
Neste momento vamos trabalhar com o funcionamento do programa.

### Leitura do arquivo de dados
Caso queira analisar um arquivo de dados é necessário utilizar essa função. <br>Para isso lembre-se de deixar seu arquivo na mesma pasta do programa e insira o nome do arquivo (indicando a extensão) entre aspas no campo indicado. 

In [None]:
def read():
    valores = []
    arquivo_de_dados = pd.read_csv('Coloque o nome do seu arquivo aqui.csv', sep=';') # colocar o endereço do seu arquivo aqui (com a extensão)
    for y in arquivo_de_dados:
        try:
            y = str(y).replace(',', '.')
            float(y)
        except:
            print()
        else:
            valores.append(float(y))
        for x in arquivo_de_dados[y]:
            try:
                x = str(x).replace(',', '.')
                float(x)
            except:
                print('O dado a seguir estava no seu arquivo de dados e foi ignorado por não ser um valor: ')
                print(x, ' = ', type(x))
                print('-' * 30)
            else:
                valores.append(float(x))
    return valores
dados = read()
dados

### Analise preliminar
Nesta primeirta etapa vamos obter dados basicos do seu arquivo de dados. É importante que confira as informações referentes aos seus dados para não ocarrer interpretações equivocadas!

In [None]:
print(f'Número de elementos: {len(dados)}\nMaior valor: {max(dados)}\nMenor valor: {min(dados)}')

### Média aritmética $ \overline{x} $
### $$ \overline{x} = \frac{\sum_{i=1}^{n}x_{i}}{n} \\ $$
Estima a centralidade do nosso conjunto de dados, podendo representar uma boa estimativa entre o conjunto de valores que nem sempre é confiável.

In [None]:
media = round(st.mean(dados),2) #Escolha o número de casas decimais exibidas aqui
print(f'Média aritmética simples: {media}')

### Desvio Padrão $ \sigma $ 
### $$ \sigma = \sqrt{\frac{\Sigma (x_{i}-\overline{x})^2}{n-1}}  $$
Expressa a dispersão dos conjunto de dados, ou seja, a partir do **desvio padrão** é possivel avaliar a confiança do seu aquivo de dados. Quanto maior o desvio, menor é a confiança no conjunto de dados. 

In [None]:
desvio = round(st.stdev(dados),3) #Escolha o número de casas decimais exibidas aqui
print(f'Desvio Padrão: {desvio}')

### Incerteza estatistica ou Desvio padrão da média $ \sigma_{e} $
### $$ \sigma_{e} = \frac{\sigma}{\sqrt{n}} $$
Utilizado para avaliar a propragação dos erros nas medidas. 

In [None]:
IE = st.stdev(dados) / (len(dados) ** (1 / 2))
IEA = round(IE,2) #Escolha o número de casas decimais exibidas aqui
print(f'Incerteza estatística: {IEA}')

### Incerteza Residual $ \sigma_{r} $
### $$ \sigma_{r} = \frac{resolução}{2} $$
**Resoulução**: Menor divisão que um instrumento pode representar.<br>
A _Incerteza Residual_ avalia os erros em relação ao instrumento utilizado. 
**Caso não possua resolução insira 0(zero). 
### Incerteza Padrão ou Desvio final da média
### $$ \sigma_{p} = \sqrt{\sigma_{e}^2 + \sigma_{r}^2} $$
Obtido propagando as incertezas. 

In [None]:
r = float(input('Resolução do instrumento: '))
IE = st.stdev(dados) / (len(dados) ** (1 / 2))
IP = (IE ** 2 + (r/2) ** 2) ** (1 / 2)
IPA = round(IP,2) #Escolha o número de casas decimais exibidas aqui
print(f'Incerteza Padrão: {IPA}')

## Gráficos 
Com python é possível fazer plotagens simples e complexas com seu arquivo de dados, utilizamos alguns exemplos aqui, experimente mudar dados do código e observe como pode manipular o gráfico para melhores interpretações. 
### Histograma 
O histograma é um gráfico de barras que indentifica a frequência de valores num conjunto de dados. Utilizado para demonstrar dispersão.<br>
Nesta linha utilizamos o Plotly, uma biblioteca que cria gráficos inteirativos para contribuir com a experiência do usúario. Passe o mouse em cima do seu gráfico para ter detalhes visuais. <br> 
Entre os comandos dísponiveis você pode:
- Dar zoom 
- Mover o gráfico 
- Baixa-lo em um arquivo png 
- etc. 


In [None]:
df = pd.DataFrame(dados)
fig = px.histogram(dados, nbins = 30,title='Histograma', text_auto= True )
fig.show()

### Box plot
O Box Plot é um gráfico alternativo ao histograma com a finalidade de indicar característica estatísticas de maneira visual e intuitiva, como indicando a dispersão do seu conjunto de dados. Por ser gráfico pouco visto, abaixo foi colocado um exemplo com breve legenda.
#### _Exemplo:_ 
![boxplot](https://www.alura.com.br/artigos/assets/boxplot/imagem-2.png)
#### Legenda:
* Mediana: valor que expressa o valor do meio no seu conjunto de dados.  
* Quartil inferior ou Primeiro quartil: o quartil que representa os **25% menores** valores em relação a mediana
* Quartil superrio ou Terceiro quartil: o quartil que representa os **25% maiores** valores em relação a mediana  
* Discrepantes ou Outliers: valores discrepantes no arquivo de dados.
* Limites: construídos a partir do intervalo interquartilíco <br>
Obs: É recomendado que o usúario pesquise e entenda o funcionamento do gráfico BoxPlot para uma melhor interpretação.

### Com Plotly
Aqui seu arquivo de dados será plotado em um boxplot utilizando a biblioteca do Plotly. Este gráfico apresenta as mesmas funcionalidades que o histograma, experimente!

In [None]:
df = pd.DataFrame(dados)
fig = px.box(df,title = 'BoxPlot', orientation= 'h')
fig.show()