# Vari√¢ncia

A vari√¢ncia mede o qu√£o dispersos est√£o os valores de um conjunto de dados em rela√ß√£o √† m√©dia. √â calculada como a m√©dia dos quadrados das diferen√ßas entre cada valor e a m√©dia do conjunto.

# Desvio Padr√£o:

O desvio padr√£o √© uma medida de dispers√£o que indica o qu√£o distantes os valores de um conjunto de dados est√£o em rela√ß√£o √† m√©dia. √â a raiz quadrada da vari√¢ncia.

In [None]:
import numpy as np

data = [1, 2, 3, 4, 5]

variancia = np.var(data)  # Vari√¢ncia da popula√ß√£o
variancia_amostra = np.var(data, ddof=1)  # Vari√¢ncia da amostra

desvio_padrao = np.std(data)  # Desvio padr√£o da popula√ß√£o
desvio_padrao_amostra = np.std(data, ddof=1)  # Desvio padr√£o da amostra

print(f"Vari√¢ncia: {variancia}")
print(f"Vari√¢ncia da amostra: {variancia_amostra}")
print(f"Desvio padr√£o: {desvio_padrao}")
print(f"Desvio padr√£o da amostra: {desvio_padrao_amostra}")


# Quartil:
Quartis s√£o valores que dividem um conjunto de dados em quatro partes iguais. O primeiro quartil (Q1) √© o ponto abaixo do qual 25% dos dados se encontram, o segundo quartil (Q2) √© a mediana (50%), e o terceiro quartil (Q3) √© o ponto abaixo do qual 75% dos dados se encontram.
 para determinar Q1, Q2 (mediana) e Q3.
Q1 = 25¬∫ percentil, Q2 = 50¬∫ percentil (mediana), Q3 = 75¬∫ percentil.

# Percentil:

Percentis s√£o valores que dividem um conjunto de dados em 100 partes iguais. Por exemplo, o percentil 90 √© o valor abaixo do qual 90% dos dados se encontram.

# Diferen√ßa
Quartis e percentis s√£o ambos m√©todos para dividir um conjunto de dados ordenados em partes, mas a diferen√ßa entre eles est√° no n√∫mero de divis√µes e na granularidade dessas divis√µes.

# Outliers
Sao valores foras do comum , se tiver um acima do outlier superior √© um valor fora do comum e abaixo do lower bound tambem

In [None]:
import numpy as np

data = [1, 2, 3, 4, 5]

Q1 = np.quantile(data, 0.25)
Q2 = np.quantile(data, 0.50)  # Mediana
Q3 = np.quantile(data, 0.75)
P90 = np.percentile(data, 90)

# Calculando a diferen√ßa interquartil
IQR = Q3 - Q1

print(f"Q1: {Q1}")
print(f"Mediana (Q2): {Q2}")
print(f"Q3: {Q3}")
print(f"90¬∫ percentil: {P90}")
print(f"Diferen√ßa Interquartil (IQR): {IQR}")

# Calculando os limites para detectar outliers
lower_bound = Q1 - 1.5 * IQR
upper_bound = Q3 + 1.5 * IQR

# A m√©dia geom√©trica
A m√©dia geom√©trica √© uma maneira de calcular a m√©dia de um conjunto de n√∫meros que √© mais adequada para dados que se multiplicam ou crescem a uma taxa constante.

Como calcular:
**Multiplique todos os valores do conjunto.**
**Tire a raiz en√©sima desse produto, onde "n" √© o n√∫mero total de valores**.

In [None]:
from scipy.stats import gmean

data = [1, 2, 3, 4, 5]

media_geometrica = gmean(data)

print(f"M√©dia Geom√©trica: {media_geometrica}")


# M√©dia Harm√¥nica
A m√©dia harm√¥nica √© uma maneira de calcular a m√©dia que √© especialmente √∫til quando os dados s√£o taxas ou raz√µes.

**Como calcular:**

Pegue o inverso de cada valor (1 dividido pelo valor).
Calcule a m√©dia aritm√©tica desses inversos.
Pegue o inverso do resultado obtido no passo 2.
Exemplo:
Para os valores 1, 2, 4:

Inversos:
1
,
1/
2
,
1/
4
1,
2/
1
‚Äã
 ,
4/
1
‚Äã

M√©dia aritm√©tica dos inversos:
(1
+
1/
2
+
1/
4)//
3
=
1.75/
3
‚âà
0.583

Inverso de 0.583:

1/
0.583
‚âà
1.714


In [None]:
from scipy.stats import hmean

data = [1, 2, 3, 4, 5]

media_harmonica = hmean(data)

print(f"M√©dia Harm√¥nica: {media_harmonica}")


# M√©dia Quadr√°tica (ou M√©dia das Ra√≠zes Quadradas):

A m√©dia quadr√°tica √© a raiz quadrada da m√©dia dos quadrados dos valores de um conjunto de dados. √â especialmente √∫til quando se quer enfatizar valores maiores.
M√©dia Quadr√°tica
A m√©dia quadr√°tica (ou m√©dia das ra√≠zes quadradas) √© √∫til quando voc√™ quer enfatizar valores maiores em um conjunto de dados.

Como calcular:
Eleve cada valor ao quadrado.
Calcule a m√©dia desses quadrados.
Tire a raiz quadrada do resultado obtido no passo 2.
Exemplo:
Para os valores 1, 2, 3:

Quadrados:
1^
2
,
2^
2
,
3^
2
=
1
,
4,
9

M√©dia dos quadrados:
(1+4+9)//3
=
4.67


Raiz quadrada de 4.67:

4.67
‚âà
2.16


In [None]:
import numpy as np

data = [1, 2, 3, 4, 5]

media_quadratica = np.sqrt(np.mean(np.square(data)))

print(f"M√©dia Quadr√°tica: {media_quadratica}")


# Vari√¢ncia
Defini√ß√£o: A vari√¢ncia mede a dispers√£o dos dados em rela√ß√£o √† m√©dia. Indica o qu√£o espalhados est√£o os valores em um conjunto de dados.
C√°lculo:
Para uma popula√ß√£o:

ùúé
2
=
1/ùëÅ
‚àë
ùëñ=1(ùë•ùëñ‚àíùúá)^2

Onde
x
i
‚Äã

 s√£o os valores,


Œº √© a m√©dia da popula√ß√£o,

x √© a m√©dia da amostra,

N √© o tamanho da popula√ß√£o e

n √© o tamanho da amostra.

Uso: Utilizada para entender a variabilidade dos dados; valores maiores indicam maior dispers√£o.

In [None]:
import numpy as np

# Conjunto de dados
data = [1, 2, 3, 4, 5]

# Calculando a vari√¢ncia para a popula√ß√£o
variancia_populacao = np.var(data)

# Calculando a vari√¢ncia para a amostra
variancia_amostra = np.var(data, ddof=1)
#O DDOF √© para ajustar o denominador n=1 que usamos na amostra

print(f"Vari√¢ncia (Popula√ß√£o): {variancia_populacao}")
print(f"Vari√¢ncia (Amostra): {variancia_amostra}")
