O objetivo deste código é mostrar as medidas de tendência central e de dispersão para diferentes tamanhos de amostras de uma população de 1.000.000 de elementos.

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# 1. Gerar população com 1000000 valores de distribuição normal
np.random.seed(1)  # para reprodutibilidade
populacao = np.random.normal(loc=50, scale=10, size=1000000)  # média=50, desvio=10

# 2. Tamanhos de amostra
tamanhos = [5, 10, 20, 30, 40, 50, 100, 250, 500,1000,100000,1000000]

# 3. Armazenar resultados
resultados = []

for n in tamanhos:
    amostra = np.round(np.random.choice(populacao, size=n, replace=False),2)
    media = np.mean(amostra)
    mediana = np.median(amostra)
    moda = pd.Series(amostra).mode()
    moda_valor = moda.iloc[0] if not moda.empty else np.nan
    variancia = np.var(amostra)
    desvpad = np.std(amostra)

    resultados.append({
        "Tamanho da Amostra": n,
        "Média": round(media, 2),
        "Mediana": round(mediana, 2),
        "Moda": round(moda_valor, 2),
        "Variância": round(variancia, 2),
        "Desvio Padrão": round(desvpad, 2)
    })

# 4. Criar DataFrame com os resultados
df_resultados = pd.DataFrame(resultados)

print("Medidas de tendência central e de dispersão das amostras:")
print(df_resultados)

In [None]:
# Obtém dados da população inteira (a última linha)
ultima_linha = df_resultados.iloc[-1]

# Calcula as distâncias em relação à última linha
distancias = df_resultados.copy()
distancias.iloc[:, 1:] = df_resultados.iloc[:, 1:] - ultima_linha.iloc[1:]  # subtrai apenas colunas numéricas

print("Distâncias em relação aos parâmetros da população:")
print(distancias)

In [None]:
# Geração do gráfico
plt.figure(figsize=(8, 5))
plt.plot(df_resultados.iloc[:, 0], df_resultados.iloc[:, 1], marker='o', linestyle='-')

plt.xscale('log')  # Escala logarítmica no eixo X
plt.xlabel(df_resultados.columns[0])
plt.ylabel(df_resultados.columns[1])
plt.title("Gráfico de Linhas - Eixo X em Escala Logarítmica")
plt.grid(True, which="both", linestyle="--", linewidth=0.5)

plt.tight_layout()
plt.show()

In [None]:
# Geração do gráfico
plt.figure(figsize=(8, 5))
plt.plot(df_resultados.iloc[:, 0], df_resultados.iloc[:, 5], marker='o', linestyle='-')

plt.xscale('log')  # Escala logarítmica no eixo X
plt.xlabel(df_resultados.columns[0])
plt.ylabel(df_resultados.columns[5])
plt.title("Gráfico de Linhas - Eixo X em Escala Logarítmica")
plt.grid(True, which="both", linestyle="--", linewidth=0.5)

plt.tight_layout()
plt.show()