# FDT Function Testing
Este caderno demonstra o uso das funções FDT para gerar tabelas de distribuição de frequência e sumarizar dados em diferentes formatos.
Exploraremos diferentes exemplos para diversos casos de uso, incluindo quadros de dados, matrizes e séries de dados personalizadas.

In [None]:
from fdth.fdt_data_frame import fdt_data_frame
import pandas as pd

# Test 1: A simple DataFrame with a single numeric column
df1 = pd.DataFrame({
    'A': [1, 2, 2, 3, 3, 3, 4, 4, 4, 4]
})
result1 = fdt_data_frame(df1)
print(result1)

# Test 2: A DataFrame with two numeric columns
df2 = pd.DataFrame({
    'A': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
    'B': [10, 9, 8, 7, 6, 5, 4, 3, 2, 1]
})
print('\nTest 2 (without grouping):')
result2 = fdt_data_frame(df2)
print(result2)

# Test 3: DataFrame with grouping
df3 = pd.DataFrame({
    'A': [1, 2, 2, 3, 3, 3, 4, 4, 4, 4],
    'B': [10, 20, 20, 30, 30, 30, 40, 40, 40, 40],
    'Group': ['G1', 'G1', 'G1', 'G1', 'G2', 'G2', 'G2', 'G2', 'G2', 'G2']
})
result3 = fdt_data_frame(df3, by='Group')
print(result3)


### FDT Default Testing
Os testes a seguir demonstram como usar a função `fdt_default`, incluindo diferentes métodos de cálculo de classes, como Freedman-Diaconis, Sturges e intervalos fixos.

In [None]:
import numpy as np
from fdth.fdt_default import fdt_default

# Test 1
# Testa o método de cálculo de classes usando a regra de Freedman-Diaconis ('FD').
dados = np.array([2, 5, 7, 10, 12, 15, 18])
resultado = fdt_default(dados, breaks='Sturges')
print(resultado['table'])

# Teste 2
# Testa a criação de uma tabela de frequência definindo um número fixo de classes (k=4).
dados = np.array([3, 6, 9, 12, 15, 18, 21])
resultado = fdt_default(dados, k=4)
print(resultado['table'])

# Teste 3
# Testa o uso de valores iniciais (start) e finais (end) personalizados para a tabela.
dados = np.array([1, 4, 7, 10, 13, 16, 19])
resultado = fdt_default(dados, start=0, end=20)
print(resultado['table'])

# Teste 4
# Testa a especificação de um intervalo fixo (h=8) para as classes, com limites iniciais e finais definidos.
dados = np.array([10, 15, 20, 25, 30, 35, 40])
resultado = fdt_default(dados, start=10, end=50, h=8)
print(resultado['table'])

# Teste 5
# Testa o comportamento da função ao encontrar valores ausentes (None) no array, com na_rm=False.
try:
    dados = np.array([2, None, 8, 10, None, 18])
    resultado = fdt_default(dados, na_rm=False)
except ValueError as e:
    print('Erro:', e)

# Teste 6
# Testa se a função detecta inconsistências nos parâmetros (k e h definidos simultaneamente).
try:
    dados = np.array([1, 2, 3, 4])
    resultado = fdt_default(dados, start=1, end=5, k=2, h=1)
except ValueError as e:
    print('Erro:', e)


### FDT Matrix Testing
Os exemplos a seguir mostram o uso de `fdt_matrix`, que calcula tabelas de distribuição de frequência a partir de matrizes usando diferentes métodos de cálculo de classe.

In [None]:
from fdth.fdt_matrix import fdt_matrix

# Input matrix for testing
data_matrix = np.array([
    [1, 10],
    [2, 20],
    [3, 30],
    [4, 40],
    [5, 50]
])
# Test with a specified number of classes
result_k3 = fdt_matrix(data_matrix, k=3, right=False, na_rm=False)
print(result_k3)


### FDT Multiple Testing
Esta seção testa a função `make_fdt_multiple` que manipula múltiplas séries de dados e calcula a tabela de distribuição de frequência.

In [None]:
from fdth.make_fdt_multiple import make_fdt_multiple
import pandas as pd
import numpy as np

# Test 1
x_uniform = pd.Series([10, 15, 20, 25, 30, 35, 40])
result_uniform_python = make_fdt_multiple(x=x_uniform, breaks='Sturges', right=False, na_rm=True)
print(result_uniform_python['table'])
print(result_uniform_python['breaks'])


### FDT Simple Testing
A função `make_fdt_simple` nos permite calcular uma tabela de distribuição de frequência para intervalos simples.

In [None]:
from fdth.make_fdt_simple import make_fdt_simple

# Test 1: Basic intervals
x = np.array([5, 10, 15, 20, 25, 30, 35])
start = 0
end = 40
h = 10
print('Test 1 - Basic intervals')
print(make_fdt_simple(x, start, end, h))


### FDT Default Printing and Summarization
Nesta seção, exploramos como usar `print_fdt_default` para formatar e resumir tabelas de distribuição de frequência geradas por `fdt_default`.

In [None]:
from fdth.print_fdt_default import print_fdt_default
from fdth.fdt_default import fdt_default

# Vetor inicial
x = [6.34, 4.57, 7.89, 5.12, 4.26, 5.77, 2.95, 8.13, 3.48, 6.05, 
     4.93, 6.88, 7.21, 3.69, 5.55, 2.87, 5.02, 4.31, 6.79, 3.98, 
     7.44, 5.36, 6.12, 4.59, 8.27, 3.65, 5.48, 7.81, 3.93, 5.67]

# Gera uma tdf 
tdf_x = fdt_default(x = x, breaks='Sturges')

# Faz a sumarização e formatação de duas maneiras diferentes 
print('Exemplo com seleção de colunas e nome de colunas')
print_fdt_default(tdf_x, columns=[0,1,2], round=2, format_classes=False, row_names=True)
print()
print('Exemplo com seleção de colunas e formatação de classes')
col = [0, 3, 5]
print_fdt_default(tdf_x, columns = col, format_classes = True, pattern = '{:.5e}')


### FDT Default Summary
Resumindo tabelas de distribuição de frequência com saída formatada usando `summary_fdt_default`.

In [None]:
from fdth.summary_fdt_default import summary_fdt_default
from fdth.fdt_default import fdt_default

# Vetor inicial
x = [6.34, 4.57, 7.89, 5.12, 4.26, 5.77, 2.95, 8.13, 3.48, 6.05, 
     4.93, 6.88, 7.21, 3.69, 5.55, 2.87, 5.02, 4.31, 6.79, 3.98, 
     7.44, 5.36, 6.12, 4.59, 8.27, 3.65, 5.48, 7.81, 3.93, 5.67]

# Gera uma tdf 
tdf_x = fdt_default(x = x, breaks='Sturges')

# Faz a sumarização e formatação de duas maneiras diferentes 
summary_fdt_default(tdf_x, columns=[0,1,2], round=2, format_classes=False, row_names=True)
print()
summary_fdt_default(tdf_x, columns = col, format_classes = True, pattern = '{:.5e}')
