In [1]:
# Célula 1: Importações e criação dos dados
import pandas as pd
import numpy as np
from fdth import fdt

df = pd.DataFrame({
    'Altura': [170, 175, 180, 165, 172, 168, 175, 170, 160, 155],
    'Peso': [70, 75, 80, 65, 72, 68, 75, 70, 60, 55],
    'Idade': [30, 20, 30, 18, 30, 27, 24, 50, 60, 9],
    'Sexo': ['M', 'I', 'M', 'I', 'M', 'F', 'I', 'F', 'F', 'F']
})

In [2]:
# Célula 2: Criação do MultipleFDT agrupado por Sexo
mfdt_by = fdt(df, by="Sexo")

print("MultipleFDT agrupado por 'Sexo':")
print(mfdt_by)

MultipleFDT agrupado por 'Sexo':

M

Altura
Class limits       f     rf  rf(%)   cf  cf(%)
----------------------------------------------
[168.3, 172.8)     2  0.667   66.7    2   66.7
[172.8, 177.3)     0      0    0.0    2   66.7
[177.3, 181.8)     1  0.333   33.3    3  100.0
----------------------------------------------

Peso
Class limits       f     rf  rf(%)   cf  cf(%)
----------------------------------------------
[69.3, 73.13)      2  0.667   66.7    2   66.7
[73.13, 76.97)     0      0    0.0    2   66.7
[76.97, 80.8)      1  0.333   33.3    3  100.0
----------------------------------------------

Idade
Class limits       f     rf  rf(%)   cf  cf(%)
----------------------------------------------
[29.7, 29.9)       0      0    0.0    0    0.0
[29.9, 30.1)       3      1  100.0    3  100.0
[30.1, 30.3)       0      0    0.0    3  100.0
----------------------------------------------

I

Altura
Class limits        f     rf  rf(%)   cf  cf(%)
--------------------------------------

In [3]:
# Célula 3: Estatísticas básicas por grupo
print("Médias por grupo:\n")
print(mfdt_by.mean())

print("\nMedianas por grupo:\n")
print(mfdt_by.median())

print("\nVariâncias por grupo:\n")
print(mfdt_by.var())

print("\nDesvios padrão por grupo:\n")
print(mfdt_by.sd())

Médias por grupo:

       Altura       Peso    Idade
M  173.550000  73.772222  30.0000
I  171.538889  71.316667  21.0300
F  164.095833  63.929167  39.0625

Medianas por grupo:

Empty DataFrame
Columns: []
Index: []

Variâncias por grupo:

      Altura       Peso       Idade
M  27.000000  19.592593    0.000000
I  26.601481  19.253333    4.579600
F  33.923032  26.895255  272.133492

Desvios padrão por grupo:

     Altura      Peso      Idade
M  5.196152  4.426352   0.000000
I  5.157662  4.387862   2.140000
F  5.824348  5.186064  16.496469


In [4]:
# Célula 4: Valores modais (MFV)
print("Valores Modais (MFV) por grupo:\n")
mfv_result = mfdt_by.mfv()
print(mfv_result)

Valores Modais (MFV) por grupo:

   Group Variable     MFV  Index
0      M   Altura  170.55      0
1      M     Peso   71.22      0
2      M    Idade   30.00      0
3      I   Altura  174.52      0
4      I     Peso   73.85      0
5      I    Idade   19.96      0
6      I    Idade   21.03      1
7      I    Idade   22.10      2
8      F   Altura  167.64      0
9      F     Peso   67.09      0
10     F    Idade   49.11      0


In [5]:
# Célula 5: Acessando variáveis específicas por grupo
print("Acessando variáveis específicas:")
print("\nAltura por grupo:")
alturas = mfdt_by['Altura']
for grupo, fdt_obj in alturas.items():
    print(f"\nGrupo {grupo}:")
    print(fdt_obj)

print("\n\nIdade por grupo:")
idades = mfdt_by['Idade']
for grupo, fdt_obj in idades.items():
    print(f"\nGrupo {grupo}:")
    print(fdt_obj)

Acessando variáveis específicas:

Altura por grupo:

Grupo M:
Class limits       f     rf  rf(%)   cf  cf(%)
----------------------------------------------
[168.3, 172.8)     2  0.667   66.7    2   66.7
[172.8, 177.3)     0      0    0.0    2   66.7
[177.3, 181.8)     1  0.333   33.3    3  100.0
----------------------------------------------

Grupo I:
Class limits        f     rf  rf(%)   cf  cf(%)
-----------------------------------------------
[163.35, 167.82)    1  0.333   33.3    1   33.3
[167.82, 172.28)    0      0    0.0    1   33.3
[172.28, 176.75)    2  0.667   66.7    3  100.0
-----------------------------------------------

Grupo F:
Class limits        f     rf  rf(%)   cf  cf(%)
-----------------------------------------------
[153.45, 159.53)    1   0.25   25.0    1   25.0
[159.53, 165.62)    1   0.25   25.0    2   50.0
[165.62, 171.7)     2    0.5   50.0    4  100.0
-----------------------------------------------


Idade por grupo:

Grupo M:
Class limits       f     rf  rf

In [6]:
# Célula 6: Quartis por grupo
print("Quartis (0.25, 0.5, 0.75) por grupo:")
quartis = mfdt_by.quantile([0.25, 0.5, 0.75])
print(quartis)

Quartis (0.25, 0.5, 0.75) por grupo:
                  Q1          Q2          Q3
M Altura    169.9875     171.675     178.425
  Peso       70.7375      72.175      77.925
  Idade        29.95        30.0       30.05
I Altura       166.7       173.4     175.075
  Peso          67.2        72.9      74.325
  Idade       19.425       21.03      22.635
F Altura  159.533333  165.616667  168.658333
  Peso     59.866667   65.283333   67.991667
  Idade        26.14       43.37      51.985


In [7]:
# Célula 7: Percentis específicos
print("Percentis 10, 50, 90 por grupo:")
percentis = mfdt_by.quantile([10, 50, 90], by=100)
print(percentis)

Percentis 10, 50, 90 por grupo:
                  Q1          Q2          Q3
M Altura     168.975     171.675      180.45
  Peso        69.875      72.175       79.65
  Idade        29.92        30.0       30.08
I Altura      164.69       173.4      176.08
  Peso         65.49        72.9       75.18
  Idade       18.462       21.03      23.598
F Altura  155.883333  165.616667  170.483333
  Peso     56.616667   65.283333   69.616667
  Idade       15.802       43.37      57.154


In [8]:
# Célula 8: Testando com dados categóricos
print("Testando com dados categóricos:")
cat_data = pd.DataFrame({
    'Cor': ['Vermelho', 'Azul', 'Verde', 'Azul', 'Vermelho', 'Verde', 'Azul', 'Vermelho'],
    'Tamanho': ['P', 'M', 'G', 'M', 'P', 'G', 'M', 'P'],
    'Grupo': ['A', 'A', 'B', 'B', 'A', 'B', 'A', 'B']
})

mfdt_cat = fdt(cat_data, by="Grupo")
print("FDT Categórico agrupado:")
print(mfdt_cat)

print("\nMFV categórico:")
print(mfdt_cat.mfv())

Testando com dados categóricos:
FDT Categórico agrupado:

A

Cor
Category           f     rf  rf(%)   cf  cf(%)
----------------------------------------------
Azul               2    0.5   50.0    2   50.0
Vermelho           2    0.5   50.0    4  100.0
----------------------------------------------

Tamanho
Category           f     rf  rf(%)   cf  cf(%)
----------------------------------------------
M                  2    0.5   50.0    2   50.0
P                  2    0.5   50.0    4  100.0
----------------------------------------------

B

Cor
Category           f     rf  rf(%)   cf  cf(%)
----------------------------------------------
Azul               1   0.25   25.0    1   25.0
Vermelho           1   0.25   25.0    2   50.0
Verde              2    0.5   50.0    4  100.0
----------------------------------------------

Tamanho
Category           f     rf  rf(%)   cf  cf(%)
----------------------------------------------
M                  1   0.25   25.0    1   25.0
P               