<a href="https://colab.research.google.com/github/clobos/Bioestatistica_ESALQ_Python_2025/blob/main/probabilidades_aula1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Introdução à Probabilidade para Ciências Biológicas

## Conceitos Fundamentais da Probabilidade

A probabilidade é uma ferramenta matemática essencial em biologia, utilizada para entender e prever fenômenos que envolvem incerteza, como a herança genética, a distribuição de espécies ou a eficácia de um tratamento médico.

1. **Experimento Aleatório**

Um experimento aleatório é qualquer processo que pode ser repetido em condições idênticas e cujo resultado não pode ser previsto com certeza. Embora o resultado seja incerto, todos os resultados possíveis são conhecidos.

Exemplo em Biologia: Lançar uma moeda é um experimento aleatório clássico. Em biologia, o cruzamento entre dois organismos heterozigotos (Aa x Aa) para um gene é um experimento aleatório, pois não podemos prever com certeza o genótipo de cada descendente, mas sabemos que os resultados possíveis são AA, Aa e aa.

2. **Espaço Amostral** (Ω)

O espaço amostral é o conjunto de todos os resultados possíveis de um experimento aleatório. Ele é representado pela letra grega ômega (Ω).

Exemplo em Biologia:
Cruzamento Aa x Aa: O espaço amostral é Ω={AA,Aa,aa}.
Sorteio de um tipo sanguíneo em uma população (assumindo apenas A, B e O): O espaço amostral é Ω={A,B,O}.
Observar a cor de uma flor de uma planta que pode ser branca (B) ou roxa (R): O espaço amostral é Ω={B,R}.

3. **Evento** (E)
Um evento é qualquer subconjunto do espaço amostral. Ele representa um resultado ou um conjunto de resultados de interesse.

Exemplo em Biologia:
Experimento (Cruzamento Aa x Aa):

Evento 1: Obter um descendente com genótipo heterozigoto. O evento é E1​={Aa}.

Evento 2: Obter um descendente com genótipo dominante (homozigoto ou heterozigoto). O evento é E2​={AA,Aa}.




# Teoria de Conjuntos e Diagrama de Venn

A teoria de conjuntos é fundamental para entender como os eventos se relacionam. Os diagramas de Venn são representações visuais que facilitam essa compreensão.

4. **União** (A∪B)
A união de dois eventos, A∪B, representa a ocorrência de pelo menos um deles. No diagrama de Venn, é a área que cobre ambos os círculos.

Exemplo em Biologia:
Experimento (Analisar um paciente):
Evento A: O paciente tem o gene para a doença X.
Evento B: O paciente tem o gene para a doença Y.
A união A∪B significa que o paciente tem o gene para a doença X ou para a doença Y (ou para ambas).

5. **Interseção** (A∩B)
A interseção de dois eventos, A∩B, representa a ocorrência de ambos os eventos simultaneamente. No diagrama de Venn, é a área em que os círculos se sobrepõem.

Exemplo em Biologia:
Experimento (Analisar um paciente):
Evento A: O paciente tem o gene para a doença X.
Evento B: O paciente tem o gene para a doença Y.
A interseção A∩B significa que o paciente tem o gene para a doença X e para a doença Y.

6. **Eventos Disjuntos ou Mutuamente Exclusivos**
Dois eventos, A e B, são disjuntos ou mutuamente exclusivos se a ocorrência de um impede a ocorrência do outro. A interseção deles é o conjunto vazio (∅), ou seja, A∩B=∅. No diagrama de Venn, os círculos não se tocam.

Exemplo em Biologia:
Experimento (Cruzamento Aa x Aa):
Evento A: Obter um descendente homozigoto dominante (AA).
Evento B: Obter um descendente homozigoto recessivo (aa).
Os eventos A e B são mutuamente exclusivos, pois um descendente não pode ser AA e aa ao mesmo tempo.

7. **Evento Complementar** (Ac)
O evento complementar de um evento A, representado por Ac, é o conjunto de todos os resultados do espaço amostral que não estão em A.

Exemplo em Biologia:
Experimento (Cruzamento Aa x Aa):
Evento A: Obter um descendente com genótipo heterozigoto (Aa).
O evento complementar Ac é obter um descendente que não seja Aa, ou seja, {AA,aa}.



## Definições de Probabilidade

A probabilidade de um evento, P(E), é um número entre 0 e 1 que quantifica a chance de ele ocorrer.

8. **Definição Clássica (de Laplace)**

A probabilidade de um evento E é a razão entre o número de resultados favoráveis e o número total de resultados possíveis, assumindo que todos os resultados são igualmente prováveis.
P(E)=Número total de resultados possíveis/Número de resultados favoráveis.

Exemplo em Biologia:
Cruzamento Aa x Aa: O espaço amostral é Ω={AA,Aa,aa,Aa} (considerando a ordem dos alelos), com 4 resultados possíveis.

Evento E: Obter um descendente heterozigoto (Aa).
Resultados favoráveis: {Aa, aA}.
P(E)=2/4=0.5 ou 50%.

9. **Definição Frequentista**

A probabilidade de um evento é a frequência relativa com que ele ocorre em uma longa série de repetições do experimento.

Exemplo em Biologia:
Um pesquisador está testando a eficácia de um novo antibiótico em uma bactéria. Ele administra o antibiótico em 1000 colônias de bactérias e observa que 850 delas foram eliminadas.
A probabilidade (frequentista) de o antibiótico ser eficaz é P(eficaz)=850/1000=0.85 ou 85%.

10. **Definição Axiomática (de Kolmogorov)**

Esta é a definição mais rigorosa e formal. Ela se baseia em três axiomas:
A probabilidade de qualquer evento E é um número real não negativo: P(E)≥0.

A probabilidade do espaço amostral é 1: P(Ω)=1.

Se A e B são eventos mutuamente exclusivos, a probabilidade da união deles é a soma de suas probabilidades: P(A∪B)=P(A)+P(B).


# Exemplos em Python

In [25]:
import random

## EXPERIMENTO ALEATÓRIO (CRUZAMENTO GENÉTICO)

In [26]:
print("--- 1. Experimento Aleatório (Cruzamento Genético) ---")
pai1 = ["A", "a"]
pai2 = ["A", "a"]

print(f"Genótipo do pai 1: {pai1}")
print(f"Genótipo do pai 2: {pai2}")

print("\nSimulando 100 cruzamentos para observar os resultados possíveis:")
resultados_simulados = []
for i in range(100):
    genotipo_descendente = random.choice(pai1) + random.choice(pai2)
    # Ensure genotypes are consistent (Aa and aA are treated as Aa)
    if genotipo_descendente == "aA":
       genotipo_descendente = "Aa"
    resultados_simulados.append(genotipo_descendente)
    #print(f"Descendente {i+1}: {genotipo_descendente}")

# Create frequency table
from collections import Counter
frequencia_genotipos = Counter(resultados_simulados)

print("\nTabela de Frequência dos Genótipos:")
total_simulacoes = len(resultados_simulados)
for genotipo, contagem in frequencia_genotipos.items():
    porcentagem = (contagem / total_simulacoes) * 100
    print(f"{genotipo}: {contagem} ({porcentagem:.2f}%)")

--- 1. Experimento Aleatório (Cruzamento Genético) ---
Genótipo do pai 1: ['A', 'a']
Genótipo do pai 2: ['A', 'a']

Simulando 100 cruzamentos para observar os resultados possíveis:

Tabela de Frequência dos Genótipos:
Aa: 49 (49.00%)
aa: 29 (29.00%)
AA: 22 (22.00%)


## ESPAÇO AMOSTRAL E PROBABILIDADE CLÁSSICA

In [27]:
print("\n--- 2. Espaço Amostral e Probabilidade Clássica ---")
# O espaço amostral completo (com todas as combinações de alelos)
espaco_amostral = ["AA", "Aa", "aA", "aa"]
total_resultados = len(espaco_amostral)
print(f"Espaço Amostral: {espaco_amostral}")
print(f"Total de resultados possíveis: {total_resultados}")

# Evento 1: Obter genótipo 'AA'
evento_AA = ["AA"]
probabilidade_AA = len(evento_AA) / total_resultados
print(f"\nEvento 'AA': {evento_AA}")
print(f"Probabilidade de ser 'AA': {probabilidade_AA:.2f} ({probabilidade_AA*100}%)")

# Evento 2: Obter genótipo 'Aa' (incluindo 'aA')
evento_Aa = ["Aa", "aA"]
probabilidade_Aa = len(evento_Aa) / total_resultados
print(f"\nEvento 'Aa' (heterozigoto): {evento_Aa}")
print(f"Probabilidade de ser 'Aa': {probabilidade_Aa:.2f} ({probabilidade_Aa*100}%)")

# Evento 3: Obter genótipo 'aa'
evento_aa = ["aa"]
probabilidade_aa = len(evento_aa) / total_resultados
print(f"\nEvento 'aa': {evento_aa}")
print(f"Probabilidade de ser 'aa': {probabilidade_aa:.2f} ({probabilidade_aa*100}%)")

# Verificação da soma das probabilidades (Axioma 2)
soma_probabilidades = probabilidade_AA + probabilidade_Aa + probabilidade_aa
print(f"\nSoma das probabilidades (deve ser 1): {soma_probabilidades:.2f}")




--- 2. Espaço Amostral e Probabilidade Clássica ---
Espaço Amostral: ['AA', 'Aa', 'aA', 'aa']
Total de resultados possíveis: 4

Evento 'AA': ['AA']
Probabilidade de ser 'AA': 0.25 (25.0%)

Evento 'Aa' (heterozigoto): ['Aa', 'aA']
Probabilidade de ser 'Aa': 0.50 (50.0%)

Evento 'aa': ['aa']
Probabilidade de ser 'aa': 0.25 (25.0%)

Soma das probabilidades (deve ser 1): 1.00


## UNIÃO, INTERSEÇÃO E COMPLEMENTO (TEORIA DE CONJUNTOS)

In [28]:
print("\n--- 3. União, Interseção e Complemento (Teoria de Conjuntos) ---")
# Dados fictícios para uma população de 1000 pacientes
populacao = 1000
pacientes_com_X = 250
pacientes_com_Y = 150
pacientes_com_ambas = 50

# Eventos
prob_X = pacientes_com_X / populacao
prob_Y = pacientes_com_Y / populacao
prob_X_e_Y = pacientes_com_ambas / populacao

print(f"Probabilidade de ter a Doença X: {prob_X:.2f}")
print(f"Probabilidade de ter a Doença Y: {prob_Y:.2f}")
print(f"Probabilidade de ter a Doença X E a Doença Y (Interseção): {prob_X_e_Y:.2f}")

# União: P(X U Y) = P(X) + P(Y) - P(X ∩ Y)
prob_X_ou_Y = prob_X + prob_Y - prob_X_e_Y
print(f"Probabilidade de ter a Doença X OU a Doença Y (União): {prob_X_ou_Y:.2f}")

# Complemento: P(não X) = 1 - P(X)
prob_nao_X = 1 - prob_X
print(f"Probabilidade de NÃO ter a Doença X (Complementar): {prob_nao_X:.2f}")


--- 3. União, Interseção e Complemento (Teoria de Conjuntos) ---
Probabilidade de ter a Doença X: 0.25
Probabilidade de ter a Doença Y: 0.15
Probabilidade de ter a Doença X E a Doença Y (Interseção): 0.05
Probabilidade de ter a Doença X OU a Doença Y (União): 0.35
Probabilidade de NÃO ter a Doença X (Complementar): 0.75


## PROBABILIDADE FREQUENTISTA

In [29]:

print("\n--- 4. Probabilidade Frequentista ---")
# Dados da pesquisa de um antibiótico em 1000 colônias de bactérias
total_colonias_testadas = 1000
colonias_eliminadas = 850

# Cálculo da probabilidade com base na frequência observada
probabilidade_eficacia = colonias_eliminadas / total_colonias_testadas

print(f"Total de colônias testadas: {total_colonias_testadas}")
print(f"Colônias eliminadas (casos favoráveis): {colonias_eliminadas}")
print(f"Probabilidade frequentista de o antibiótico ser eficaz: {probabilidade_eficacia:.2f} ({probabilidade_eficacia*100}%)")


--- 4. Probabilidade Frequentista ---
Total de colônias testadas: 1000
Colônias eliminadas (casos favoráveis): 850
Probabilidade frequentista de o antibiótico ser eficaz: 0.85 (85.0%)


# Exercícios

In [30]:
import random
from math import comb

## Genética Clássica (Monohibridismo)

In [31]:

print("--- 1. Genética Clássica (Monohibridismo) ---")
# Pergunta: Qual a probabilidade de um descendente nascer com pelagem branca recessiva (bb)?
casos_possiveis = 4
casos_favoraveis = 1  # Apenas o genótipo bb

probabilidade_bb = casos_favoraveis / casos_possiveis
print(f"Probabilidade teórica de um descendente ser 'bb': {probabilidade_bb * 100:.2f}%\n")




--- 1. Genética Clássica (Monohibridismo) ---
Probabilidade teórica de um descendente ser 'bb': 25.00%



## Simulação de Herança Genética

In [32]:
print("--- 2. Simulação de Herança Genética ---")
# Pergunta: Simule o cruzamento 1000 vezes e calcule a frequência de descendentes com genótipo 'bb'.
pai1 = ['B', 'b']
pai2 = ['B', 'b']
simulacoes = 1000
resultados = []

for _ in range(simulacoes):
    genotipo = random.choice(pai1) + random.choice(pai2)
    resultados.append(genotipo)

frequencia_bb = resultados.count('bb')
probabilidade_simulada = frequencia_bb / simulacoes

print(f"Frequência simulada de 'bb' em {simulacoes} cruzamentos: {frequencia_bb}")
print(f"Probabilidade simulada: {probabilidade_simulada * 100:.2f}%\n")




--- 2. Simulação de Herança Genética ---
Frequência simulada de 'bb' em 1000 cruzamentos: 210
Probabilidade simulada: 21.00%



## Mutações e Probabilidade

In [33]:
print("--- 3. Mutações e Probabilidade ---")
# Pergunta: Em uma população de 5000, quantos mutantes espera-se encontrar?
taxa_mutacao = 0.001
populacao = 5000

mutantes_esperados = populacao * taxa_mutacao
print(f"Espera-se encontrar {mutantes_esperados:.0f} mutantes em uma população de {populacao} indivíduos.\n")




--- 3. Mutações e Probabilidade ---
Espera-se encontrar 5 mutantes em uma população de 5000 indivíduos.



## Probabilidade de Eventos Disjuntos (Tipagem Sanguínea)

In [34]:



print("--- 4. Probabilidade de Eventos Disjuntos (Tipagem Sanguínea) ---")
# Pergunta: Qual a probabilidade de um indivíduo ter sangue tipo A ou B?
prob_A = 0.40
prob_B = 0.15

prob_A_ou_B = prob_A + prob_B
print(f"A probabilidade de ter sangue tipo A ou B é de {prob_A_ou_B * 100:.0f}%\n")




--- 4. Probabilidade de Eventos Disjuntos (Tipagem Sanguínea) ---
A probabilidade de ter sangue tipo A ou B é de 55%



## Evento Complementar

In [35]:



print("--- 5. Evento Complementar ---")
# Pergunta: Qual a probabilidade de um indivíduo NÃO ter sangue tipo O?
prob_O = 0.45

prob_nao_O = 1 - prob_O
print(f"A probabilidade de um indivíduo NÃO ter sangue tipo O é de {prob_nao_O * 100:.0f}%\n")




--- 5. Evento Complementar ---
A probabilidade de um indivíduo NÃO ter sangue tipo O é de 55%



## Probabilidade de Interseção (Eventos Independentes)

In [36]:

print("--- 6. Probabilidade de Interseção (Eventos Independentes) ---")
# Pergunta: Qual a probabilidade de um pássaro ter pena azul E bico amarelo?
prob_pena_azul = 0.6
prob_bico_amarelo = 0.4

prob_ambos = prob_pena_azul * prob_bico_amarelo
print(f"A probabilidade de ter pena azul e bico amarelo é de {prob_ambos * 100:.0f}%\n")




--- 6. Probabilidade de Interseção (Eventos Independentes) ---
A probabilidade de ter pena azul e bico amarelo é de 24%



## Probabilidade de União (Eventos Não-Disjuntos)

In [37]:
print("--- 7. Probabilidade de União (Eventos Não-Disjuntos) ---")
# Pergunta: Qual a probabilidade de uma árvore ser da espécie A ou B?
prob_A_arvore = 0.35
prob_B_arvore = 0.25
prob_intersecao_arvore = 0.05

prob_uniao_arvore = prob_A_arvore + prob_B_arvore - prob_intersecao_arvore
print(f"A probabilidade de uma árvore ser da espécie A ou B é de {prob_uniao_arvore * 100:.0f}%\n")



--- 7. Probabilidade de União (Eventos Não-Disjuntos) ---
A probabilidade de uma árvore ser da espécie A ou B é de 55%



## População e Amostragem

In [38]:

print("--- 8. População e Amostragem ---")
# Pergunta: Qual a probabilidade de um peixe retirado aleatoriamente estar doente?
total_peixes = 1500
peixes_doentes = 300

probabilidade_doente = peixes_doentes / total_peixes
print(f"A probabilidade de selecionar um peixe doente é de {probabilidade_doente * 100:.0f}%\n")




--- 8. População e Amostragem ---
A probabilidade de selecionar um peixe doente é de 20%



## Simulação de Amostragem

In [39]:
print("--- 9. Simulação de Amostragem ---")
# Pergunta: Em uma amostra de 50 peixes, quantos, em média, estariam doentes?
amostra = 50
doentes_esperados = probabilidade_doente * amostra
print(f"Em uma amostra de {amostra} peixes, espera-se encontrar {doentes_esperados:.0f} peixes doentes.\n")




--- 9. Simulação de Amostragem ---
Em uma amostra de 50 peixes, espera-se encontrar 10 peixes doentes.



## Epidemiologia

In [40]:
print("--- 10. Epidemiologia ---")
# Pergunta: Qual a probabilidade de uma pessoa selecionada aleatoriamente NÃO ter a doença?
taxa_doenca = 0.05
prob_nao_ter_doenca = 1 - taxa_doenca

print(f"A probabilidade de uma pessoa não ter a doença é de {prob_nao_ter_doenca * 100:.0f}%\n")




--- 10. Epidemiologia ---
A probabilidade de uma pessoa não ter a doença é de 95%



## Probabilidade em Cadeia Alimentar

In [41]:

print("--- 11. Probabilidade em Cadeia Alimentar ---")
# Pergunta: Qual a probabilidade de o coelho ser caçado?
prob_encontrar_predador = 0.3
prob_fugir_dado_encontrar = 0.8
prob_nao_fugir_dado_encontrar = 1 - prob_fugir_dado_encontrar

prob_ser_cacado = prob_encontrar_predador * prob_nao_fugir_dado_encontrar
print(f"A probabilidade de o coelho ser caçado é de {prob_ser_cacado * 100:.0f}%\n")




--- 11. Probabilidade em Cadeia Alimentar ---
A probabilidade de o coelho ser caçado é de 6%



## Distribuição de Espécies

In [42]:

print("--- 12. Distribuição de Espécies ---")
# Pergunta: Qual a probabilidade de 5 árvores selecionadas serem todas carvalhos?
prob_carvalho = 0.5
amostra_arvores = 5

prob_cinco_carvalhos = prob_carvalho ** amostra_arvores
print(f"A probabilidade de 5 árvores serem carvalhos é de {prob_cinco_carvalhos * 100:.2f}%\n")




--- 12. Distribuição de Espécies ---
A probabilidade de 5 árvores serem carvalhos é de 3.12%



## Probabilidade Condicional (Doença)

In [43]:

print("--- 13. Probabilidade Condicional (Doença) ---")
# Pergunta: Qual a probabilidade de uma pessoa ter a doença E apresentar o sintoma Y?
prob_doenca_X = 0.10
prob_sintoma_Y_dado_X = 0.80

prob_ambos = prob_doenca_X * prob_sintoma_Y_dado_X
print(f"A probabilidade de ter a doença X e o sintoma Y é de {prob_ambos * 100:.0f}%\n")




--- 13. Probabilidade Condicional (Doença) ---
A probabilidade de ter a doença X e o sintoma Y é de 8%



## Variação de Cores em Flores

In [44]:


print("--- 14. Variação de Cores em Flores ---")
# Pergunta: Qual a probabilidade de, ao selecionar duas flores, uma ser vermelha e a outra branca?
prob_vermelha = 0.2
prob_branca = 0.5

prob_total = (prob_vermelha * prob_branca) + (prob_branca * prob_vermelha)
print(f"A probabilidade de uma flor ser vermelha e a outra branca é de {prob_total * 100:.0f}%\n")




--- 14. Variação de Cores em Flores ---
A probabilidade de uma flor ser vermelha e a outra branca é de 20%



## Análise de DNA

In [45]:


print("--- 15. Análise de DNA ---")
# Pergunta: Qual a probabilidade de uma amostra conter ambos os alelos?
prob_alelo_A = 0.7
prob_alelo_B = 0.8

prob_ambos_alelos = prob_alelo_A * prob_alelo_B
print(f"A probabilidade de uma amostra conter os alelos A e B é de {prob_ambos_alelos * 100:.0f}%\n")




--- 15. Análise de DNA ---
A probabilidade de uma amostra conter os alelos A e B é de 56%



## Frequência de Doença em Gêmeos

In [46]:

print("--- 16. Frequência de Doença em Gêmeos ---")
# Pergunta: Se um gêmeo idêntico tem a doença, qual a probabilidade de o outro também ter?
prob_gemeo2_dado_gemeo1 = 0.70

print(f"A probabilidade de o segundo gêmeo ter a doença, dado que o primeiro já tem, é de {prob_gemeo2_dado_gemeo1 * 100:.0f}%\n")




--- 16. Frequência de Doença em Gêmeos ---
A probabilidade de o segundo gêmeo ter a doença, dado que o primeiro já tem, é de 70%



## Simulação de Mutação Gênica

In [47]:


print("--- 17. Simulação de Mutação Gênica ---")
# Pergunta: Simule 1000 divisões celulares e conte quantas mutações ocorreram.
prob_mutacao = 0.005
divisoes = 1000
mutacoes_simuladas = 0

for _ in range(divisoes):
    if random.random() < prob_mutacao:
        mutacoes_simuladas += 1

print(f"Em {divisoes} divisões, ocorreram {mutacoes_simuladas} mutações (simuladas).\n")




--- 17. Simulação de Mutação Gênica ---
Em 1000 divisões, ocorreram 10 mutações (simuladas).



## Probabilidade de Sobrevivência (Distribuição Binomial)

In [48]:
print("--- 18. Probabilidade de Sobrevivência (Distribuição Binomial) ---")
# Pergunta: Qual a probabilidade de um predador caçar exatamente 2 de 10 presas?
n = 10  # Número de tentativas
k = 2   # Número de sucessos desejados
p = 0.20 # Probabilidade de sucesso (caçar)

probabilidade_binomial = comb(n, k) * (p**k) * ((1-p)**(n-k))
print(f"A probabilidade de caçar exatamente 2 presas é de {probabilidade_binomial * 100:.2f}%\n")




--- 18. Probabilidade de Sobrevivência (Distribuição Binomial) ---
A probabilidade de caçar exatamente 2 presas é de 30.20%



## Análise de Sequência de DNA

In [49]:
print("--- 19. Análise de Sequência de DNA ---")
# Pergunta: Qual a probabilidade de uma sequência de 5 bases ser "ATCGT"?
prob_base = 0.25
comprimento_sequencia = 5

prob_sequencia = prob_base ** comprimento_sequencia
print(f"A probabilidade de a sequência ser 'ATCGT' é de {prob_sequencia * 100:.4f}%\n")




--- 19. Análise de Sequência de DNA ---
A probabilidade de a sequência ser 'ATCGT' é de 0.0977%



## Prevalência de Doença

In [50]:

print("--- 20. Prevalência de Doença ---")
# Pergunta: Qual a prevalência (frequência) da doença na amostra testada?
amostra = 500
plantas_doentes = 80

prevalencia = plantas_doentes / amostra
print(f"A prevalência da doença nas plantas testadas é de {prevalencia * 100:.0f}%\n")

--- 20. Prevalência de Doença ---
A prevalência da doença nas plantas testadas é de 16%



# Probabilidade condicional

In [51]:
import pandas as pd

def analisar_tabela_contingencia(dados, titulo):
    """
    Função para calcular e exibir probabilidades marginais, conjuntas e condicionais
    a partir de uma tabela de contingência 2x2.

    Args:
        dados (dict): Um dicionário com os dados da tabela.
        titulo (str): O título para o exemplo.
    """
    print("=" * 60)
    print(f"Exemplo: {titulo}")
    print("=" * 60)

    df = pd.DataFrame(dados)

    # Adiciona a linha de totais (margens)
    df.loc['Total'] = df.sum()

    # Adiciona a coluna de totais (margens)
    df['Total'] = df.sum(axis=1)

    print("\nTabela de Contingência Completa:")
    print(df)
    print("\n" + "-"*30)

    # Nomes das variáveis para os cálculos
    row_label = list(dados.keys())[0]
    col_label = list(dados.keys())[1]

    row_cat1 = list(dados[row_label].keys())[0]
    row_cat2 = list(dados[row_label].keys())[1]
    col_cat1 = list(dados.keys())[0]
    col_cat2 = list(dados.keys())[1]


    # Probabilidades Marginais
    total_geral = df.loc['Total', 'Total']

    # Probabilidades das linhas
    prob_linha1 = df.iloc[0, 2] / total_geral
    prob_linha2 = df.iloc[1, 2] / total_geral

    # Probabilidades das colunas
    prob_coluna1 = df.iloc[2, 0] / total_geral
    prob_coluna2 = df.iloc[2, 1] / total_geral

    print("\n1. Probabilidades Marginais:")
    print(f"P({row_cat1}) = {prob_linha1:.2f}")
    print(f"P({row_cat2}) = {prob_linha2:.2f}")
    print(f"P({col_cat1}) = {prob_coluna1:.2f}")
    print(f"P({col_cat2}) = {prob_coluna2:.2f}")

    # Probabilidades Conjuntas
    prob_conjunta1 = df.iloc[0, 0] / total_geral
    prob_conjunta2 = df.iloc[0, 1] / total_geral
    prob_conjunta3 = df.iloc[1, 0] / total_geral
    prob_conjunta4 = df.iloc[1, 1] / total_geral

    print("\n2. Probabilidades Conjuntas:")
    print(f"P({row_cat1} e {col_cat1}) = {prob_conjunta1:.2f}")
    print(f"P({row_cat1} e {col_cat2}) = {prob_conjunta2:.2f}")
    print(f"P({row_cat2} e {col_cat1}) = {prob_conjunta3:.2f}")
    print(f"P({row_cat2} e {col_cat2}) = {prob_conjunta4:.2f}")

    # Probabilidades Condicionais
    print("\n3. Probabilidades Condicionais:")

    # Exemplo de Condicional 1: Probabilidade da linha dado a coluna
    prob_condicional1 = df.iloc[0, 0] / df.iloc[2, 0]
    print(f"P({row_cat1} | {col_cat1}) = {prob_condicional1:.2f}")

    # Exemplo de Condicional 2: Probabilidade da coluna dado a linha
    prob_condicional2 = df.iloc[0, 1] / df.iloc[0, 2]
    print(f"P({col_cat2} | {row_cat1}) = {prob_condicional2:.2f}")

    print("\n" + "=" * 60 + "\n\n")

In [52]:
# Dados para cada exemplo
exemplo1_dados = {
    'Gene Presente': {'Penas Azuis': 60, 'Penas Verdes': 20},
    'Gene Ausente': {'Penas Azuis': 40, 'Penas Verdes': 80}
}
analisar_tabela_contingencia(exemplo1_dados, "Gene e Cor das Penas em Aves")



Exemplo: Gene e Cor das Penas em Aves

Tabela de Contingência Completa:
              Gene Presente  Gene Ausente  Total
Penas Azuis              60            40    100
Penas Verdes             20            80    100
Total                    80           120    200

------------------------------

1. Probabilidades Marginais:
P(Penas Azuis) = 0.50
P(Penas Verdes) = 0.50
P(Gene Presente) = 0.40
P(Gene Ausente) = 0.60

2. Probabilidades Conjuntas:
P(Penas Azuis e Gene Presente) = 0.30
P(Penas Azuis e Gene Ausente) = 0.20
P(Penas Verdes e Gene Presente) = 0.10
P(Penas Verdes e Gene Ausente) = 0.40

3. Probabilidades Condicionais:
P(Penas Azuis | Gene Presente) = 0.75
P(Gene Ausente | Penas Azuis) = 0.40





In [53]:
import pandas as pd
df = pd.DataFrame(dados)

print(df)

              Gene Presente  Gene Ausente
Penas Azuis              60            40
Penas Verdes             20            80


In [54]:
exemplo2_dados = {
    'Pesticida': {'Doença': 80, 'Sem Doença': 70},
    'Sem Pesticida': {'Doença': 20, 'Sem Doença': 80}
}
analisar_tabela_contingencia(exemplo2_dados, "Doença e Exposição a um Fator de Risco em Ratos")



Exemplo: Doença e Exposição a um Fator de Risco em Ratos

Tabela de Contingência Completa:
            Pesticida  Sem Pesticida  Total
Doença             80             20    100
Sem Doença         70             80    150
Total             150            100    250

------------------------------

1. Probabilidades Marginais:
P(Doença) = 0.40
P(Sem Doença) = 0.60
P(Pesticida) = 0.60
P(Sem Pesticida) = 0.40

2. Probabilidades Conjuntas:
P(Doença e Pesticida) = 0.32
P(Doença e Sem Pesticida) = 0.08
P(Sem Doença e Pesticida) = 0.28
P(Sem Doença e Sem Pesticida) = 0.32

3. Probabilidades Condicionais:
P(Doença | Pesticida) = 0.53
P(Sem Pesticida | Doença) = 0.20





In [55]:
exemplo3_dados = {
    'Mutação Presente': {'Resistente': 75, 'Não Resistente': 25},
    'Mutação Ausente': {'Resistente': 15, 'Não Resistente': 35}
}
analisar_tabela_contingencia(exemplo3_dados, "Mutação Genética e Resistência a Antibióticos")



Exemplo: Mutação Genética e Resistência a Antibióticos

Tabela de Contingência Completa:
                Mutação Presente  Mutação Ausente  Total
Resistente                    75               15     90
Não Resistente                25               35     60
Total                        100               50    150

------------------------------

1. Probabilidades Marginais:
P(Resistente) = 0.60
P(Não Resistente) = 0.40
P(Mutação Presente) = 0.67
P(Mutação Ausente) = 0.33

2. Probabilidades Conjuntas:
P(Resistente e Mutação Presente) = 0.50
P(Resistente e Mutação Ausente) = 0.10
P(Não Resistente e Mutação Presente) = 0.17
P(Não Resistente e Mutação Ausente) = 0.23

3. Probabilidades Condicionais:
P(Resistente | Mutação Presente) = 0.75
P(Mutação Ausente | Resistente) = 0.17





In [56]:
exemplo4_dados = {
    'Polimorfismo': {'Doença': 90, 'Sem Doença': 60},
    'Sem Polimorfismo': {'Doença': 30, 'Sem Doença': 120}
}
analisar_tabela_contingencia(exemplo4_dados, "Traço Genético e Doença em Cães")

Exemplo: Traço Genético e Doença em Cães

Tabela de Contingência Completa:
            Polimorfismo  Sem Polimorfismo  Total
Doença                90                30    120
Sem Doença            60               120    180
Total                150               150    300

------------------------------

1. Probabilidades Marginais:
P(Doença) = 0.40
P(Sem Doença) = 0.60
P(Polimorfismo) = 0.50
P(Sem Polimorfismo) = 0.50

2. Probabilidades Conjuntas:
P(Doença e Polimorfismo) = 0.30
P(Doença e Sem Polimorfismo) = 0.10
P(Sem Doença e Polimorfismo) = 0.20
P(Sem Doença e Sem Polimorfismo) = 0.40

3. Probabilidades Condicionais:
P(Doença | Polimorfismo) = 0.60
P(Sem Polimorfismo | Doença) = 0.25





In [57]:
exemplo5_dados = {
    'Solo Poluído': {'Crescimento Alto': 30, 'Crescimento Baixo': 50},
    'Solo Não Poluído': {'Crescimento Alto': 70, 'Crescimento Baixo': 30}
}
analisar_tabela_contingencia(exemplo5_dados, "Nível de Poluição e Crescimento de Plantas")

Exemplo: Nível de Poluição e Crescimento de Plantas

Tabela de Contingência Completa:
                   Solo Poluído  Solo Não Poluído  Total
Crescimento Alto             30                70    100
Crescimento Baixo            50                30     80
Total                        80               100    180

------------------------------

1. Probabilidades Marginais:
P(Crescimento Alto) = 0.56
P(Crescimento Baixo) = 0.44
P(Solo Poluído) = 0.44
P(Solo Não Poluído) = 0.56

2. Probabilidades Conjuntas:
P(Crescimento Alto e Solo Poluído) = 0.17
P(Crescimento Alto e Solo Não Poluído) = 0.39
P(Crescimento Baixo e Solo Poluído) = 0.28
P(Crescimento Baixo e Solo Não Poluído) = 0.17

3. Probabilidades Condicionais:
P(Crescimento Alto | Solo Poluído) = 0.38
P(Solo Não Poluído | Crescimento Alto) = 0.70



