<div style="text-align: justify; padding: 20px; background-color: #000000; color: #ffffff; border-radius: 10px;">

# **Teste de hipóteses entre tomates da horta e da Fitotron**  
### **Autor: Pedro Thomazelli Ferreira**
📅 **Última modificação:** 21 de Novembro de 2024  

---

## **Trabalho principal: Impacto das mudanças climáticas no cultivo e consumo do tomate-cereja**
### **Autores principais: Ana Clara Batista Loponi e João Guilherme dos Santos Caramês**  

---

### **Resumo**  
<p style="text-align: justify; margin: 10px 50px;">
Nesse notebook, são feitos cálculos para determinação dos valores <b> p </b>, que visam confirmar hipóteses sobre caraceterísticas dos tomates em temperaturas diferentes. Na Fitotron, a temperatura é aquela que se que será atingida em 2050.
</p>

---

### **Palavras-chave**  
🔑 *Teste de hipótese, alimento, mudanças climáticas, segurança alimentar, cultivo, consumo, análise de alimentos*  

</div>

### Importações

In [29]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import scikit_posthocs as sp
from itertools import combinations
from scipy import stats

### Definindo variáveis

In [30]:
nivel_confianca = 0.95

significancia = 1 - nivel_confianca

### Função que recebe valor de significância

In [31]:
def valor_signif (pvalor, significancia):
    if pvalor < significancia:
        print(f'Como {pvalor = :.3f} < significância, rejeitamos a hipótese nula.')
    else:
        print(f'Como {pvalor = :.3f} > significância, devemos aceitar a hipótese nula.')

In [32]:
df = pd.read_excel('ValoresSolos.xlsx')
display(df)

Unnamed: 0,Amostra,N (g/kg),P (g/kg),K (g/kg),Ca (g/kg),Mg (g/kg),S (g/kg),B (mg/kg),Cu (mg/kg),Fe (g/kg),Mn (mg/kg),Zn (mg/kg),Na (mg/kg)
0,Inicial 1,6.4,1.5,2.3,3.6,1.3,1.3,62.2,23.4,8.8,126.3,52.3,430.0
1,Inicial 2,4.4,1.5,2.6,3.9,1.5,1.3,57.3,22.9,9.4,128.0,55.7,476.0
2,Inicial 3,3.7,1.3,2.3,3.6,1.4,1.0,52.7,21.7,8.6,129.6,45.9,441.0
3,Fitotron 1,4.6,0.9,1.6,2.5,1.1,0.5,35.4,17.9,9.4,94.7,37.0,200.1
4,Fitotron 2,4.9,1.5,2.1,3.8,1.4,0.8,38.7,22.9,10.0,219.2,56.4,235.9
5,Fitotron 3,6.0,1.3,2.0,2.9,1.2,0.6,33.2,21.4,8.7,98.7,46.7,226.8
6,Horta 1,4.3,1.0,1.5,2.3,1.0,0.5,28.0,18.3,7.7,89.7,41.7,198.9
7,Horta 2,4.5,1.1,1.9,3.7,1.6,0.6,29.8,21.6,8.0,101.5,45.7,295.7
8,Horta 3,5.5,1.1,1.6,3.2,1.4,0.6,30.0,19.2,8.7,109.3,43.5,200.2
9,,,,,,,,,,,,,


### Teste de Hipótese

Aqui faremos testes para características dos tomates.

In [34]:
medias_horta = [0.82, 7.42, 89.74, 0.67, 1.02, 0.55, 1.65]
dp_horta = [0.03, 0.87, 0.24, 0.04, 0.12, 0.16, 0.26]
medias_fito = [0.61, 6.42, 90.92, 0.90, 1.67, 0.81, 2.79]
dp_fito = [0.04, 0.0, 0.19, 0.03, 0.03, 0.19, 0.45]
n_amostras_horta = 3
n_amostras_fito = 3
df_novo = df.drop('Amostra', axis=1)
medias_solos_horta = (df_novo.iloc[16].tolist())
medias_solos_horta = [round(x, 2) for x in medias_solos_horta]
dp_solos_horta = (df_novo.iloc[12].tolist())
dp_solos_horta = [round(x,2) for x in dp_solos_horta]
media_solos_fito = (df_novo.iloc[15].tolist())
media_solos_fito = [round(x,2) for x in media_solos_fito]
dp_solos_fito = (df_novo.iloc[11].tolist())
dp_solos_fito = [round(x,2) for x in dp_solos_fito]

In [39]:
np.random.seed(42)

amostra_acid_horta = np.random.normal(medias_horta[0], dp_horta[0], n_amostras_horta)
amostra_acid_fito = np.random.normal(medias_fito[0], dp_fito[0], n_amostras_fito)

amostra_ss_horta = np.random.normal(medias_horta[1], dp_horta[1], n_amostras_horta)
amostra_ss_fito = np.random.normal(medias_fito[1], dp_fito[1], n_amostras_fito)

amostra_u_horta = np.random.normal(medias_horta[2], dp_horta[2], n_amostras_horta)
amostra_u_fito = np.random.normal(medias_fito[2], dp_fito[2], n_amostras_fito)

amostra_c_horta = np.random.normal(medias_horta[3], dp_horta[3], n_amostras_horta)
amostra_c_fito = np.random.normal(medias_fito[3], dp_fito[3], n_amostras_fito)

amostra_p_horta = np.random.normal(medias_horta[4], dp_horta[4], n_amostras_horta)
amostra_p_fito = np.random.normal(medias_fito[4], dp_fito[4], n_amostras_fito)

amostra_l_horta = np.random.normal(medias_horta[5], dp_horta[5], n_amostras_horta)
amostra_l_fito = np.random.normal(medias_fito[5], dp_fito[5], n_amostras_fito)

amostra_vc_horta = np.random.normal(medias_horta[6], dp_horta[6], n_amostras_horta)
amostra_vc_fito = np.random.normal(medias_fito[6], dp_fito[6], n_amostras_fito)

amostra_incub1_raiz = np.random.normal(9.22, 1.84, 24)
amostra_incub2_raiz = np.random.normal(8.22, 2.21, 25)
amostra_fito3_raiz = np.random.normal(6.06, 1.60, 25)
amostra_fito4_raiz = np.random.normal(8.50, 1.46, 23)

amostra_incub1_caule = np.random.normal(4.80, 0.68, 24)
amostra_incub2_caule = np.random.normal(4.70, 0.64, 25)
amostra_fito3_caule = np.random.normal(4.24, 0.76, 25)
amostra_fito4_caule = np.random.normal(5.43, 0.96, 23)

amostra_incub_raiz = np.random.normal(8.72, 2.02, 49)
amostra_fito_raiz = np.random.normal(7.28, 1.53, 48)

amostra_incub_caule = np.random.normal(4.75, 0.66, 49)
amostra_fito_caule = np.random.normal(4.83, 0.86, 48)

In [47]:
amostras_solos_horta = []
amostras_solos_fito = []

for (i, n, x, y) in zip(medias_solos_horta,dp_solos_horta, media_solos_fito, dp_solos_fito):
    amostra_horta = np.random.normal(i,n,3)
    amostras_solos_horta.append(amostra_horta)
    amostra_fito = np.random.normal(x,y,3)
    amostras_solos_fito.append(amostra_fito)

In [6]:
t_stat_acid, p_valor_acid = stats.ttest_ind(amostra_acid_horta, amostra_acid_fito)
t_stat_ss, p_valor_ss = stats.ttest_ind(amostra_ss_horta, amostra_ss_fito)
t_stat_u, p_valor_u = stats.ttest_ind(amostra_u_horta, amostra_u_fito)
t_stat_c, p_valor_c = stats.ttest_ind(amostra_c_horta, amostra_c_fito)
t_stat_p, p_valor_p = stats.ttest_ind(amostra_p_horta, amostra_p_fito)
t_stat_l, p_valor_l = stats.ttest_ind(amostra_l_horta, amostra_l_fito)
t_stat_vc, p_valor_vc = stats.ttest_ind(amostra_vc_horta, amostra_vc_fito)
t_stat_raiz, p_valor_raiz = stats.ttest_ind(amostra_incub_raiz, amostra_fito_raiz)
t_stat_caule, p_valor_caule = stats.ttest_ind(amostra_incub_caule, amostra_fito_caule)

  res = hypotest_fun_out(*samples, **kwds)


In [7]:
print(f'Estatística t: {t_stat_acid}')
print(f'Valor p: {p_valor_acid}')

Estatística t: 8.402116650757513
Valor p: 0.0010981403733531874


In [8]:
valor_signif(p_valor_acid, significancia)

Como pvalor = 0.001 < significância, rejeitamos a hipótese nula.


In [9]:
valor_signif(p_valor_ss, significancia)

Como pvalor = 0.041 < significância, rejeitamos a hipótese nula.


In [10]:
valor_signif(p_valor_u, significancia)

Como pvalor = 0.002 < significância, rejeitamos a hipótese nula.


In [11]:
valor_signif(p_valor_c, significancia)

Como pvalor = 0.004 < significância, rejeitamos a hipótese nula.


In [12]:
valor_signif(p_valor_p, significancia)

Como pvalor = 0.000 < significância, rejeitamos a hipótese nula.


In [13]:
valor_signif(p_valor_p, significancia)

Como pvalor = 0.000 < significância, rejeitamos a hipótese nula.


In [14]:
valor_signif(p_valor_vc, significancia)

Como pvalor = 0.001 < significância, rejeitamos a hipótese nula.


In [15]:
valor_signif(p_valor_raiz, significancia)

Como pvalor = 0.004 < significância, rejeitamos a hipótese nula.


In [16]:
valor_signif(p_valor_caule, significancia)

Como pvalor = 0.321 > significância, devemos aceitar a hipótese nula.


In [50]:
t_stat_lista = []
p_valor_lista = []

for i,n in zip(amostras_solos_horta, amostras_solos_fito):
    t_stat, p_valor = stats.ttest_ind(i,n)
    t_stat_lista.append(t_stat)
    p_valor_lista.append(p_valor)

print(t_stat_lista)
print()
print(p_valor_lista)

[np.float64(0.24113102307479672), np.float64(2.5595381113510713), np.float64(-1.498364735736013), np.float64(-0.5846393350699914), np.float64(0.6166836232841979), np.float64(-0.5281915833815137), np.float64(-4.6092288068722596), np.float64(-3.1082589042069024), np.float64(-4.6598762944660415), np.float64(-0.9702744911520746), np.float64(0.5265707056638171), np.float64(0.9188112900970891)]

[np.float64(0.8213094911909129), np.float64(0.06266872382646393), np.float64(0.20840227707383943), np.float64(0.5901776919631556), np.float64(0.5708117367667838), np.float64(0.6253121038458637), np.float64(0.009961430677463037), np.float64(0.035932410056244306), np.float64(0.00959044721548934), np.float64(0.3868532768463617), np.float64(0.626339709058932), np.float64(0.41018622749891426)]


In [51]:
hipoteses = []

for i in p_valor_lista:
    hipotese = valor_signif(i, significancia)
    hipoteses.append(hipotese)

Como pvalor = 0.821 > significância, devemos aceitar a hipótese nula.
Como pvalor = 0.063 > significância, devemos aceitar a hipótese nula.
Como pvalor = 0.208 > significância, devemos aceitar a hipótese nula.
Como pvalor = 0.590 > significância, devemos aceitar a hipótese nula.
Como pvalor = 0.571 > significância, devemos aceitar a hipótese nula.
Como pvalor = 0.625 > significância, devemos aceitar a hipótese nula.
Como pvalor = 0.010 < significância, rejeitamos a hipótese nula.
Como pvalor = 0.036 < significância, rejeitamos a hipótese nula.
Como pvalor = 0.010 < significância, rejeitamos a hipótese nula.
Como pvalor = 0.387 > significância, devemos aceitar a hipótese nula.
Como pvalor = 0.626 > significância, devemos aceitar a hipótese nula.
Como pvalor = 0.410 > significância, devemos aceitar a hipótese nula.
