<div style="text-align: justify; padding: 20px; background-color: #000000; color: #ffffff; border-radius: 10px;">

# **Teste de hipóteses entre tomates da horta e da Fitotron**  
### **Autor: Pedro Thomazelli Ferreira**
📅 **Última modificação:** 21 de Novembro de 2024  

---

## **Trabalho principal: Impacto das mudanças climáticas no cultivo e consumo do tomate-cereja**
### **Autores principais: Ana Clara Batista Loponi e João Guilherme dos Santos Caramês**  

---

### **Resumo**  
<p style="text-align: justify; margin: 10px 50px;">
Nesse notebook, são feitos cálculos para determinação dos valores <b> p </b>, que visam confirmar hipóteses sobre caraceterísticas dos tomates em temperaturas diferentes. Na Fitotron, a temperatura é aquela que se que será atingida em 2050.
</p>

---

### **Palavras-chave**  
🔑 *Teste de hipótese, alimento, mudanças climáticas, segurança alimentar, cultivo, consumo, análise de alimentos*  

</div>

### Importações

In [2]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import scikit_posthocs as sp
from itertools import combinations
from scipy import stats



### Definindo variáveis

In [3]:
nivel_confianca = 0.95

significancia = 1 - nivel_confianca

### Função que recebe valor de significância

In [4]:
def valor_signif (pvalor, significancia):
    if pvalor < significancia:
        print(f'Como {pvalor = :.3f} < significância, rejeitamos a hipótese nula.')
    else:
        print(f'Como {pvalor = :.3f} > significância, devemos aceitar a hipótese nula.')

In [5]:
df = pd.read_excel('ValoresSolos.xlsx')
display(df)

Unnamed: 0,Amostra,N (g/kg),P (g/kg),K (g/kg),Ca (g/kg),Mg (g/kg),S (g/kg),B (mg/kg),Cu (mg/kg),Fe (g/kg),Mn (mg/kg),Zn (mg/kg),Na (mg/kg)
0,Inicial 1,6.4,1.5,2.3,3.6,1.3,1.3,62.2,23.4,8.8,126.3,52.3,430.0
1,Inicial 2,4.4,1.5,2.6,3.9,1.5,1.3,57.3,22.9,9.4,128.0,55.7,476.0
2,Inicial 3,3.7,1.3,2.3,3.6,1.4,1.0,52.7,21.7,8.6,129.6,45.9,441.0
3,Fitotron 1,4.6,0.9,1.6,2.5,1.1,0.5,35.4,17.9,9.4,94.7,37.0,200.1
4,Fitotron 2,4.9,1.5,2.1,3.8,1.4,0.8,38.7,22.9,10.0,219.2,56.4,235.9
5,Fitotron 3,6.0,1.3,2.0,2.9,1.2,0.6,33.2,21.4,8.7,98.7,46.7,226.8
6,Horta 1,4.3,1.0,1.5,2.3,1.0,0.5,28.0,18.3,7.7,89.7,41.7,198.9
7,Horta 2,4.5,1.1,1.9,3.7,1.6,0.6,29.8,21.6,8.0,101.5,45.7,295.7
8,Horta 3,5.5,1.1,1.6,3.2,1.4,0.6,30.0,19.2,8.7,109.3,43.5,200.2
9,,,,,,,,,,,,,


### Teste de Hipótese

Aqui faremos testes para características dos tomates.

In [6]:
medias_horta = [0.82, 7.42, 89.74, 0.67, 1.02, 0.55, 16.46]
dp_horta = [0.03, 0.87, 0.24, 0.04, 0.12, 0.16, 2.27]
medias_fito = [0.61, 6.42, 90.92, 0.90, 1.67, 0.81, 27.88]
dp_fito = [0.04, 0.0, 0.19, 0.03, 0.03, 0.19, 4.54]
n_amostras_horta = 3
n_amostras_fito = 3
df_novo = df.drop('Amostra', axis=1)
medias_solos_horta = (df_novo.iloc[16].tolist())
medias_solos_horta = [round(x, 2) for x in medias_solos_horta]
dp_solos_horta = (df_novo.iloc[12].tolist())
dp_solos_horta = [round(x,2) for x in dp_solos_horta]
media_solos_fito = (df_novo.iloc[15].tolist())
media_solos_fito = [round(x,2) for x in media_solos_fito]
dp_solos_fito = (df_novo.iloc[11].tolist())
dp_solos_fito = [round(x,2) for x in dp_solos_fito]

In [7]:
np.random.seed(42)

amostra_acid_horta = np.random.normal(medias_horta[0], dp_horta[0], n_amostras_horta)
amostra_acid_fito = np.random.normal(medias_fito[0], dp_fito[0], n_amostras_fito)

amostra_ss_horta = np.random.normal(medias_horta[1], dp_horta[1], n_amostras_horta)
amostra_ss_fito = np.random.normal(medias_fito[1], dp_fito[1], n_amostras_fito)

amostra_u_horta = np.random.normal(medias_horta[2], dp_horta[2], n_amostras_horta)
amostra_u_fito = np.random.normal(medias_fito[2], dp_fito[2], n_amostras_fito)

amostra_c_horta = np.random.normal(medias_horta[3], dp_horta[3], n_amostras_horta)
amostra_c_fito = np.random.normal(medias_fito[3], dp_fito[3], n_amostras_fito)

amostra_p_horta = np.random.normal(medias_horta[4], dp_horta[4], n_amostras_horta)
amostra_p_fito = np.random.normal(medias_fito[4], dp_fito[4], n_amostras_fito)

amostra_l_horta = np.random.normal(medias_horta[5], dp_horta[5], n_amostras_horta)
amostra_l_fito = np.random.normal(medias_fito[5], dp_fito[5], n_amostras_fito)

amostra_vc_horta = np.random.normal(medias_horta[6], dp_horta[6], n_amostras_horta)
amostra_vc_fito = np.random.normal(medias_fito[6], dp_fito[6], n_amostras_fito)

amostra_incub1_raiz = np.random.normal(9.22, 1.84, 24)
amostra_incub2_raiz = np.random.normal(8.22, 2.21, 25)
amostra_fito3_raiz = np.random.normal(6.06, 1.60, 25)
amostra_fito4_raiz = np.random.normal(8.50, 1.46, 23)

amostra_incub1_caule = np.random.normal(4.80, 0.68, 24)
amostra_incub2_caule = np.random.normal(4.70, 0.64, 25)
amostra_fito3_caule = np.random.normal(4.24, 0.76, 25)
amostra_fito4_caule = np.random.normal(5.43, 0.96, 23)

amostra_incub_raiz = np.random.normal(8.72, 2.02, 49)
amostra_fito_raiz = np.random.normal(7.28, 1.53, 48)

amostra_incub_caule = np.random.normal(4.75, 0.66, 49)
amostra_fito_caule = np.random.normal(4.83, 0.86, 48)

In [8]:
amostras_solos_horta = []
amostras_solos_fito = []

for (i, n, x, y) in zip(medias_solos_horta,dp_solos_horta, media_solos_fito, dp_solos_fito):
    amostra_horta = np.random.normal(i,n,3)
    amostras_solos_horta.append(amostra_horta)
    amostra_fito = np.random.normal(x,y,3)
    amostras_solos_fito.append(amostra_fito)

In [9]:
t_stat_acid, p_valor_acid = stats.ttest_ind(amostra_acid_horta, amostra_acid_fito)
t_stat_ss, p_valor_ss = stats.ttest_ind(amostra_ss_horta, amostra_ss_fito)
t_stat_u, p_valor_u = stats.ttest_ind(amostra_u_horta, amostra_u_fito)
t_stat_c, p_valor_c = stats.ttest_ind(amostra_c_horta, amostra_c_fito)
t_stat_p, p_valor_p = stats.ttest_ind(amostra_p_horta, amostra_p_fito)
t_stat_l, p_valor_l = stats.ttest_ind(amostra_l_horta, amostra_l_fito)
t_stat_vc, p_valor_vc = stats.ttest_ind(amostra_vc_horta, amostra_vc_fito)
t_stat_raiz, p_valor_raiz = stats.ttest_ind(amostra_incub_raiz, amostra_fito_raiz)
t_stat_caule, p_valor_caule = stats.ttest_ind(amostra_incub_caule, amostra_fito_caule)

  res = hypotest_fun_out(*samples, **kwds)


In [10]:
print(f'Estatística t: {t_stat_acid}')
print(f'Valor p: {p_valor_acid}')

Estatística t: 8.402116650757513
Valor p: 0.0010981403733531874


In [11]:
valor_signif(p_valor_acid, significancia)

Como pvalor = 0.001 < significância, rejeitamos a hipótese nula.


In [12]:
valor_signif(p_valor_ss, significancia)

Como pvalor = 0.041 < significância, rejeitamos a hipótese nula.


In [13]:
valor_signif(p_valor_u, significancia)

Como pvalor = 0.002 < significância, rejeitamos a hipótese nula.


In [14]:
valor_signif(p_valor_c, significancia)

Como pvalor = 0.004 < significância, rejeitamos a hipótese nula.


In [15]:
valor_signif(p_valor_p, significancia)

Como pvalor = 0.000 < significância, rejeitamos a hipótese nula.


In [16]:
valor_signif(p_valor_p, significancia)

Como pvalor = 0.000 < significância, rejeitamos a hipótese nula.


In [17]:
valor_signif(p_valor_vc, significancia)

Como pvalor = 0.001 < significância, rejeitamos a hipótese nula.


In [18]:
valor_signif(p_valor_raiz, significancia)

Como pvalor = 0.004 < significância, rejeitamos a hipótese nula.


In [19]:
valor_signif(p_valor_caule, significancia)

Como pvalor = 0.321 > significância, devemos aceitar a hipótese nula.


In [20]:
t_stat_lista = []
p_valor_lista = []

for i,n in zip(amostras_solos_horta, amostras_solos_fito):
    t_stat, p_valor = stats.ttest_ind(i,n)
    t_stat_lista.append(t_stat)
    p_valor_lista.append(p_valor)

print(t_stat_lista)
print()
print(p_valor_lista)

[np.float64(-3.822135482958174), np.float64(-2.8326388516679293), np.float64(-2.7245756997189456), np.float64(-1.1126818972243304), np.float64(1.3386654966316758), np.float64(-0.543784106780245), np.float64(-1.8166737994085138), np.float64(-0.39414095295414975), np.float64(-0.0629919610273547), np.float64(-1.4037761878322554), np.float64(-0.8731545922142087), np.float64(-1.6074560575713837)]

[np.float64(0.018743946070133407), np.float64(0.04721852076511125), np.float64(0.05273718959808982), np.float64(0.32820396946043573), np.float64(0.2516982725183907), np.float64(0.6154794771793686), np.float64(0.14343033062576152), np.float64(0.7135867199506187), np.float64(0.9527950434826343), np.float64(0.2330578629954369), np.float64(0.4318627420312488), np.float64(0.18323297445615033)]


In [21]:
hipoteses = []

for i in p_valor_lista:
    hipotese = valor_signif(i, significancia)
    hipoteses.append(hipotese)

Como pvalor = 0.019 < significância, rejeitamos a hipótese nula.
Como pvalor = 0.047 < significância, rejeitamos a hipótese nula.
Como pvalor = 0.053 > significância, devemos aceitar a hipótese nula.
Como pvalor = 0.328 > significância, devemos aceitar a hipótese nula.
Como pvalor = 0.252 > significância, devemos aceitar a hipótese nula.
Como pvalor = 0.615 > significância, devemos aceitar a hipótese nula.
Como pvalor = 0.143 > significância, devemos aceitar a hipótese nula.
Como pvalor = 0.714 > significância, devemos aceitar a hipótese nula.
Como pvalor = 0.953 > significância, devemos aceitar a hipótese nula.
Como pvalor = 0.233 > significância, devemos aceitar a hipótese nula.
Como pvalor = 0.432 > significância, devemos aceitar a hipótese nula.
Como pvalor = 0.183 > significância, devemos aceitar a hipótese nula.


In [22]:
df2 = pd.read_excel("resultados_pigmentos.xlsx")
display(df2)

Unnamed: 0,Amostra,Massa (g),Volume (mL),Absorbância (470 nm),Absorbância (645 nm),Absorbância (663 nm),Clorofila a (mg/g),Clorofila b (mg/g),Clorofilas a+b (mg/g),Carotenoides (mg/g)
0,,,,,,,,,,
1,F1,0.13,10.0,1.29,0.613,1.388,1.235976,0.580268,1.816244,0.411693
2,F2,0.11,10.0,1.083,0.511,1.16,1.221065,0.570407,1.791472,0.404797
3,F3,0.13,10.0,0.937,0.446,0.973,0.863186,0.435428,1.298615,0.298587
4,Média,0.123333,10.0,1.103333,0.523333,1.173667,1.106742,0.528701,1.635443,0.371692
5,Desvio,0.011547,0.0,0.177376,0.08418,0.207837,0.211058,0.080927,0.291965,0.063405
6,H1,0.13,10.0,0.777,0.312,0.715,0.63744,0.29227,0.92971,0.250091
7,H2,0.13,10.0,0.74,0.29,0.672,0.599749,0.268997,0.868746,0.238516
8,H3,0.12,10.0,0.776,0.321,0.743,0.718297,0.322889,1.041187,0.269312
9,Média,0.126667,10.0,0.764333,0.307667,0.71,0.651829,0.294719,0.946548,0.25264


In [23]:
medias_pigmentos_horta = (df2.iloc[9][6:10].tolist())
medias_pigmentos_horta = [round(x, 2) for x in medias_pigmentos_horta]
dp_pigmentos_horta = (df2.iloc[10][6:10].tolist())
dp_pigmentos_horta = [round(x, 2) for x in dp_pigmentos_horta]
medias_pigmentos_fito = (df2.iloc[4][6:10].tolist())
medias_pigmentos_fito = [round(x, 2) for x in medias_pigmentos_fito]
dp_pigmentos_fito = (df2.iloc[5][6:10].tolist())
dp_pigmentos_fito = [round(x, 2) for x in dp_pigmentos_fito]

In [24]:
amostras_pigmentos_horta = []
amostras_pigmentos_fito = []

for (i, n, x, y) in zip(medias_pigmentos_horta,dp_pigmentos_horta, medias_pigmentos_fito, dp_pigmentos_fito):
    pigmento_horta = np.random.normal(i,n,3)
    amostras_pigmentos_horta.append(pigmento_horta)
    pigmento_fito = np.random.normal(x,y,3)
    amostras_pigmentos_fito.append(pigmento_fito)

In [25]:
t_stat_lista2 = []
p_valor_lista2 = []

for i,n in zip(amostras_pigmentos_horta, amostras_pigmentos_fito):
    t_stat2, p_valor2 = stats.ttest_ind(i,n)
    t_stat_lista2.append(t_stat2)
    p_valor_lista2.append(p_valor2)

print(t_stat_lista2)
print()
print(p_valor_lista2)

[np.float64(-8.4988198933405), np.float64(-9.21996657417924), np.float64(-4.360931177065503), np.float64(-2.129689380340814)]

[np.float64(0.001051136124150468), np.float64(0.0007689883518091948), np.float64(0.01205333795131178), np.float64(0.10024292747271767)]


In [26]:
hipoteses2 = []

for i in p_valor_lista2:
    hipotese2 = valor_signif(i, significancia)
    hipoteses2.append(hipotese2)

Como pvalor = 0.001 < significância, rejeitamos a hipótese nula.
Como pvalor = 0.001 < significância, rejeitamos a hipótese nula.
Como pvalor = 0.012 < significância, rejeitamos a hipótese nula.
Como pvalor = 0.100 > significância, devemos aceitar a hipótese nula.


In [27]:
df_raizes = pd.read_excel("Raízes.xlsx")
display(df_raizes)

Unnamed: 0,Planta,Raiz (cm),Caule (cm),Unnamed: 3,Unnamed: 4,Unnamed: 5,Unnamed: 6
0,1 Horta,33,68,,,,
1,2 Horta,16,96,,,DP Raiz Horta,10.115994
2,3 Horta,15,105,,,DP Raiz Fitotron,12.789318
3,1 Fitotron,15,97,,,DP Caule Horta,19.295941
4,2 Fitotron,9,94,,,DP Caule Fitotron,10.157099
5,3 Fitotron,12,104,,,,
6,4 Fitotron,17,96,,,Média Raiz Horta,21.333333
7,5 Fitotron,20,100,,,Média Raiz Fitotron,20.7
8,6 Fitotron,14,101,,,Média Caule Horta,89.666667
9,7 Fitotron,26,98,,,Média Caule Fitotron,94.5


In [28]:
medias_raizes = [21.33, 20.70]
medias_caules = [89.66, 94.50]
dp_raizes = [10.11, 12.78]
dp_caules = [19.29, 10.15]
n_amostras_rh = 3
n_amostras_rf = 10

In [29]:
amostras_raiz_horta = []
amostras_raiz_fito = []

for (i, n, x, y) in zip(medias_raizes,dp_raizes, medias_caules, dp_caules):
    raizes_horta = np.random.normal(i,n,n_amostras_rh)
    amostras_raiz_horta.append(raizes_horta)
    raizes_fito = np.random.normal(x,y,n_amostras_rf)
    amostras_raiz_fito.append(raizes_fito)

In [30]:
t_stat_lista3 = []
p_valor_lista3 = []

for i,n in zip(amostras_raiz_horta, amostras_raiz_fito):
    t_stat3, p_valor3 = stats.ttest_ind(i,n)
    t_stat_lista3.append(t_stat3)
    p_valor_lista3.append(p_valor3)

print(t_stat_lista3)
print()
print(p_valor_lista3)

[np.float64(-6.53915223582191), np.float64(-10.452250612990966)]

[np.float64(4.1970851470409066e-05), np.float64(4.7436122102113623e-07)]


In [31]:
hipoteses3 = []

for i in p_valor_lista3:
    hipotese3 = valor_signif(i, significancia)
    hipoteses3.append(hipotese3)

Como pvalor = 0.000 < significância, rejeitamos a hipótese nula.
Como pvalor = 0.000 < significância, rejeitamos a hipótese nula.
