In [2]:
#hands-on work packages
#%pip install plotly.express
#%pip install seaborn

import numpy as np
import pandas as pd
import re
import copy

#graphs

import plotly.express as px
import plotly.graph_objects as go
import seaborn as sns

In [3]:
brazil_database = pd.read_csv('../1_DataSource/csv_files/brazil_rtrs.csv', decimal = ',')
farm_branches = pd.read_csv('farm_branches.csv')

In [4]:
print(f'Ncols and Nrows of Brazil Database:{brazil_database.shape}\nNcols and Nrows of Farm Branches Database:{farm_branches.shape}')
print()
brazil_database.dtypes, farm_branches.dtypes

Ncols and Nrows of Brazil Database:(128, 40)
Ncols and Nrows of Farm Branches Database:(873, 7)



(Organization         object
 Names                object
 Year                  int64
 Links                object
 RegTag               object
 Companies            object
 Total_Production    float64
 Issue_Date           object
 Expiration_Date      object
 Total_Farm_Area      object
 n_members             int64
 Type                 object
 1_1_criteria         object
 1_2_criteria         object
 1_3_criteria         object
 2_1_criteria         object
 2_2_criteria         object
 2_3_criteria         object
 2_4_criteria         object
 2_5_criteria         object
 3_1_criteria         object
 3_2_criteria         object
 3_3_criteria         object
 3_4_criteria         object
 4_1_criteria         object
 4_2_criteria         object
 4_3_criteria         object
 4_4_criteria         object
 4_5_criteria         object
 5_1_criteria         object
 5_2_criteria         object
 5_3_criteria         object
 5_4_criteria         object
 5_5_criteria         object
 5_6_criteria 

In [5]:
# Replace ',' to '.'

def replace_comma(text):
    return re.sub(r',', '.', text)

brazil_database['Total_Farm_Area'] = brazil_database['Total_Farm_Area'].apply(replace_comma).astype(float)
brazil_database['Expiration_Date'] = pd.to_datetime(brazil_database['Expiration_Date'])
brazil_database['Issue_Date'] = pd.to_datetime(brazil_database['Issue_Date'])
brazil_database['Income'] = brazil_database['Total_Production']/brazil_database['Total_Farm_Area']

In [11]:
# Agrupar os dados por ano e calcular a soma da produção
df_grouped = brazil_database.groupby("Year").agg({"Total_Production": "sum"}).reset_index()

# Calcular a média anual da coluna "Total_Production"
Total_Production_mean_by_year = brazil_database.groupby("Year")["Total_Production"].mean().reset_index()
Total_Production_mean_by_year.columns = ["Year", "Total_Production_Mean"]

# Criar o gráfico de barras usando o Plotly Express
fig = px.bar(df_grouped, x="Year", y="Total_Production", labels={"Total_Production": "Soma do Rendimento (ton/ha) Total"})

# Acrescentar a linha da média anual usando um gráfico de linha
fig.add_trace(go.Scatter(x=Total_Production_mean_by_year["Year"], y=Total_Production_mean_by_year["Total_Production_Mean"],
                         mode="lines", line=dict(color="red", width=2, dash="dash"),
                         name="Média Anual"))

# Personalizar a estética do gráfico
fig.update_traces(marker_color="rgb(53, 128, 196)",  # Cor das barras
                  marker_line_color="rgb(8, 48, 107)",  # Cor das linhas das barras
                  marker_line_width=1.5,  # Espessura das linhas das barras
                  opacity=0.7  # Opacidade das barras
                 )

fig.update_layout(
    title="Soma do Rendimento (ton/ha) Total por Ano",
    xaxis_title="Ano",
    yaxis_title="Soma do Rendimento (ton/ha) Total",
    font=dict(
        family="Arial",
        size=14,
        color="rgb(50, 50, 50)"
    ),
    plot_bgcolor="white",  # Cor do fundo do gráfico
    paper_bgcolor="white",  # Cor do fundo do papel (área fora do gráfico)
    bargap=0.1,  # Espaçamento entre as barras
    bargroupgap=0.2  # Espaçamento entre grupos de barras
)

# Exibir o gráfico
fig.show()

In [12]:
df_grouped

Unnamed: 0,Year,Total_Production
0,2018,1340600.29
1,2019,2575202.94
2,2020,2650601.19
3,2021,3558665.5
4,2022,5259785.33
5,2023,9437.4


In [7]:
df_grouped = brazil_database.groupby("Year").agg({"Total_Farm_Area": "sum"}).reset_index()

# Criar o gráfico usando o Plotly Express
fig = px.bar(df_grouped, x="Year", y="Total_Farm_Area", labels={"Total_Farm_Area": "Soma da Utilização da Área Total"})

# Personalizar a estética do gráfico
fig.update_traces(marker_color="rgb(53, 128, 196)",  # Cor das barras
                  marker_line_color="rgb(8, 48, 107)",  # Cor das linhas das barras
                  marker_line_width=1.5,  # Espessura das linhas das barras
                  opacity=0.7  # Opacidade das barras
                 )

fig.update_layout(
    title="Soma da Utilização da Área Total por Ano",
    xaxis_title="Ano",
    yaxis_title="Soma da Utilização da Área Total",
    font=dict(
        family="Arial",
        size=14,
        color="rgb(50, 50, 50)"
    ),
    plot_bgcolor="white",  # Cor do fundo do gráfico
    paper_bgcolor="white",  # Cor do fundo do papel (área fora do gráfico)
    bargap=0.1,  # Espaçamento entre as barras
    bargroupgap=0.2  # Espaçamento entre grupos de barras
)

# Exibir o gráfico
fig.show()



In [8]:
# Contar a frequência das categorias
df_count = brazil_database["Type"].value_counts().reset_index()
df_count.columns = ["Type", "Frequência"]

# Criar o gráfico de pizza usando o Plotly Express
fig = px.pie(df_count, values="Frequência", names="Type", labels={"Frequência": "Frequência da Type Categoria"})

# Personalizar a estética do gráfico
fig.update_traces(textposition="inside", textinfo="percent+label")
fig.update_layout(
    title="Frequência das Categorias",
    font=dict(
        family="Arial",
        size=14,
        color="rgb(50, 50, 50)"
    ),
    plot_bgcolor="white",  # Cor do fundo do gráfico
    paper_bgcolor="white",  # Cor do fundo do papel (área fora do gráfico)
)

# Exibir o gráfico
fig.show()

In [9]:
# Contar a frequência das categorias
df_count = brazil_database["Year"].value_counts().reset_index()
df_count.columns = ["Year", "Frequência"]

# Criar o gráfico de barras usando o Plotly Express
fig = px.bar(df_count, x="Year", y="Frequência", labels={"Frequência": "Frequência da Year"})

# Personalizar a estética do gráfico
fig.update_traces(marker_color="rgb(53, 128, 196)",  # Cor das barras
                  marker_line_color="rgb(8, 48, 107)",  # Cor das linhas das barras
                  marker_line_width=1.5,  # Espessura das linhas das barras
                  opacity=0.7  # Opacidade das barras
                 )

fig.update_layout(
    title="Certificações por Ano",
    xaxis_title="Ano",
    yaxis_title="Frequência",
    font=dict(
        family="Arial",
        size=14,
        color="rgb(50, 50, 50)"
    ),
    plot_bgcolor="white",  # Cor do fundo do gráfico
    paper_bgcolor="white",  # Cor do fundo do papel (área fora do gráfico)
    bargap=0.1  # Espaçamento entre as barras
)

# Exibir o gráfico
fig.show()

In [10]:
df_count

Unnamed: 0,Year,Frequência
0,2022,38
1,2020,32
2,2021,31
3,2019,17
4,2018,8
5,2023,2


In [13]:
brazil_database

Unnamed: 0,Organization,Names,Year,Links,RegTag,Companies,Total_Production,Issue_Date,Expiration_Date,Total_Farm_Area,...,5_3_criteria,5_4_criteria,5_5_criteria,5_6_criteria,5_7_criteria,5_8_criteria,5_9_criteria,5_10_criteria,5_11_criteria,Income
0,Cataratas do Iguaçu Produtos Orgânicos,Cataratas do Iguaçu Produtos Orgânicos LTDA - ...,2022,https://responsiblesoy.org/wp-content/uploads/...,FCID RTRS 2065 376,FoodChain Id Certificadora Ltda,1207.00,2022-10-28,2022-10-27,664.10,...,A qualidade do solo é preservada em todas faze...,As quatro fazendas não possuem um plano de Man...,Verificado que a propriedade auditadas utiliza...,As fazendas não utilizam nenhum agroquímico li...,Nas propriedades auditadas são utilizados prod...,Verificado que caso ocorra algum surto de nova...,As fazendas seguem o documento Uso e Aplicação...,As áreas vizinhas possuem o mesmo tipo de prod...,Verificado que as sementes adquiridas pelas fa...,1.817497
1,Fundação de Apoio à Pesquisa do Corredor de Ex...,Fundação de Apoio à Pesquisa do Corredor de Ex...,2022,https://responsiblesoy.org/wp-content/uploads/...,RTRS CUC AGR COC 0110,Control Union,220845.00,2023-03-31,2028-03-30,46596.00,...,São realizadas análises de solo visando o acom...,As fazenda não possuem documentado de MIC – Ma...,O setor de planejamento das fazendas realiza a...,As fazendas não utilizam nenhum agroquímico li...,Verificado nas fazendas auditadas que o uso de...,De acordo com relatos dos responsáveis pelas f...,As fazendas auditadas possuem procedimento doc...,O sistema de produção adotado pelas fazendas é...,Verificado que todas as sementes utilizadas na...,4.739570
2,Fazenda Santa Cruz,Fazenda Santa Cruz,2023,https://responsiblesoy.org/wp-content/uploads/...,RTRS GC FORM IT 016,Gênesis Certificações,333.00,2022-06-05,2027-06-05,118.00,...,"Evidenciado análise de solo realizada em 2021,...","Evidenciado através de avaliação documental, o...",Evidenciado através de avaliação documental qu...,Evidenciado através de avaliação documental da...,Evidenciado através de avaliação documental Pr...,Não há evidencias de surtos de pragas nas regi...,Evidenciado através de avaliação documental o ...,Apesar de evidenciado através de avaliação doc...,"Conforme evidencias apresentadas, todas as sem...",2.822034
3,Serra da Pintura,Serra da Pintura,2023,https://responsiblesoy.org/wp-content/uploads/...,RTRS FCID AGR 2167,FoodChain Id Certificadora Ltda,9104.40,2023-09-03,2028-08-03,2529.00,...,São realizadas análises de solo com agricultur...,Indicador não aplicável para a auditoria inici...,Os registros de uso dos agroquímicos são reali...,A fazenda não utiliza produtos listados nas Co...,Indicador não aplicável para a auditoria inici...,Indicador não aplicável para a auditoria inici...,São realizados registros das condições meteoro...,"Fazenda realiza integração agricultura, pecuária.",Indicador não aplicável para a auditoria inici...,3.600000
4,Tecnosol Consultoria Rural,Tecnosol Consultoria Rural LTDA,2022,https://responsiblesoy.org/wp-content/uploads/...,RTRS FCID AGR 2101,FoodChain Id Certificadora Ltda,29293.00,2023-02-20,2028-02-19,7753.00,...,A qualidade do solo é preservada em todas faze...,As quatro fazendas não possuem um plano de Man...,Verificado que as quatro propriedades auditada...,As fazendas não utilizam nenhum agroquímico li...,Nas propriedades auditadas são utilizados prod...,Verificado que caso ocorra algum surto de nova...,As fazendas seguem o documento Uso e Aplicação...,As áreas vizinhas possuem o mesmo tipo de prod...,Verificado que as sementes adquiridas pelas fa...,3.778279
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
123,Cerquality Consultoria em Sustentabilidade e C...,CerQualiti Grupo III 2018,2018,https://responsiblesoy.org/wp-content/uploads/...,RTRS CUC AGR 0067 17 12 2018,Control Union,417461.01,2018-12-17,2022-10-24,108763.00,...,"Técnicas como plantio direto, rotação de cultu...",É realizado monitoramento integrado de pragas ...,As aplicações de agroquímicos contêm informaçõ...,Nenhuma evidência do uso de agroquímicos lista...,Produtos para controle biológicos são utilizad...,Foi apresentado procedimento escrito para um e...,São utilizadas medidas que analisam as condiçõ...,Todas as áreas vizinhas têm o mesmo tipo de si...,A origem das sementes pode ser comprovada atra...,3.838263
124,Associação Clube Amigos da Terra,Associação Amigos da Terra - Grupo III,2018,https://responsiblesoy.org/wp-content/uploads/...,RTRS CUC AGR 0059,Control Union,58578.93,2018-02-22,2023-02-21,16025.30,...,"Técnicas como plantio direto, rotação de cultu...",As aplicações de defensivos agrícolas são feit...,"O armazenamento, coleta e descarte de embalage...",Nenhuma evidência do uso de agroquímicos lista...,Informação disponível sobre as exigências para...,Para identificar e monitorar as novas espécies...,"As condições atmosféricas como vento, umidade ...",Todas as áreas vizinhas têm o mesmo tipo de si...,As sementes compradas são oriundas de fontes l...,3.655403
125,Amaggi,Amaggi Commodities,2018,https://responsiblesoy.org/wp-content/uploads/...,RTRS CERTID AGR COC 0010,Cert Id Certificadora,405980.10,2017-11-28,2022-11-27,122765.20,...,O monitoramento da qualidade do solo é feito m...,As fazendas possuem plano MIC – Manejo Integra...,Todas as fazendas auditadas registram o uso de...,As fazendas não utilizam nenhum agroquímico li...,Nem todas as fazendas utilizam agentes de cont...,"Caso ocorra algum surto de novas pragas, as fa...",As medidas implementadas pelas fazendas para p...,Os sistemas de produção adotados pelas fazenda...,Nenhuma das fazendas produz suas próprias seme...,3.306964
126,Amaggi,Amaggi Commodities EU RED,2018,https://responsiblesoy.org/wp-content/uploads/...,RTRS CERTID AGR COC BFLS 0009,Cert Id Certificadora,104787.90,2017-11-28,2022-11-27,31232.00,...,O monitoramento da qualidade do solo é feito a...,A fazenda possui um plano MIC – Manejo Integra...,O setor de planejamento da empresa realiza as ...,A fazenda não utiliza nenhum agroquímico lista...,Verificado que há o conhecimento sobre uso de ...,"Caso ocorra algum surto de novas pragas, as fa...",As medidas implementadas pela fazenda para pre...,O sistema de produção adotado pelas fazendas é...,A fazenda adquire sementes de fontes legalment...,3.355145
