In [1]:
import psycopg2 as pg
import pandas as pd
import sys


parametros = {"host": "localhost",
             "database": "Antaq",
             "port": 5432,
             "user": "postgres",
             "password": "28549108"}
def conexao_existe(parametros):
    #conectando com o db Antaq - Postgres
    conn = None
    try:
        #tenta conectar
        print('Conectando com o banco no PostgreSQL...')
        conn = pg.connect(**parametros)
    #não conecta exceto se:
    except  (Exception, pg.DatabaseError) as error:
        print (error)
        sys.exit(1)
    print("Conexão realizada com sucesso")
    return conn

In [2]:
def pg_to_pd(conn, select_query, colunas):
    #Transformando a SELECT QUERY em dataframe
    cursor = conn.cursor()
    try: 
        cursor.execute(select_query)
    except (Exception, pg.DatabaseError) as error:
        print("Error: %s" % error)
        cursor.close()
        return 1
    
    tuplas = cursor.fetchall()
    cursor.close()
    
    df = pd.DataFrame(tuplas, columns=colunas)
    return df

In [3]:
conn = conexao_existe(parametros)

nomes_col = ["IDCarga", "Regiao Hidrográfica", "Valor da movimentação"]

df = pg_to_pd(conn, "select * from tbCarga_Regiao", nomes_col)
df

Conectando com o banco no PostgreSQL...
Conexão realizada com sucesso


Unnamed: 0,IDCarga,Regiao Hidrográfica,Valor da movimentação
0,32895979,,994.664
1,32957103,,3305.359
2,32957841,,0.100
3,32962047,,33.000
4,32989773,,47370.000
...,...,...,...
529460,3449,Região Hidrográfica do Paraná,11197.000
529461,3450,Região Hidrográfica do Paraná,13000.000
529462,3451,Região Hidrográfica do Paraná,2584.000
529463,3452,Região Hidrográfica do Paraná,2584.000


In [6]:
conn = conexao_existe(parametros)

nomes_col = ["IDCarga", "Hidrovia", "Valor da movimentação da Hidrovia"]

df = pg_to_pd(conn, "select * from tbCarga_Hidrovia", nomes_col)
df

Conectando com o banco no PostgreSQL...
Conexão realizada com sucesso


Unnamed: 0,IDCarga,Hidrovia,Valor da movimentação da Hidrovia
0,30720310,,2.200
1,30720311,,2.200
2,30720312,,2.200
3,30720313,,2.200
4,30720314,,2.200
...,...,...,...
572249,3446,Hidrovia do Tietê - Paraná,38000.000
572250,3447,Hidrovia do Tietê - Paraná,5168.000
572251,3448,Hidrovia do Tietê - Paraná,6000.000
572252,3449,Hidrovia do Tietê - Paraná,11197.000


In [11]:
conn = conexao_existe(parametros)

nomes_col = ["IDCarga", "Rio", "Valor Movimentação Rio"]

df = pg_to_pd(conn, "select * from tbCarga_Rio", nomes_col)
df

Conectando com o banco no PostgreSQL...
Conexão realizada com sucesso


Unnamed: 0,IDCarga,Rio,Valor Movimentação Rio
0,30392681,,7533.820
1,30587812,,3011.660
2,30680313,Negro,3.620
3,30804188,Negro,0.500
4,30814066,,13.820
...,...,...,...
573616,3449,Paraná,11197.000
573617,3450,Paraná,13000.000
573618,3451,Paraná,2584.000
573619,3452,Paraná,2584.000


In [31]:
conn = conexao_existe(parametros)

nomes_col = ["Valor peso carga"]

df = pg_to_pd(conn, "select Vl_peso_carga from tbCarga_Conteinerizada", nomes_col)
df.describe()

Conectando com o banco no PostgreSQL...
Conexão realizada com sucesso


Unnamed: 0,Valor peso carga
count,4098029.0
unique,68308.0
top,0.0
freq,892765.0


In [3]:
df = pd.read_csv("C:/2022/2022Carga_Rio.csv", delimiter=";", header=0, encoding="UTF-8", engine="python")

In [3]:
df.columns.values

array(['IDCarga', 'Rio', 'ValorMovimentado'], dtype=object)

In [16]:
coluna_df = ["Valor Movimentação Rio", "Rio"]
carga_mov = df.filter(items=coluna_df)

In [4]:
coluna_df = ["ValorMovimentado", "Rio"]
carga_mov = df.filter(items=coluna_df)

In [None]:
import matplotlib.pyplot as plt

#Tamanho da figura
plt.figure(figsize =(10, 5))
#plotando o boxplot
box_rio = plt.boxplot(carga_mov, vert=1, patch_artist=True)

#Cores
cores = ['blue']
#Corpo de boxplot
for i in enumerate(box_rio["ValorMovimentado"]):
    box_rio.set(color='blue', linewitdh=1)
    box_rio.set(facecolor=cores[i])
#
for j in box_rio['Rio']:
    j.set(color='black', linewidth=3)

for k in box_rio['ValorMovimentado']:
    k.set(color='black', linewidth=3)

#dando o nome ao gráfico
plt.title("Valor de Movimentação em cada rio", loc="center", fontsize=14)
plt.xlabel("Rio")
plt.ylabel("Valor Movimentação")

#Mostrar o boxplot
plt.show()

In [8]:
conn.close()

# **Lista de todos os pacotes/bibliotecas utilizadas no projeto**

In [1]:
%pip list

Package                  VersionNote: you may need to restart the kernel to use updated packages.

------------------------ -------
anyio                    3.6.2
argon2-cffi              21.3.0
argon2-cffi-bindings     21.2.0
arrow                    1.2.3
asttokens                2.2.1
attrs                    23.1.0
backcall                 0.2.0
beautifulsoup4           4.12.2
bleach                   6.0.0
cffi                     1.15.1
colorama                 0.4.6
comm                     0.1.3
contourpy                1.0.7
cycler                   0.11.0
debugpy                  1.6.7
decorator                5.1.1
defusedxml               0.7.1
executing                1.2.0
fastjsonschema           2.16.3
fonttools                4.39.3
fqdn                     1.5.1
idna                     3.4
importlib-metadata       6.6.0
importlib-resources      5.12.0
ipykernel                6.22.0
ipython                  8.13.2
ipython-genutils         0.2.0
isoduration           