## Importação de Bibliotecas 

In [1]:
import pandas as pd
import sqlite3

## Fazendo a Leitura dos Arquivos

** Código de Cliente

In [2]:
clientes = pd.read_csv('clientes.txt')

clientes

Unnamed: 0,Codigo_Cliente
0,36876AL1010
1,89053AL2540
2,50183AL2530
3,15624AL4530
4,71320AL2020
...,...
1547,68499US2030
1548,28394US4530
1549,37893US5510
1550,95537US2530


** Criação da Coluna de Código, Sigla_Pais, Referencia_Pais

In [3]:
# Criando um DataFrame de exemplo
data = clientes['Codigo_Cliente']

clientes = pd.DataFrame(data) 

clientes['Codigo'] = clientes['Codigo_Cliente'].str[0:-6]
clientes['Sigla_Pais_Cliente'] = clientes['Codigo_Cliente'].str[5:7]
clientes['Codigo_Pais_Cliente'] = clientes['Codigo_Cliente'].str[7:11]

clientes

Unnamed: 0,Codigo_Cliente,Codigo,Sigla_Pais_Cliente,Codigo_Pais_Cliente
0,36876AL1010,36876,AL,1010
1,89053AL2540,89053,AL,2540
2,50183AL2530,50183,AL,2530
3,15624AL4530,15624,AL,4530
4,71320AL2020,71320,AL,2020
...,...,...,...,...
1547,68499US2030,68499,US,2030
1548,28394US4530,28394,US,4530
1549,37893US5510,37893,US,5510
1550,95537US2530,95537,US,2530


## Apagando a Coluna Código do Cliente

In [4]:
clientes = clientes.drop(['Codigo_Cliente', 'Codigo'], axis=1) 

clientes

Unnamed: 0,Sigla_Pais_Cliente,Codigo_Pais_Cliente
0,AL,1010
1,AL,2540
2,AL,2530
3,AL,4530
4,AL,2020
...,...,...
1547,US,2030
1548,US,4530
1549,US,5510
1550,US,2530


In [5]:
## Verificando dados Nulos
clientes.isna().sum()

Sigla_Pais_Cliente     0
Codigo_Pais_Cliente    0
dtype: int64

In [6]:
## Verificando dados duplicados 
clientes.duplicated().sum()

938

In [7]:
## Removendo dados duplicados
clientes = clientes.drop_duplicates()
clientes_count = clientes.count()[0]

clientes_count

614

In [8]:
pd.DataFrame({"Total de Clientes" : [clientes_count]})

Unnamed: 0,Total de Clientes
0,614


## Mudança de Posições do Csv Clientes

In [9]:
colunas = clientes.columns.tolist()

In [10]:
nova_ordem = ['Codigo_Pais_Cliente', 'Sigla_Pais_Cliente'] 

In [11]:
clientes = clientes[nova_ordem]

In [12]:
display(clientes)

Unnamed: 0,Codigo_Pais_Cliente,Sigla_Pais_Cliente
0,1010,AL
1,2540,AL
2,2530,AL
3,4530,AL
4,2020,AL
...,...,...
869,3030,UK
1394,2530,US
1396,4530,US
1406,3030,US


In [13]:
clientes.index = [''] * len(clientes)

In [14]:
clientes

Unnamed: 0,Codigo_Pais_Cliente,Sigla_Pais_Cliente
,1010,AL
,2540,AL
,2530,AL
,4530,AL
,2020,AL
...,...,...
,3030,UK
,2530,US
,4530,US
,3030,US


In [15]:
clientes.index = [''] * len(clientes)

In [16]:
clientes

Unnamed: 0,Codigo_Pais_Cliente,Sigla_Pais_Cliente
,1010,AL
,2540,AL
,2530,AL
,4530,AL
,2020,AL
...,...,...
,3030,UK
,2530,US
,4530,US
,3030,US


In [17]:
clientes.to_csv('clientes1.txt')

## Leitura dos dados de Países

** Países

In [18]:
paises = pd.read_csv('paises.txt', sep =',')

paises

Unnamed: 0,Codigo,Pais
0,AL,Albania
1,AT,Austria
2,AZ,Azerbaijan
3,BH,Bahrain
4,BE,Belgium
5,BA,Bosnia and Herzegovina
6,BR,Brazil
7,BG,Bulgaria
8,CR,Costa Rica
9,HR,Croatia


In [19]:
paises.index = [''] * len(paises)

paises

Unnamed: 0,Codigo,Pais
,AL,Albania
,AT,Austria
,AZ,Azerbaijan
,BH,Bahrain
,BE,Belgium
,BA,Bosnia and Herzegovina
,BR,Brazil
,BG,Bulgaria
,CR,Costa Rica
,HR,Croatia


** Setores

In [20]:
setores = pd.read_csv('setores.txt', sep =',')

setores

Unnamed: 0,Codigo,Setor
0,1010,Energia
1,1510,Materiais
2,2010,Bens de Consumo
3,2020,Serviços Profissionais
4,2030,Transporte
5,2510,Automóveis
6,2520,Bens Duráveis
7,2530,Serviços Gerais
8,2540,Mídia
9,2550,Varejo


In [21]:
setores.index = [''] * len(setores)

setores

Unnamed: 0,Codigo,Setor
,1010,Energia
,1510,Materiais
,2010,Bens de Consumo
,2020,Serviços Profissionais
,2030,Transporte
,2510,Automóveis
,2520,Bens Duráveis
,2530,Serviços Gerais
,2540,Mídia
,2550,Varejo


## Conexão para o Banco de dados da DSA Conjunto_Países

In [22]:
dbconn = sqlite3.connect('conjunto_paises.db')

In [23]:
print(dbconn)

<sqlite3.Connection object at 0x000001D52EB368A0>


** Tabela para o Banco de dados

In [24]:
## Tabela de Clientes
dbconn.execute('''
    CREATE TABLE clientes(
        Id INTEGER UNIQUE PRIMARY KEY,
        Codigo_Pais_Cliente INTEGER ,
        Sigla_Pais_Cliente TEXT,
        CONSTRAINT id UNIQUE (Id)
    )
''')

clientes.to_sql('clientes', dbconn, if_exists='append', index=False) 

614

In [25]:
## Tabela País 

dbconn.execute('''
    CREATE TABLE paises(
        Id INTEGER UNIQUE PRIMARY KEY,
        Codigo TEXT, 
        Pais TEXT, 
        CONSTRAINT id UNIQUE (Id)
    )
''')

paises.to_sql('paises', dbconn, if_exists='append', index=False) 

60

In [26]:
## Tabela Setores 

dbconn.execute('''
    CREATE TABLE setores(
        Id INTEGER UNIQUE PRIMARY KEY,
        Codigo INTEGER, 
        Setor TEXT,
        CONSTRAINT id UNIQUE (Id)
    )
''')

setores.to_sql('setores', dbconn, if_exists='append', index=False) 

24

## Seleção de Consulta dos Dados 

In [27]:
pd.read_sql_query('select * from clientes', con=dbconn)

Unnamed: 0,Id,Codigo_Pais_Cliente,Sigla_Pais_Cliente
0,1,1010,AL
1,2,2540,AL
2,3,2530,AL
3,4,4530,AL
4,5,2020,AL
...,...,...,...
609,610,3030,UK
610,611,2530,US
611,612,4530,US
612,613,3030,US


In [28]:
pd.read_sql_query('select * from paises', con=dbconn)

Unnamed: 0,Id,Codigo,Pais
0,1,AL,Albania
1,2,AT,Austria
2,3,AZ,Azerbaijan
3,4,BH,Bahrain
4,5,BE,Belgium
5,6,BA,Bosnia and Herzegovina
6,7,BR,Brazil
7,8,BG,Bulgaria
8,9,CR,Costa Rica
9,10,HR,Croatia


In [29]:
pd.read_sql_query('select * from setores', con=dbconn)

Unnamed: 0,Id,Codigo,Setor
0,1,1010,Energia
1,2,1510,Materiais
2,3,2010,Bens de Consumo
3,4,2020,Serviços Profissionais
4,5,2030,Transporte
5,6,2510,Automóveis
6,7,2520,Bens Duráveis
7,8,2530,Serviços Gerais
8,9,2540,Mídia
9,10,2550,Varejo
