## Capítulo 3 - A estrutura de dados DataFrame.

### Busca

In [None]:
#P13: Busca em DataFrames.
import pandas as pd

# Cria o DataFrame.
dados = {
        'nome': ['Argentina','Brasil','Franca','Italia'],
        'continente': ['America','America','Europa','Europa'],
        'extensao': [2780, 85111, 644, 301],
        'corVerde': [0,1,0,1]
        }

siglas = ['AR','BR','FR', 'IT']
paises = pd.DataFrame(dados, index=siglas)
print(paises)

# Testa se um dado rótulo de linha existe.
tem_BR = 'BR' in paises.index
tem_US = 'US' in paises.index
print("Existe rotulo 'BR'? ->", tem_BR)
print("Existe rotulo 'US'? ->", tem_US)
print('------------------------------')

# Testa se um dado rótulo de coluna existe.
tem_corVerde = 'corVerde' in paises.columns
tem_corAzul = 'corAzul' in paises.columns
print("Existe o rotulo 'corVerde?' -> ", tem_corVerde)
print("Existe o rotulo 'corAzul?' -> ", tem_corAzul)

### Modificação

In [None]:
#P14: Modificação de DataFrame.
import pandas as pd

# Cria o DataFrame.
dados = {
        'nome': ['Argentina','Brasil','Franca','Italia','Reino Unido'],
        'continente': ['America','America','Europa','Europa','Europa'],
        'extensao': [2780, 85111, 644, 301, 244],
        'corVerde': [0,1,0,1,0]
        }

siglas = ['AR','BR','FR', 'IT', 'UK']

paises = pd.DataFrame(dados, index=siglas)
print(paises)


In [None]:
# Insere o país Japão (JP).
paises.loc['JP'] = {
                    'nome':'Japão',
                    'continente': 'Ásia',
                    'extensao': 372,
                    'corVerde': 0
                    }
print(paises)

In [None]:
# altera a extensão do Brasil.
paises.at['BR','extensao'] = 8512
print(paises)

In [None]:
# Remove a Argentina e o Reino Unido.
paises = paises.drop(['AR','UK'])
print('DataFrame após todas alterações:')
print("")
print(paises)

#

### 3.3 Trabalhando com arquivos.

In [None]:
#P13: Busca em DataFrames.
import pandas as pd

# Cria o DataFrame.
dados = {
        'nome': ['Argentina','Brasil','Franca','Italia'],
        'continente': ['America','America','Europa','Europa'],
        'extensao': [2780, 85111, 644, 301],
        'corVerde': [0,1,0,1]
        }

siglas = ['AR','BR','FR', 'IT']

paises = pd.DataFrame(dados, index=siglas)
print(paises)

# Testa se um dado rótulo de linha existe.
tem_BR = 'BR' in paises.index
tem_US = 'US' in paises.index
print("Existe rotulo 'BR'? ->", tem_BR)
print("Existe rotulo 'US'? ->", tem_US)
print('------------------------------')

# Testa se um dado rótulo de coluna existe.
tem_corVerde = 'corVerde' in paises.columns
tem_corAzul = 'corAzul' in paises.columns
print("Existe o rotulo 'corVerde?' -> ", tem_corVerde)
print("Existe o rotulo 'corAzul?' -> ", tem_corAzul)


In [None]:
#P15: Importação de CSV padrão para um DataFrame.
import pandas as pd

paises = pd.read_csv(r"C:/Users/Iris/OneDrive - dmie.com.br/Desktop/Pandas/paises.csv", index_col="sigla")
print(paises)

In [None]:
#P16: Importação de CSV sem cabeçalho e com ";" como separador.
import pandas as pd

notas = pd.read_csv(r"C:/Users/Iris/OneDrive - dmie.com.br/Desktop/Pandas/notas.csv", sep=";", names=['matricula', 'nota1', 'nota2'], index_col='matricula')
print(notas)

In [None]:
# P17: Importação de arquivo com série temporal.
import pandas as pd

# Importa o arquivo para uma Series.
serie_gols = pd.read_csv(r"C:/Users/Iris/OneDrive - dmie.com.br/Desktop/Pandas/gols.csv", sep=" ", squeeze=True, index_col=0)

# Converte o tipo do indice para datetime e imprime a série.
serie_gols.index = pd.to_datetime(serie_gols.index, format='%d/%m/%Y')
print(serie_gols)

### Arquivo Excel

In [None]:
#P18: Importação de planilha Excel.
import pandas as pd

cidades = pd.read_excel(r"C:/Users/Iris/OneDrive - dmie.com.br/Desktop/Pandas/capitais.xlsx")
print(cidades)

### Arquivo JSON

In [None]:
# Importação de planilhas Excel.
import pandas as pd
import json

#(1) - Importa o arquivo JSON para memória.
with open("C:/Users/Iris/OneDrive - dmie.com.br/Desktop/Pandas/notas.json") as f:
    j_notas = json.load(f)

#(2) - Transfere as informações para um DataFrame.
notas = pd.DataFrame(j_notas, columns= ['matricula', 'notas'])
print(notas)