# <u>Comandos Básicos</u>
## Importando e entendendo os dados
-    Importando a biblioteca
-    Carregando dados para um DataFrame/Serie
-    Visualizando o que foi importado


---

# <u>Importacao da bilioteca</u>
## import pandas as pd
### isso ira importar a  biblioteca e assinar o alas "pd" a ela, embora qualquer outro possa ser usado a convencao e pd

In [1]:
# Ao executar o comando abaixo (Shift + Enter) a biblioteda panda estara disponivel sob o alias "pd"
import pandas as pd

---

# <u>Carregando dados para um DataFrame/Serie</u>
>  * Dataframe - E uma planilha de Excel com linhas e colunas. <br>
>  * Serie - E uma coluna do Excel.

1. <u>**Csv**</u>      df = pd.read_csv('dados.csv')<br><br>
2. <u>**Execel**</u>    df = pd.read_excel('planilha.xlsx')  * pip install openpyxl<br><br>
3. <u>**JSON**</u>      df = pd.read_json('dados.json') ou url df = pd.read_json('https://exemplo.com/dados.json')<br><br>
4. <u>**SQL**</u>       df = pd.read_sql('SELECT * FROM clientes', engine)<br>
> * from sqlalchemy import create_engine<br>
> * engine = create_engine('postgresql://usuario:senha@localhost:5432/meubanco')<br>

6. <u>**Parquet**</u>   df = pd.read_parquet('dados.parquet')  * Geralmente grandes quantidades de dados<br><br>
7. <u>**Clipboard**</u> df = pd.read_clipboard()  


---

# Importando um arquivo .CSV
## <u>**Parametros Uteis**</u>
>**<u>filepath_or_buffer:</u>** Caminho do arquivo .csv ou link de onde "bufferizar".<br>
>**<u>sep:</u>** Aqui vamos colocar qual o separador (, ou ; por exemplo).<br>
>**<u>names:</u>** Lista de nomes das colunas; caso a sua primeira linha nao seja.<br>
>**<u>index_col:</u>** Coluna que deve ser usada como indice.<br>
>**d<u>type:</u>** Define o tipo de cada coluna.<br>
>**<u>thousands</u>** Define o separador para milhoes<br>
>**<u>decimal</u>** Define o separador para os decimais<br>


In [None]:
## Exemplo de uso.
df = pd.read_csv(
                    filepath_or_buffer=filepath,        
                    sep=";",                             
                    names=["ID", "Nome", "Idade", "Salario"], 
                    index_col="ID",                     
                    dtype={"Nome": str, "Idade": int, "Salario": float},
                    thousands=".",                       
                    decimal=","                          
                )

---

# Importando um arquivo .Excel
## <u>**Parametros Uteis**</u>
>**<u>io:</u>** Caminho do arquivo ou buffer a ser carregado.<br>
>**<u>sheet_name:</u>** Nome ou indice da aba a ser carregado.<br>
>**<u>header:</u>** Linha com o cabecalho (Padrao = 0).<br>
>**<u>names:</u>** Lista com o cabecalho(Caso nao tenha).<br>
>**<u>usecols:</u>** Lista com as colunas p/ carregar (Padrao todas).<br>
>**<u>dtype:</u>** Dicionario com os tipos das colunas.<br>
>**<u>converters:</u>** Dicionario com funcoes para converter cada coluna<br>




In [None]:
df = pd.read_excel(
                       io='vendas.xlsx',              
                       sheet_name='Janeiro',          
                       header=0,                      
                       names=['Data', 'Produto', 'Quantidade', 'Valor'],  
                       usecols=['Data', 'Produto', 'Quantidade', 'Valor'],
                       dtype={                       
                             'Produto': str,
                             'Quantidade': int,
                             'Valor': float
                           },
                       converters={                   
                                      'Data': lambda x: pd.to_datetime(x, format='%d/%m/%Y'),
                                      "Nome": lambda x: x.strip().upper(),
                                      "Status": sua_funcao
                                      
                                  }
)

---

# Importando um arquivo .Jason
## <u>**Parametros Uteis**</u>
>**<u>path_or_buf:</u>** Caminho do arquivo ou buffer a ser carregado.<br>
>**<u>dtype:</u>** Tipo das colunas.<br>
>**<u>orient:</u>** Formato de orientacao dos dados 'records', 'split', 'index', 'columns', 'values'<br>



In [None]:
## Exemplo de uso.
df = pd.read_json(
                     path_or_buf=caminho_arquivo,
                     dtype=tipos_colunas,
                     orient='records'   # Pode ser 'split', 'index', 'columns' ou 'values'
                 )

---

# Importando um arquivo SQL
## <u>**Parametros Uteis**</u>
> * Lembre-se SQL primeiro se cria a conexao com o banco e depois puxa os dados.

> * Engine = create_engine( "postgresql+psycopg2://casaos:casaos@localhost:5432/meubanco")

>**<u>schema:</u>** Qual o schema para a conexao Ex. Public.<br>
>**<u>chunksize:</u>** Envia dados em blocos.<br>
>**<u>dtype:</u>** Define tipos especificos para as colunas.<br>
>**<u>index:</u>** Inclui ou não o índice do DataFrame como coluna.<br>

---

In [None]:
import pandas as pd
from sqlalchemy import create_engine
from sqlalchemy.types import Integer, String, DateTime

# 1️⃣ Criar o engine de conexão
engine = create_engine(
    "postgresql+psycopg2://casaos:casaos@localhost:5432/meubanco"
)

# 2️⃣ Criar um DataFrame de exemplo
dados = {
    "id": [1, 2, 3],
    "nome": ["Ana", "Bruno", "Carla"],
    "email": ["ana@email.com", "bruno@email.com", "carla@email.com"],
    "data_registro": pd.to_datetime(["2024-01-10", "2024-02-15", "2024-03-20"])
}

df = pd.DataFrame(dados)

# 3️⃣ Enviar os dados para o banco PostgreSQL
df.to_sql(
    name="clientes",         # Nome da tabela no banco
    con=engine,              # Conexão
    schema="public",         # Schema do PostgreSQL (padrão é 'public')
    if_exists="replace",     # Substitui a tabela se já existir ('append' para adicionar)
    index=False,             # Não envia o índice do DataFrame
    chunksize=1000,          # Envia os dados em blocos de 1000 linhas
    dtype={                  # Define tipos específicos das colunas no PostgreSQL
        "id": Integer(),
        "nome": String(100),
        "email": String(150),
        "data_registro": DateTime()
    }
)

# Importando um arquivo Parquet
## <u>**Parametros Uteis**</u>


>**<u>XX:</u>** YYY.<br>
>**<u>XX:</u>** YYY.<br>
>**<u>XX:</u>** YYY.<br>
>**<u>XX:</u>** YYY.<br>

---

# Importando um arquivo Clipboad (Control + C)
## <u>**Parametros Uteis**</u>

>**<u>XX:</u>** YYY.<br>
>**<u>XX:</u>** YYY.<br>
>**<u>XX:</u>** YYY.<br>
>**<u>XX:</u>** YYY.<br>