#### Criando Maquina virtal
***Comandos:*** 
```
python3 -m venv laboratorios-python

```
Comando para se for preciso liberar comando para o activate
```
# verificando se esta com acesso liberado
ls -la laboratorios-python/bin

# liberando acesso
chmod 777 laboratorios-python/bin/activate
```
Apos isso e so entrar na maquina virtual
```
# entrando na maquina vitrual
laboratorios-python/bin/activate 
```

# Trabalhando com Dados 

### Objetivo
Introduzir bibliotecas essencias para manipulação e análise de dados em Python, explorando casos de uso prático

<hr>

## Bibliotecas de Dados Essenciais

Nesta aula, vamos explorar quatro bibliotecas fundamentais para trabalhar com dados:
 1. **Pandas:** Manipulação e análise de dados
 2. **OS**: Interação com o sistema operacional
 3. **Requsts:** Requisições HTTP e consumo de APIs
 4. **Pyarrow:** Processamento eficiente de dados

**Nota:**Antes de começar instale as bibliotecas com:

```
pip install pandas requests pyarrow
```

# 1. Pandas: 
Pandas é a biblioteca mais popular para analise de dados em Python.

In [None]:
#!pip install pandas requests pyarrow
import pandas as pd

# Criando um DataFrame
dados = {
    'id': [1, 2, 3, 4],
    'nome': ['Joao', 'Paulo', 'Ana', 'Thaissa'],
    'idade': [34, 20, 54, 22],
    'salario': [5000, 7500, 2456, 4800]
}

df = pd.DataFrame(dados)

# Operações basicas
print("DataFrame completo:")
print(df)

print("\nInformações do DataFrame:")
print(df.info())

print("\nEstatiticas básicas:")
print(df.describe())

# Filtragem e seleção
print("\nPessoas com mais de 30 anos:")
print(df[df['idade'] > 30])

# Agrupamento e agregação
print("\nSalario medio por faixa etária:")
df['faixa-etaria'] = pd.cut(df['idade'], bins=[0, 25, 35, 100], labels=['Joven', 'Adulto', 'Sênior'])
print(df.groupby('faixa-etaria')['salario'].mean())

# Leitura de arquivos
# Exemplo: df_css = pd.read_css('dados.css')
# Exemplo: df_exel = pd.read_exel('dados.xlsx)




## 2. OS
Biblioteca para manipulação de arquivos e diretórios.

In [None]:
import os

# Operaçoes com diretorios
print("Diretorio atual:", os.getcwd())

# Criar dirtetorio
try: 
    os.mkdir('dados_projeto')
    print("Diretorio criado")
except FileExistsError:
    print("Diretorio ja existe")

# Listar arquivos
print("\nArquivos no diretorio atual: ")
print(os.listdir('.'))


Diretorio atual: /home/wescley/Documentos/Projetos/Python/python-course/begginer
Diretorio criado


In [11]:
# Verificando existencia de arquivo/diretorio
print("O diretorio 'dados-projeto' existe?", os.path.exists('dados_projeto'))

O diretorio 'dados-projeto' existe? False


In [12]:
# Juntar caminhos de forma independente de 50
caminho_completo = os.path.join('dados_projeto', 'relatorio.txt')
print("Caminho completo:", caminho_completo)

Caminho completo: dados_projeto/relatorio.txt


In [None]:
# Criar arquivo
with open(caminho_completo, 'w') as arquivo:
    arquivo.write("Relatorio de dados do projeto")

## 3 Resquests
Biblioteca para fazer requisições HTTP e consumir APIs

In [13]:
import requests as req
import json

# Requisiçao simples de API publica
try:
    # API de exemplo com dados publicos
    resposta = req.get('https://jsonplaceholder.typicode.com/todos/1')

    # Verificando status de requisição
    print("Status da requisição:", resposta.status_code)

    # Converter resposta para JSON
    dados = resposta.json()
    print("\nDados recebidos:")
    print(json.dumps(dados, indent=2))

except req.exceptions.RequestException as e:
    print("Erro de requisição:", e)

Status da requisição: 200

Dados recebidos:
{
  "userId": 1,
  "id": 1,
  "title": "delectus aut autem",
  "completed": false
}


In [14]:
# Exemplo de POST
try: 
    novo_post = {
        'title': 'Novo Titulo',
        'body': 'Conteudo do post',
        'userId': 1
    }
    
    resposta_post = req.post('https://jsonplaceholder.typicode.com/posts', json=novo_post)
    print("\nResposta do POST:")
    print(resposta_post.json())

except req.exceptions.RequestException as e:
    print("Error no POST:", e)


Resposta do POST:
{'title': 'Novo Titulo', 'body': 'Conteudo do post', 'userId': 1, 'id': 101}


## 4. PyArrow
Biblioteca para leitura e processamento de dados em grande escala

In [15]:
import pyarrow as pa
import pyarrow.parquet as pq

# Criando um array
data = [
    pa.array([1, 2, 3, 4]),
    pa.array(['a', 'b', 'c', 'd'])
]

# Criando uma tabela
table = pa.table(data, names=['numeros', 'letras'])

In [16]:
print("Tabela Pyarrow:")
print(table)

Tabela Pyarrow:
pyarrow.Table
numeros: int64
letras: string
----
numeros: [[1,2,3,4]]
letras: [["a","b","c","d"]]


In [17]:
# Conversão para Pandas (opcional)
df_pyarrow = table.to_pandas()
print("\nDataFrame Pandas:")
print(df_pyarrow)



DataFrame Pandas:
   numeros letras
0        1      a
1        2      b
2        3      c
3        4      d


In [18]:
# Exemplo de escrita em Parquet (formato eficiente)
try:
    # Criar diretorio se não existir 
    os.makedirs('dados', exist_ok=True)

    # Escrever tabela em arquivo Parquet
    pq.write_table(table, 'dados/exemplo.parquet')
    print("\nArquivo Parquet criado com sucesso!")

    # Ler arquivo Parquel
    tabela_lida = pq.read_table('dados/exemplo.parquet')
    print("\nTabela lida do Parquet")
    print(tabela_lida)
except Exception as e:
    print("Error no processamento Parquet:", e)


Arquivo Parquet criado com sucesso!

Tabela lida do Parquet
pyarrow.Table
numeros: int64
letras: string
----
numeros: [[1,2,3,4]]
letras: [["a","b","c","d"]]
