<a href="https://colab.research.google.com/github/JaCaRego/JaCaRego/blob/main/Introdu%C3%A7%C3%A3o_a_tratamento_de_dados.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import pandas as pd

df = pd.read_csv('clientes.csv')

# Verificar os primeiros registros
print(df.head().to_string())
# Verificar últimos registros
print((df.tail().to_string()))

# Verificar quantidade de linhas e colunas
print("Quantidade:  ", df.shape)

# Verificar tipos de dados

print("Tipagem: \n ", df.dtypes)

# Checar valores nulos
print('Valores nulos: \n ', df.isnull().sum())

#print(df.info())
#print(df.describe())

In [None]:
# Função para calcular o cubi de um número

def elevado_cubo(x):
    return x**3

# Expressão de lambda para calcular o cubo de um número
elevado_cubo_lambda = lambda x : x**3 # Para explicar didática. Não se utiliza dessa forma, dispensa isso.

print(elevado_cubo(2))
print(elevado_cubo_lambda(2))

df = pd.DataFrame({'números':[1,2,3, 4, 5, 10]})

df['cubo_funcao'] = df['números'].apply(elevado_cubo) # Para operações complexas, fica mais fácil o entendimento futuro
df['cubo lambda'] = df['números'].apply(lambda x: x**3) # Para operações simples, usa dessa forma. Deixa código mais simples
print(df)



```markdown
## Explicação do Código: Funções e Expressões Lambda

Este bloco de código demonstra a criação e o uso de funções Python e expressões lambda para realizar operações, especificamente para calcular o cubo de um número, e como aplicá-las a um `DataFrame` do `pandas`.

1.  **`def elevado_cubo(x):`**
    *   Define uma função tradicional chamada `elevado_cubo` que aceita um argumento `x`.
    *   `return x**3`: Dentro da função, ela retorna o valor de `x` elevado ao cubo.
    *   **Uso:** Funções definidas com `def` são ideais para lógica mais complexa, reutilização de código e quando você precisa de múltiplas linhas de instrução.

2.  **`elevado_cubo_lambda = lambda x : x**3`**
    *   Define uma **expressão lambda** (também conhecida como função anônima) e a atribui à variável `elevado_cubo_lambda`.
    *   `lambda x : x**3`: Esta é uma função concisa que aceita um argumento `x` e retorna `x` elevado ao cubo. Ela é definida em uma única linha.
    *   **Uso:** Expressões lambda são úteis para funções simples e rápidas, geralmente usadas quando uma função é necessária por um curto período ou como argumento para outras funções (como `apply` em `pandas`). A observação no código "Não se utiliza dessa forma, dispensa isso." sugere que, embora seja possível atribuir uma lambda a uma variável, o uso mais comum e idiomático é passá-la diretamente a outra função.

3.  **`print(elevado_cubo(2))`** e **`print(elevado_cubo_lambda(2))`**
    *   Ambas as linhas chamam as funções `elevado_cubo` e `elevado_cubo_lambda` respectivamente, passando o número `2` como argumento, e imprimem o resultado (que será `8` em ambos os casos).

4.  **`df = pd.DataFrame({'números':[1,2,3, 4, 5, 10]})`**
    *   Cria um `DataFrame` do `pandas` com uma única coluna chamada `números` contendo uma lista de inteiros.

5.  **`df['cubo_funcao'] = df['números'].apply(elevado_cubo)`**
    *   Cria uma nova coluna no `DataFrame` chamada `cubo_funcao`.
    *   `df['números'].apply(elevado_cubo)`: Aplica a função `elevado_cubo` (definida com `def`) a cada elemento da coluna `números`.
    *   **Justificativa:** Como a observação indica, para operações complexas, usar uma função `def` torna o código mais legível e fácil de entender e manter no futuro.

6.  **`df['cubo lambda'] = df['números'].apply(lambda x: x**3)`**
    *   Cria outra nova coluna no `DataFrame` chamada `cubo lambda`.
    *   `df['números'].apply(lambda x: x**3)`: Aplica diretamente uma expressão lambda (que calcula `x**3`) a cada elemento da coluna `números`.
    *   **Justificativa:** Para operações simples e concisas, usar uma expressão lambda diretamente no `apply` pode tornar o código mais curto e direto, sem a necessidade de definir uma função separada.

7.  **`print(df)`**
    *   Imprime o `DataFrame` resultante, que agora contém as colunas `números`, `cubo_funcao` e `cubo lambda`, mostrando os resultados das operações de cubagem realizadas de ambas as formas.

```markdown
## Explicação do Código:

Este bloco de código Python utiliza a biblioteca `pandas` para carregar e realizar uma análise exploratória inicial de um arquivo CSV chamado `clientes.csv`.

1.  **`import pandas as pd`**:
    *   Importa a biblioteca `pandas`, que é fundamental para manipulação e análise de dados em Python. O `as pd` cria um apelido (alias) para facilitar a referência à biblioteca (em vez de escrever `pandas` a cada vez, escreve-se `pd`).

2.  **`df = pd.read_csv('clientes.csv')`**:
    *   Lê o conteúdo do arquivo CSV chamado `clientes.csv` e armazena os dados em uma estrutura de dados `DataFrame` do pandas, que é atribuída à variável `df`. Um DataFrame é como uma tabela, com linhas e colunas.

3.  **`print(df.head().to_string())`**:
    *   `df.head()`: Retorna as cinco primeiras linhas do DataFrame `df` por padrão. Isso é útil para ter uma visão rápida de como os dados estão estruturados e quais são as primeiras entradas.
    *   `.to_string()`: Converte o resultado de `df.head()` para uma string, garantindo que todas as colunas sejam exibidas sem truncamento no console.

4.  **`print((df.tail().to_string()))`**:
    *   `df.tail()`: Retorna as cinco últimas linhas do DataFrame `df` por padrão. Isso ajuda a verificar o final do conjunto de dados.
    *   `.to_string()`: Similar ao anterior, garante a exibição completa das últimas linhas.

5.  **`print("Quantidade:  ", df.shape)`**:
    *   `df.shape`: Retorna uma tupla que representa as dimensões do DataFrame, no formato `(número_de_linhas, número_de_colunas)`. É útil para saber o tamanho total do seu conjunto de dados.

6.  **`print("Tipagem: \n ", df.dtypes)`**:
    *   `df.dtypes`: Retorna uma série com o tipo de dado de cada coluna do DataFrame. Conhecer os tipos de dados é crucial para operações posteriores (por exemplo, se uma coluna de números foi lida como texto, pode ser necessário convertê-la).

7.  **`print('Valores nulos: \n ', df.isnull().sum())`**:
    *   `df.isnull()`: Retorna um DataFrame booleano com `True` onde há valores nulos (`NaN` ou `None`) e `False` onde não há.
    *   `.sum()`: Soma os valores `True` (que são tratados como 1) para cada coluna, resultando na contagem total de valores nulos por coluna. Isso é essencial para identificar a presença de dados faltantes e planejar como tratá-los.

Este código fornece uma excelente primeira olhada no seu conjunto de dados, ajudando a entender sua estrutura, tipos de dados e a qualidade geral dos dados.
```