<a href="https://colab.research.google.com/github/tiagopessoalima/TATI/blob/main/Aula_Semana_02_(TATI).ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Programação para Ciência de Dados com Python**

Este notebook apresenta:
- Breve introdução à sintaxe básica do **Python**  
- Principais funcionalidades da biblioteca **NumPy**  
- Manipulação de dados com **Pandas**

## **Sintaxe Básica do Python**

É uma linguagem de programação de alto nível, interpretada e muito utilizada em Data Science. Algumas características:
- Sintaxe simples, intuitiva e **indentação** obrigatória para controle de blocos de código.
- Diversas bibliotecas e frameworks disponíveis (NumPy, Pandas, scikit-learn, etc.).
- Interpretada: O código Python é executado linha a linha, tornando o processo de desenvolvimento mais dinâmico.

In [None]:
# Exemplo de print (saída de texto) e atribuição de variáveis
mensagem = "Olá, Mundo!"
print(mensagem)

# Operações aritméticas
a = 10
b = 3
soma = a + b
divisao = a / b
potencia = a ** b

print(f"Soma: {soma}")
print(f"Divisão: {divisao}")
print(f"Potência: {potencia}")

# Estruturas condicionais
if a > b:
    print("a é maior que b")
else:
    print("b é maior ou igual a a")

# Estruturas de repetição
for i in range(5):
    print("Contador i:", i)

## **NumPy**

O [NumPy](https://numpy.org/) (Numerical Python) é uma biblioteca fundamental para computação científica em Python. Ele fornece:
- Um poderoso objeto de **array** multidimensional (`ndarray`).
- Funções matemáticas para operações em grandes volumes de dados de forma eficiente.
- Ferramentas para integração com C/C++ e Fortran.

### **Principais Funcionalidades do NumPy**

1. Criação de arrays
2. Indexação e fatiamento
3. Funções estatísticas
4. Operações aritméticas vetorizadas

In [None]:
import numpy as np

# Criação de um array NumPy
arr = np.array([1, 2, 3, 4, 5])
print("Array 1D:", arr)

# Array 2D
matriz = np.array([[1, 2, 3],
                   [4, 5, 6]])
print("\nArray 2D:\n", matriz)

# Verificando dimensões
print("\nDimensões do array 1D:", arr.shape)
print("Dimensões do array 2D:", matriz.shape)

# Operações básicas
print("\nSoma de todos os elementos:", np.sum(arr))
print("Média dos elementos:", np.mean(arr))
print("Desvio padrão:", np.std(arr))

# Criando arrays especiais
zeros = np.zeros((2, 3))
ones = np.ones((3, 2))
linspace = np.linspace(0, 10, 5)  # 5 valores entre 0 e 10

print("\nZeros:\n", zeros)
print("\nOnes:\n", ones)
print("\nLinspace:\n", linspace)

# Operações aritméticas vetorizadas
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])
print("\nSoma (a + b):", a + b)
print("Multiplicação (a * b):", a * b)
print("Combinação:", a**2 + b/2)

## **Pandas**

[Pandas](https://pandas.pydata.org/) é uma biblioteca essencial para manipulação e análise de dados em Python. Oferece:
- Estruturas de dados de alto desempenho: **Series** (1D) e **DataFrame** (2D).
- Ferramentas para leitura de arquivos (CSV, Excel, SQL, etc.).
- Filtros e transformações de dados simples e eficientes.
- Agregação, merge, joins, limpeza de dados e muito mais.

### **Series e DataFrames**

In [None]:
import pandas as pd

# Criando uma Series
minha_series = pd.Series([10, 20, 30, 40, 50], name="ExemploSeries")
print("Series:\n", minha_series)

# Criando um DataFrame
dados = {
    "ColunaA": [1, 2, 3],
    "ColunaB": ["A", "B", "C"]
}
df = pd.DataFrame(dados)
print("\nDataFrame:\n", df)

# Lendo arquivos CSV (exemplo hipotético)
# df_csv = pd.read_csv("caminho/para/seu_arquivo.csv")

# Informações sobre o DataFrame
print("\nInformações sobre o DataFrame:")
print(df.info())

print("\nDescrição estatística (DataFrame numérico):")
df_numerico = pd.DataFrame({
    "X": [10, 20, 30, 40],
    "Y": [5, 6, 7, 8]
})
print(df_numerico.describe())

### **Manipulação de Dados com Pandas**

Nesta seção, vamos mostrar algumas operações comuns de manipulação de dados, como seleção de colunas, filtragem, criação de colunas e agrupamentos.

In [None]:
# Exemplo de DataFrame para manipulação
dados = {
    "Nome": ["Ana", "Bruno", "Carlos", "Daniela", "Eduarda"],
    "Idade": [23, 35, 45, 29, 37],
    "Salário": [3500, 5000, 6200, 4000, 5200],
    "Departamento": ["RH", "Financeiro", "TI", "TI", "Financeiro"]
}
funcionarios = pd.DataFrame(dados)
print("DataFrame original:\n", funcionarios)

# Selecionando colunas
print("\nSelecionando coluna 'Nome':\n", funcionarios["Nome"])

# Filtrando dados (Idade maior que 30)
print("\nFiltrando por Idade > 30:\n", funcionarios[funcionarios["Idade"] > 30])

# Criando nova coluna (Exemplo: Salário Anual)
funcionarios["Salário Anual"] = funcionarios["Salário"] * 12
print("\nCom nova coluna 'Salário Anual':\n", funcionarios)

# Agrupando dados
agrupado_departamento = funcionarios.groupby("Departamento")["Salário"].mean()
print("\nSalário médio por Departamento:\n", agrupado_departamento)

## **Conclusão**

Neste notebook, você viu:
1. **Sintaxe básica do Python**: como variáveis, condicionais e loops.  
2. **NumPy**: criação e manipulação de arrays para computação científica.  
3. **Pandas**: manipulação de dados com estruturas como Series e DataFrames, além de operações de limpeza, transformação e agregação.

Essas ferramentas são a base para **Ciência de Dados** com Python. A partir desse conhecimento, você poderá explorar bibliotecas mais avançadas como **matplotlib** (visualização), **scikit-learn** (aprendizado de máquina), entre outras.

## **Sugestões de estudo e prática**


- Praticar leituras de arquivos CSV, Excel e SQL para manipular dados reais.
- Explorar funções estatísticas e de limpeza de dados no Pandas, como `dropna`, `fillna`, `merge`, `concat` etc.
- Manipular arrays NumPy para operações matemáticas mais complexas.