### pandas

## o que e?

-Em programação de computadores, pandas é uma biblioteca de software criada para a linguagem Python para manipulação e análise de dados.

## o que e Numpy?

-NumPy é uma biblioteca para a linguagem de programação Python, que suporta o processamento de grandes, multi-dimensionais arranjos e matrizes, juntamente com uma grande coleção de funções matemáticas de alto nível para operar sobre estas matrizes. 

## como carregar dados no pandas?


In [None]:
import pandas as pd

# Carregar dados de um arquivo CSV
df = pd.read_csv('caminho/para/seu_arquivo.csv')

# Exibir as primeiras linhas do DataFrame
print(df.head())


## Como criar um dataFrame?


In [None]:
import pandas as pd

# Criar um dicionário
data = {
    'Nome': ['Alice', 'Bob', 'Charlie'],
    'Idade': [25, 30, 35],
    'Cidade': ['São Paulo', 'Rio de Janeiro', 'Belo Horizonte']
}

# Criar o DataFrame
df = pd.DataFrame(data)

# Exibir o DataFrame
print(df)


## O que são Series?

Em Pandas, uma Series é uma estrutura de dados unidimensional que pode armazenar qualquer tipo de dados (inteiros, strings, floats, objetos Python, etc.). Uma Series é muito similar a um array unidimensional do NumPy, mas com a vantagem adicional de possuir etiquetas de índice, o que a torna muito poderosa para manipulação e análise de dados.

In [None]:
import pandas as pd

# Criar uma Series a partir de uma lista
data = [10, 20, 30, 40, 50]
series = pd.Series(data)

print(series)


## Como mostrar um cabeçalho?


Mostrar um cabeçalho no rodapé de um DataFrame no Pandas pode ser entendido como exibir algumas das primeiras linhas e algumas das últimas linhas do DataFrame juntas. Isso pode ser útil para obter uma visão geral dos dados sem precisar percorrer todas as linhas.

Aqui está como você pode fazer isso:

Método 1: Usando pd.concat
Você pode usar pd.concat para concatenar o cabeçalho (primeiras linhas) e o rodapé (últimas linhas) do DataFrame.

In [None]:
import pandas as pd

# Criar um exemplo de DataFrame
data = {'A': range(1, 21), 'B': range(21, 41)}
df = pd.DataFrame(data)

# Número de linhas a serem exibidas no cabeçalho e no rodapé
n = 3

# Concatenar o cabeçalho e o rodapé
head_tail = pd.concat([df.head(n), df.tail(n)])

print(head_tail)


Método 2: Usando df.iloc
Você também pode usar o método iloc para selecionar e concatenar as primeiras e últimas linhas do DataFrame.

In [None]:
import pandas as pd

# Criar um exemplo de DataFrame
data = {'A': range(1, 21), 'B': range(21, 41)}
df = pd.DataFrame(data)

# Número de linhas a serem exibidas no cabeçalho e no rodapé
n = 3

# Selecionar o cabeçalho e o rodapé usando iloc
head_tail = df.iloc[list(range(n)) + list(range(-n, 0))]

print(head_tail)


In [None]:
#EXEMPLO COMPLETO

import pandas as pd

# Criar um exemplo de DataFrame
data = {
    'Nome': ['Alice', 'Bob', 'Charlie', 'David', 'Edward', 'Fiona', 'George', 'Hannah', 'Ivan', 'Jack'],
    'Idade': [25, 30, 35, 40, 45, 50, 55, 60, 65, 70],
    'Cidade': ['São Paulo', 'Rio de Janeiro', 'Belo Horizonte', 'Curitiba', 'Porto Alegre', 'Salvador', 'Fortaleza', 'Manaus', 'Brasília', 'Recife']
}
df = pd.DataFrame(data)

# Mostrar o cabeçalho e o rodapé (3 linhas de cada)
print(show_head_tail(df, n=3))


## Como ver a quantidade de entrada do DataFrame?

In [None]:
import pandas as pd

# Criar um exemplo de DataFrame
data = {
    'Nome': ['Alice', 'Bob', 'Charlie', 'David', 'Edward', 'Fiona', 'George', 'Hannah', 'Ivan', 'Jack'],
    'Idade': [25, 30, 35, 40, 45, 50, 55, 60, 65, 70],
    'Cidade': ['São Paulo', 'Rio de Janeiro', 'Belo Horizonte', 'Curitiba', 'Porto Alegre', 'Salvador', 'Fortaleza', 'Manaus', 'Brasília', 'Recife']
}
df = pd.DataFrame(data)

# Obter a quantidade de entradas (linhas) e colunas
num_rows, num_cols = df.shape

print(f"Quantidade de entradas (linhas): {num_rows}")
print(f"Quantidade de colunas: {num_cols}")


## Como retornar o número de linhas colunas de um DataFrame?

In [None]:
import pandas as pd

# Criar um exemplo de DataFrame
data = {
    'Nome': ['Alice', 'Bob', 'Charlie', 'David', 'Edward', 'Fiona', 'George', 'Hannah', 'Ivan', 'Jack'],
    'Idade': [25, 30, 35, 40, 45, 50, 55, 60, 65, 70],
    'Cidade': ['São Paulo', 'Rio de Janeiro', 'Belo Horizonte', 'Curitiba', 'Porto Alegre', 'Salvador', 'Fortaleza', 'Manaus', 'Brasília', 'Recife']
}
df = pd.DataFrame(data)

# Obter a quantidade de colunas
num_colunas = df.columns.size

print(f"Número de colunas: {num_colunas}")


## Informaçoes do DataFrame?

Para obter informações detalhadas sobre um DataFrame no Pandas, você pode usar o método .info(), que fornece um resumo do DataFrame, incluindo o número de entradas, colunas, tipo de dados de cada coluna, e memória utilizada. Além disso, existem outros métodos úteis que fornecem diferentes tipos de informações. Aqui estão algumas das principais maneiras de obter informações sobre um DataFrame:

In [None]:
import pandas as pd

# Criar um exemplo de DataFrame
data = {
    'Nome': ['Alice', 'Bob', 'Charlie', 'David', 'Edward', 'Fiona', 'George', 'Hannah', 'Ivan', 'Jack'],
    'Idade': [25, 30, 35, 40, 45, 50, 55, 60, 65, 70],
    'Cidade': ['São Paulo', 'Rio de Janeiro', 'Belo Horizonte', 'Curitiba', 'Porto Alegre', 'Salvador', 'Fortaleza', 'Manaus', 'Brasília', 'Recife']
}
df = pd.DataFrame(data)

# Obter informações sobre o DataFrame
df.info()


## Describe 

O método .describe() fornece estatísticas descritivas para colunas numéricas por padrão. Para incluir colunas não numéricas, use o parâmetro include='all'.

In [None]:
import pandas as pd

# Criar um exemplo de DataFrame
data = {
    'Nome': ['Alice', 'Bob', 'Charlie', 'David', 'Edward', 'Fiona', 'George', 'Hannah', 'Ivan', 'Jack'],
    'Idade': [25, 30, 35, 40, 45, 50, 55, 60, 65, 70],
    'Cidade': ['São Paulo', 'Rio de Janeiro', 'Belo Horizonte', 'Curitiba', 'Porto Alegre', 'Salvador', 'Fortaleza', 'Manaus', 'Brasília', 'Recife']
}
df = pd.DataFrame(data)

# Obter estatísticas descritivas
print(df.describe())


## .head() e .tail()

In [None]:
import pandas as pd

# Criar um exemplo de DataFrame
data = {
    'Nome': ['Alice', 'Bob', 'Charlie', 'David', 'Edward', 'Fiona', 'George', 'Hannah', 'Ivan', 'Jack'],
    'Idade': [25, 30, 35, 40, 45, 50, 55, 60, 65, 70],
    'Cidade': ['São Paulo', 'Rio de Janeiro', 'Belo Horizonte', 'Curitiba', 'Porto Alegre', 'Salvador', 'Fortaleza', 'Manaus', 'Brasília', 'Recife']
}
df = pd.DataFrame(data)

# Exibir as primeiras 5 linhas do DataFrame
print(df.head())

# Exibir as últimas 5 linhas do DataFrame
print(df.tail())


## .columns e .index

In [None]:
import pandas as pd

# Criar um exemplo de DataFrame
data = {
    'Nome': ['Alice', 'Bob', 'Charlie', 'David', 'Edward', 'Fiona', 'George', 'Hannah', 'Ivan', 'Jack'],
    'Idade': [25, 30, 35, 40, 45, 50, 55, 60, 65, 70],
    'Cidade': ['São Paulo', 'Rio de Janeiro', 'Belo Horizonte', 'Curitiba', 'Porto Alegre', 'Salvador', 'Fortaleza', 'Manaus', 'Brasília', 'Recife']
}
df = pd.DataFrame(data)

# Obter os nomes das colunas
print(df.columns)

# Obter os rótulos dos índices
print(df.index)


## .dtypes

In [None]:
import pandas as pd

# Criar um exemplo de DataFrame
data = {
    'Nome': ['Alice', 'Bob', 'Charlie', 'David', 'Edward', 'Fiona', 'George', 'Hannah', 'Ivan', 'Jack'],
    'Idade': [25, 30, 35, 40, 45, 50, 55, 60, 65, 70],
    'Cidade': ['São Paulo', 'Rio de Janeiro', 'Belo Horizonte', 'Curitiba', 'Porto Alegre', 'Salvador', 'Fortaleza', 'Manaus', 'Brasília', 'Recife']
}
df = pd.DataFrame(data)

# Obter os tipos de dados de cada coluna
print(df.dtypes)


## O que e I.A?

A inteligência artificial é um campo de estudo multidisciplinar que abrange varias áreas do conhecimento. É também um conjunto de novas tecnologias que permitem aos aparelhos smart executarem várias funções avançadas de modo quase autônomo, representanto um marco histórico na computação moderna.

## O que e DeepLearning

A aprendizagem profunda, do inglês Deep Learning é um ramo de aprendizado de máquina baseado em um conjunto de algoritmos que tentam modelar abstrações de alto nível de dados usando um grafo profundo com várias camadas de processamento, compostas de várias transformações lineares e não lineares. 

## Quais Problmeas a IA pode resolver

problemas matemáticos, análises de perfil para sistemas de recomendação, prevenção de fraudes em sistemas financeiros, etc

## Funçoes 

As funções são definidas por relacionar constantes e variáveis para descrever fenômenos naturais e tecnológicos, estudadas em diversas áreas do conhecimento.[4] Deve-se notar que as palavras "função", "mapeamento", "mapa" e "transformação" são geralmente usadas como termos equivalentes. Muitas leis científicas e muitos princípios de Engenharia descrevem função como uma quantidade dependendo de outra. 

## Como limpar dados NaN-Na 

Para limpar dados que contêm valores NaN (Not a Number) ou NA (Not Available) em um DataFrame no Pandas, você pode utilizar vários métodos. Aqui estão alguns dos mais comuns:

1. Remover linhas ou colunas com NaN
Remover linhas com NaN
Você pode usar o método dropna() para remover todas as linhas que contêm NaN.

In [None]:
import pandas as pd

# Criar um exemplo de DataFrame
data = {
    'A': [1, 2, None, 4, 5],
    'B': [None, 2, 3, None, 5],
    'C': [1, None, 3, 4, None]
}
df = pd.DataFrame(data)

# Remover linhas que contêm qualquer `NaN`
df_sem_nan = df.dropna()

print(df_sem_nan)
