##INTRODUÇÃO A PYTHON E PANDAS

#Introdução

Python é uma linguagem de programação de alto nível, interpretada e dinamicamente tipada, que é popular para desenvolvimento web, ciência de dados, automação de tarefas, entre outros. Pandas é uma biblioteca de análise de dados que é popular para trabalhar com dados tabulares.

#Sintaxe

A sintaxe em Python é relativamente simples. Para começar, todas as declarações são terminadas por dois pontos (:), e blocos de código são delimitados por indentação. Por exemplo, um loop for pode ser escrito da seguinte maneira:

In [None]:
for i in range(10):
    print(i)


0
1
2
3
4
5
6
7
8
9


Isso imprimirá os números de 0 a 9 na tela. Observe que a linha com o print é indentada. Isso indica que ela faz parte do loop for.

Outra parte fundamental da sintaxe em Python são os comentários. Comentários são linhas de código que são ignoradas pelo interpretador, mas que são úteis para documentação e esclarecimento de código. Comentários começam com o símbolo #. 
#Por exemplo:

In [None]:
# Este é um comentário
x = 5 # Isto é também um comentário


#Variáveis

Variáveis em Python são atribuídas com o operador de atribuição =. Python é uma linguagem dinamicamente tipada, o que significa que você não precisa declarar explicitamente o tipo de uma variável. O tipo é inferido automaticamente pelo Python, dependendo do valor atribuído à variável.

In [None]:
x = 5 # x é um inteiro
y = "Hello" # y é uma string
z = [1, 2, 3] # z é uma lista



Observe que as listas em Python são criadas usando colchetes [].

#Listas
As listas são uma das estruturas de dados mais básicas em Python. Elas são um conjunto ordenado de valores, que podem ser de diferentes tipos. Listas são mutáveis, o que significa que é possível modificar seus valores.



In [None]:
my_list = [1, 2, 3, "hello", "world"]
my_list

Para acessar um elemento específico em uma lista, você pode usar o operador de índice [].

In [None]:
print(my_list[0]) # imprime 1
print(my_list[3]) # imprime "hello"


Para adicionar um elemento no final da lista, você pode usar o método append.

In [None]:
my_list.append(4)
print(my_list) # imprime [1, 2, 3, "hello", "world", 4]

Para remover um elemento específico da lista, você pode usar o método remove.


In [None]:
my_list.remove(2)
print(my_list) # imprime [1, 3, "hello", "world", 4]


#Tuplas
Tuplas são estruturas de dados semelhantes a listas, mas que são imutáveis. Isso significa que você não pode adicionar, remover ou modificar elementos em uma tupla depois de criá-la.

In [None]:
my_tuple = (1, 2, 3, "hello", "world")


O acesso a elementos em uma tupla é feito da mesma maneira que em uma lista, usando o operador de índice []

In [None]:
print(my_tuple[0]) # imprime 1
print(my_tuple[3]) # imprime "hello"


Embora você não possa modificar uma tupla depois de criá-la, é possível criar uma nova tupla a partir de uma existente, adicionando ou removendo elementos.


In [None]:
new_tuple = my_tuple + (4,)
print(new_tuple) # imprime (1, 2, 3, "hello", "world", 4)


Observe que para adicionar um único elemento a uma tupla, é necessário incluí-lo dentro de parênteses e seguido por uma vírgula. Isso ocorre porque o Python interpreta parênteses sem vírgula como uma expressão, e não como uma tupla.

#Conjuntos
Conjuntos em Python são estruturas de dados que armazenam um conjunto não ordenado e sem repetição de elementos. Conjuntos são úteis para operações matemáticas como união, interseção e diferença.

In [None]:
my_set = {1, 2, 3, 4, 5}


Para adicionar um elemento a um conjunto, você pode usar o método add.

In [None]:
my_set.add(6)
print(my_set) # imprime {1, 2, 3, 4, 5, 6}

Para remover um elemento de um conjunto, você pode usar o método remove.

In [None]:
my_set.remove(4)
print(my_set) # imprime {1, 2, 3, 5, 6}

#Dicionários
Dicionários em Python são estruturas de dados que associam uma chave a um valor. Cada chave em um dicionário é única.

In [None]:
my_dict = {"name": "John", "age": 30, "city": "New York"}


Para acessar o valor de um elemento em um dicionário, você pode usar a chave correspondente.

In [None]:
print(my_dict["name"]) # imprime "John"
print(my_dict["age"]) # imprime 30


Para adicionar um novo elemento a um dicionário, você pode simplesmente atribuir um valor a uma nova chave.

In [None]:
my_dict["gender"] = "male"
print(my_dict) # imprime {"name": "John", "age": 30, "city": "New York", "gender": "male"}


Para remover um elemento de um dicionário, você pode usar a palavra-chave del.

In [None]:
del my_dict["city"]
print(my_dict) # imprime {"name": "John", "age": 30, "gender": "male"}


Em Python, existem vários tipos de dados predefinidos, incluindo:

*int (inteiro): números inteiros, como 1, 2, 3, etc.

*float (ponto flutuante): números reais, como 1.0, 2.5, 3.14159, etc.

*bool (booleano): valores lógicos True (verdadeiro) e False (falso).

*str (string): sequências de caracteres, como "hello", "world", etc.

*list: coleções ordenadas de objetos, que podem ser de diferentes tipos de dados.

*tuple: coleções ordenadas de objetos, que podem ser de diferentes tipos de dados, mas são imutáveis (ou seja, não podem ser alteradas após a criação).

*set: coleções não ordenadas de objetos exclusivos, que podem ser de diferentes tipos de dados.

*dict (dicionário): coleções não ordenadas de pares chave-valor, onde as chaves são únicas e os valores podem ser de diferentes tipos de dados.

Para descobrir o tipo de dados de uma variável em Python, podemos usar a função type().

In [None]:
x = 10
y = str(x)
print(type(y))   # <class 'str'>

z = float(x)
print(type(z))   # <class 'float'>

w = bool(x)
print(type(w))   # <class 'bool'>


Compreender os tipos de dados em Python é importante para trabalhar com variáveis e estruturas de dados em Python.

#Loops
Os loops permitem que você execute um bloco de código várias vezes. Em Python, existem dois tipos principais de loops: o loop for e o loop while.

#Loop for
O loop for é usado para iterar sobre uma sequência de itens. Por exemplo, podemos usar um loop for para imprimir cada elemento de uma lista:

In [None]:
fruits = ["apple", "banana", "cherry"]

for fruit in fruits:
    print(fruit)


#Loop while
O loop while é usado para repetir um bloco de código enquanto uma condição for verdadeira. Por exemplo, podemos usar um loop while para imprimir os números de 0 a 4:

In [None]:
i = 0

while i < 5:
    print(i)
    i += 1


#Funções
As funções são blocos de código que executam uma tarefa específica. Em Python, você pode criar suas próprias funções usando a palavra-chave def.

Por exemplo, podemos criar uma função que calcula a soma de dois números:

In [None]:
def add_numbers(x, y):
    return x + y

result = add_numbers(3, 5)
print(result)   # 8


Neste exemplo, a função add_numbers recebe dois argumentos (x e y) e retorna sua soma.

As funções podem ser usadas para organizar o código em blocos reutilizáveis e também para tornar o código mais legível.

Além disso, em Python existem muitas funções predefinidas, como: **print(), len(), range()**, etc. Você também pode importar módulos que contêm funções adicionais para estender as funcionalidades do Python.

#Glossário com definições sucintas de alguns termos e comandos usados até aqui:

Python: Uma linguagem de programação de alto nível, interpretada, interativa e orientada a objetos.
Pandas: Uma biblioteca Python de análise de dados que fornece estruturas de dados de alta performance e ferramentas de análise de dados.

+ Sintaxe: A forma correta de escrever o código em uma linguagem de programação, incluindo a ordem dos comandos, a pontuação, etc.

+ Loops: Estruturas de controle de fluxo que permitem que um bloco de código seja executado várias vezes.

+ Loop for: Um tipo de loop que é usado para iterar sobre uma sequência de itens.

+ Loop while: Um tipo de loop que é usado para repetir um bloco de código enquanto uma condição for verdadeira.

+ Variáveis: Um nome que é usado para se referir a um valor armazenado na memória do computador.

+ Listas: Uma coleção ordenada e mutável de elementos, que podem ser de diferentes tipos de dados.

+ Tuplas: Uma coleção ordenada e imutável de elementos, que podem ser de diferentes tipos de dados.

+ Sets: Uma coleção não ordenada e mutável de elementos únicos.

+ Dicionários: Uma coleção não ordenada e mutável de pares chave-valor.

+ Funções: Blocos de código que executam uma tarefa específica e podem ser reutilizados em diferentes partes do programa.

+ def: Uma palavra-chave em Python usada para definir uma nova função.

+ return: Uma palavra-chave em Python usada para retornar um valor de uma função.

+ Indexação: A maneira de acessar elementos individuais em uma sequência, como uma lista ou uma string, usando colchetes e um índice.

+ Métodos: Funções associadas a um objeto específico que podem ser usadas para modificar ou consultar esse objeto.

+ Numpy: Uma biblioteca Python para computação científica, que fornece suporte para arrays multidimensionais e funções matemáticas.

+ Array: Uma estrutura de dados multidimensional usada para armazenar elementos do mesmo tipo de dados.

+ Dataframe: A estrutura de dados central na biblioteca Pandas, que é usada para armazenar dados tabulares em duas dimensões (linhas e colunas).

+ Series: Uma estrutura de dados unidimensional semelhante a uma lista, mas com recursos adicionais e otimizada para análise de dados.

+ iloc: Um método usado para acessar elementos em um dataframe ou série pelo seu índice inteiro.

+ loc: Um método usado para acessar elementos em um dataframe ou série por meio de rótulos de linha ou coluna.

+ groupby: Um método usado para agrupar dados em um dataframe com base em valores de uma ou mais colunas.

+ apply: Um método usado para aplicar uma função a um dataframe ou série.

+ merge: Um método usado para combinar dois dataframes com base em uma ou mais colunas em comum.

+ concat: Um método usado para concatenar dois ou mais dataframes ou séries ao longo de um eixo específico.

# Uma lista de algumas das bibliotecas mais usadas em Python:

+ Pandas: Uma biblioteca para análise de dados que fornece estruturas de dados de alta performance e ferramentas de análise de dados.
+ Numpy: Uma biblioteca para computação científica que fornece suporte para arrays multidimensionais e funções matemáticas.
+ Matplotlib: Uma biblioteca para visualização de dados em gráficos e plots.
+ Scikit-learn: Uma biblioteca para aprendizado de máquina que fornece algoritmos para classificação, regressão e clusterização.
+ TensorFlow: Uma biblioteca para aprendizado de máquina que fornece uma plataforma para construir e treinar modelos de redes neurais.
+ PyTorch: Uma biblioteca para aprendizado de máquina que fornece uma plataforma para construir e treinar modelos de redes neurais, com ênfase em deep learning.
+ Seaborn: Uma biblioteca para visualização de dados em gráficos e plots, construída em cima do Matplotlib e com recursos adicionais.
+ SciPy: Uma biblioteca para computação científica que fornece algoritmos para otimização, álgebra linear, processamento de sinais e estatísticas.
+ Requests: Uma biblioteca para fazer requisições HTTP em Python.
+ BeautifulSoup: Uma biblioteca para extrair informações de HTML e XML em Python.

#Pandas.

Pandas é uma biblioteca popular de análise de dados em Python que fornece estruturas de dados de alta performance e ferramentas de manipulação de dados. As duas estruturas de dados principais em Pandas são as Series e DataFrames.

Series
Uma Series é uma estrutura de dados unidimensional semelhante a uma matriz, lista ou coluna de uma tabela de banco de dados. Cada elemento em uma Series é rotulado com um índice, que pode ser um valor inteiro ou uma string.

In [None]:
import pandas as pd

my_series = pd.Series([10, 20, 30, 40, 50], index=['a', 'b', 'c', 'd', 'e'])
print(my_series)


#DataFrames
Um DataFrame é uma estrutura de dados tabular bidimensional semelhante a uma planilha do Excel ou a uma tabela de banco de dados. Cada coluna em um DataFrame é uma Series, e as linhas são rotuladas com um índice.

In [None]:
my_dict = {'name': ['John', 'Mary', 'Peter', 'Jane'],
           'age': [30, 25, 40, 35],
           'city': ['New York', 'Paris', 'London', 'Sydney']}

my_dataframe = pd.DataFrame(my_dict)
print(my_dataframe)


#Selecionando Dados
Pandas fornece muitas maneiras de selecionar e filtrar dados em um DataFrame. Uma maneira simples de selecionar colunas é usar a notação de colchetes.

In [None]:
names = my_dataframe['name']
print(names)


Para selecionar linhas, você pode usar o método loc.

In [None]:
row = my_dataframe.loc[2]
print(row)

Você também pode selecionar um subconjunto de linhas e colunas usando a notação de colchetes.

In [None]:
subset = my_dataframe.loc[[1, 3], ['name', 'city']]
print(subset)


## Exercício

Crie uma função chamada sum_even_numbers que recebe uma lista de números como argumento e retorna a soma de todos os números pares na lista.

Em seguida, crie um loop que pede ao usuário para digitar uma lista de números separados por vírgula e, em seguida, chama a função sum_even_numbers com a lista de entrada. O loop deve continuar até que o usuário digite "fim" para sair.

Por exemplo:

In [None]:
def sum_even_numbers(numbers):
    sum = 0
    for num in numbers:
        if num % 2 == 0:
            sum += num
    return sum

while True:
    user_input = input("Digite uma lista de números separados por vírgula (ou 'fim' para sair): ")
    if user_input == "fim":
        break
    numbers = user_input.split(",")
    numbers = [int(num) for num in numbers]