#**Escrevendo seu primeiro código em python**

Nesse primeiro código iremos utilizar a função `print()` para escrever um texto na tela.

* Por que utilizar aspas? E os parênteses?
* Essa formatação é obrigatória?
* O que mais se pode fazer com python?

Vamos explicar essas questões nas próximas seções...

# **Tipos de dados e variáveis em Python**

Em Python, todo dado pertence a um tipo. Os tipos mais comuns são:

- **int** → números inteiros  
- **float** → números decimais  
- **str** → textos (strings)  
- **bool** → valores lógicos (True ou False)  
- **list** → coleções ordenadas de dados  
- **dict** → pares chave/valor

Para facilitar o uso desses dados, podemos **associá-los a nomes escolhidos por nós**.  Esses nomes são chamados de **variáveis**.

# **Variáveis**

Uma **variável** funciona como uma “caixa com etiqueta”, onde guardamos um valor para reutilizá-lo depois.

Usamos o operador `=` para **atribuir** um valor a uma variável.

Os nomes de variáveis em Python podem conter letras (A-Z, a-z), números (0-9) e o caractere sublinhado (_). Porém, eles não podem começar com números nem usar símbolos especiais, como @, & ou #, ou espaços. Além disso, letras maiúsculas e minúsculas são tratadas de modo distinto.

Agora, vamos criar duas variáveis diferentes, e atribuir seu valor.

### **Verificando o conteúdo de uma variável**

Para verificar o conteúdo de uma variável pode-se utilizar a função **`print()`**.  
Essa função **imprime na tela** o que passarmos entre parênteses.

Vamos verificar o conteúdo das variáveis criadas anteriormente:

Também é possível utilizar o print() diretamente com um texto, número ou qualquer outro tipo de dado em Python.
Além disso, é possível exibir mais de um objeto ao mesmo tempo, separando-os por vírgulas:

### **Verificando o tipo de uma variável**

Para descobrir o tipo de dado armazenado em uma variável usamos a função **`type()`**.  
Ela retorna a **classe** do valor, como `<class 'int'>`, `<class 'str'>`, `<class 'float'>`, etc.

### - Strings (textos)

Strings são sequências de caracteres, ou seja, textos.  
Usamos aspas simples `' '` ou aspas duplas `" "` para defini-las.

Abaixo, criei uma variável com um dado em string, depois imprima seu tipo:

### - Números (int e float)

Podemos trabalhar com números inteiros (`int`) ou decimais (`float`).

Defina uma variável com número inteiro e verifique seu tipo. Depois, faça o mesmo, porém, com um número decimal.

### - Booleanos (valores lógicos)

Booleanos podem ser apenas **True** (verdadeiro) ou **False** (falso).  
Eles são usados principalmente em testes de condições.

### - Listas

Listas guardam uma coleção de valores **ordenados**, que podem ser de variados tipos.  
Cada item tem uma posição chamada **índice**, que começa em zero.

Vamos criar uma variável com uma lista e depois imprimir seu tipo:

Cada item da lista possui um **índice numérico**, atribuído automaticamente a partir de zero:

| Índice | Valor |
|--------|-------|
| 0      | 'Dom' |
| 1      | 'Seg' |
| 2      | 'Ter' |
| 3      | 'Qua' |
| 4      | 'Qui' |
| 5      | 'Sex' |
| 6      | 'Sab' |

Agora, vamos imprimir alguns índices, como o primeiro e último dia:

### - Dicionários

Dicionários guardam pares **chave → valor**.  
São muito usados para representar dados estruturados (como se fossem tabelas com dados que são *nomeados* ou *rotulados*).

Crie uma variável com um dicionário, depois imprima ela e seu tipo:

Podemos acessar os valores de um dicionário utilizando **o nome do dicionário** seguido da **chave correspondente entre colchetes**.

Agora, vamos acessar o valor de algumas chaves do dicionário, imprimindo-as na tela:

**Atenção!**
Observe que tudo o que inserimos após o `#` no código é destacado em verde e é considerado como um comentário.
Isso significa que o Python não executa o que vem depois do `#`.
Comentários são usados para explicar o código ou anotar observações, sem afetar a execução.

# **Expressões**

Uma expressão é uma combinação de valores, variáveis e operadores. Dentro seus tipos existem:
- Operadores de Atribuição: Para atribuir valores em variáveis.

- Operadores Aritméticos: Para realizar operações matemáticas.

- Operadores Relacionais: Para comparar valores.

- Operadores Lógicos: Para combinar expressões booleanas.

- Operadores de Filiação: Para verificar se um valor pertence a uma sequência.

### **Operadores de Atribuição**

Consiste no uso do operador `=` para atribuir um valor a uma variável.

### **Operadores Aritméticos**

As 4 operações básicas: adição, subtração, multiplicação e divisão estão presentes aqui.

Com esses operadores, também podemos realizar operações como:
- Exponenciação
- Resto
- Divisão inteira

### **Operadores de Atribuição Compostos** **(Ocultar?)**

Consistem na junção do operador `=` com os operadores aritméticos.

### Ordem de precedência aritmética

Python segue a ordem de precedência da matemática que aprendemos no ensino fundamental. Também é possível utilizar parênteses para alterar a ordem que as operações devem ser executadas.

### Manipulação de Strings com operadores aritméticos

Não somente dados numéricos podem ser manipulados por esses operadores, porém, com as strings o funcionamento é um pouco diferente. Operações como adição e multiplicação estão presentes aqui também.

Mas operações como subtração e divisão não podem ser usadas...

### **Operadores Relacionais**

> Adicionar aspas

Os operadores relacionais são usados para comparar dois valores. Os resultados dessas operações são sempre um valor booleano: True (verdadeiro) ou False (falso).

Dentre os operadores relacionais, estão:
- igual (`==`)
- diferente (`!=`)
- maior que (`>`)
- menor que (`<`)
- maior ou igual (`>=`)
- menor ou igual (`<=`)

Agora, vamos definir algumas variáveis e testá-las:

### **Operadores Lógicos**

Os operadores lógicos são usados para combinar expressões booleanas. Eles são fundamentais para criar lógicas de controle em nossos programas (como em `if`).

Sendo `and`, `or` e `not`.

Vamos criar algumas variáveis contendo expressões que tem um valor lógico atribuido como resultado, depois, vamos combinar as expressões e testar seus resultados:

### **Operadores de Filiação**

 São usados para nos certificarmos se um ou mais valores estão presentes em um grupo de valores. Os resultados dessas operações são sempre um valor booleano: True (verdadeiro) ou False (falso).

 Podem ser:
 - `in` (presente no conjunto)
 - `not in` (não presente no conjunto)

 Vamos criar uma variável e testá-la:

Operações de filiação não se limitam à listas, podendo ser também strings, dicionários, entre outros...

 = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =

# **Estruturas condicionais: if, elif e else**

Em Python, podemos fazer com que nossos programas tomem decisões com base em condições. Isso é feito usando as estruturas `if`, `elif` (else if) e `else`. Elas nos permitem executar blocos de código diferentes dependendo se uma expressão booleana é `True` ou `False`.

**Observações importantes:**
* Apenas o primeiro bloco cuja condição for verdadeira será executado.
* Os blocos `elif` e `else` não são necessários para se utilizar o `if`, mas só podem ser usados após ele.
* O bloco `else` não precisa de condição: ele é usado como “último caso”, sendo executado apenas se todas as condições anteriores (`if` e `elif`) forem falsas.

**Identação em Python**

Para a execução correta das estruturas condicionais, a identação (o espaço no início de uma linha de código) é muito importante. Ela ajuda a definir **blocos de código**.

Quando você usa estruturas de controle, por exemplo, o código que faz parte dessa estrutura é colocado em um novo bloco e deve ser **identado**.

Geralmente usamos 4 espaços ou um tab para cada nível de identação, contudo, não podemos misturar esses dois tipos de representação, devemos escolher um e seguir pelo código inteiro com o mesmo.

Veja o exemplo da estrutura condicional novamente, com a identação destacada:

### `if`
Inicia a estrutura condicional e testa a primeira condição. Se a expressão booleana após o `if` for verdadeira (`True`), o bloco de código indentado abaixo dele será executado.

= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =

*Exemplo 1: Classificação de Planta por Idade*

Vamos usar `if`, `elif` e `else` juntos para classificar uma planta com base na sua idade em semanas, como no exemplo anterior, mas agora com a estrutura separada.

*Exemplo 2: Verificando e Classificando umidade e temperatura*

*Exemplo 3: Verificando determinada sequência em outra*

### `else`
É o bloco padrão, executado apenas se *todas* as condições anteriores (`if` e `elif`s) forem falsas (`False`). O `else` não tem condição associada.

### `elif`
Usado para testar outras condições alternativas caso a condição do `if` (e de quaisquer `elif`s anteriores) seja falsa (`False`). Você pode ter quantos blocos `elif` precisar em sequência.

# **Hora de praticar!**

Você é um pesquisador analisando características morfológicas de plantas (0 = ausente; 1 = presente). Seu objetivo é classificar cada planta em Briófitas, Pteridófitas, Gimnospermas ou Angiospermas usando dicionários, operadores relacionais, lógica booleana e estruturas condicionais para automatizar o processo.

| Planta     | Flores | Frutos | Sementes | Vasos condutores | Raiz verdadeira |
|------------|--------|--------|----------|------------------|-----------------|
| Musgo      |    0   |    0   |     0    |         0        |         0       |
| Samambaia  |    0   |    0   |     0    |         1        |         1       |
| Pinheiro   |    0   |    0   |     1    |         1        |         1       |
| Laranjeira |    1   |    1   |     1    |         1        |         1       |
| Orquidea   |    1   |    1   |     1    |         1        |         1       |

Aqui vão algumas regras para critérios mínimos:
- Briófitas: não possuem vasos, raiz, sementes, flores ou frutos.
- Pteridófitas: possuem vasos e raiz, mas não possuem sementes (logo, também não têm flores nem frutos).
- Gimnospermas: possuem sementes, mas não possuem flores nem frutos.
- Angiospermas: possuem todas as características analisadas.

Tarefas:
1. Com os dados coletados de cada planta, crie um dicionário (caracteristicas).
2. Defina quatro “regras-alvo” (um dicionário para cada grupo filogenético).
3. Usando operadores lógicos, classifique uma planta escolhida.
4. Valide sua conclusão comparando o registro da planta com as regras-alvo (ex.: caracteristicas["Laranjeira"] == angiospermas).

# **Bibliotecas em Python**

Python possui uma vasta coleção de bibliotecas externos que estendem suas funcionalidades, facilitando muito o desenvolvimento e a análise de dados.

## Por que usar biblioteca?

Muitas operações comuns, especialmente em análise de dados e estatística, demandam cálculos complexos e manipulação eficiente de grandes volumes de dados. Ao invés de programar tudo do zero, utilizamos bibliotecas já desenvolvidos e testados pela comunidade. Isso traz várias vantagens:

* Economia de tempo: Funções prontas executam tarefas que seriam demoradas para implementar manualmente.
*  Confiabilidade: Bibliotecas populares passam por testes rigorosos e são amplamente utilizados, reduzindo chances de erros.
* Simplicidade: Usar funções já implementadas deixa o código mais limpo e fácil de entender.
* Eficiência: Bibliotecas como numpy são otimizados para performance, especialmente com grandes volumes de dados.

Algumas bibliotecas são longas ou usadas com frequência no código, como numpy e pandas. Para facilitar a digitação e tornar o código mais legível, é comum importar essas bibliotecas com um apelido utilizando a palavra-chave `as`


In [None]:
import pandas as pd

# **Biblioteca Pandas**

O pandas é uma biblioteca para manipulação e análise de dados tabulares. Através dos **DataFrames**, podemos trabalhar facilmente com conjuntos de dados e realizar análises estatísticas de forma simples e organizada.

### DataFrames
É uma tabela de dados bidimensional (linhas e colunas), que pode ser criada a partir de dicionários, listas, arrays ou arquivos externos.

Exemplo:

| Especie | Altura_cm | Idade_sem | Folhas |
|---------|-----------|-----------|--------|
| Miilho  | 35        | 5         | 10     |
| Trigo   | 120       | 12        | 24     |


### Importando o Pandas

Para utilizar uma biblioteca em Python, precisamos importá-la, ou seja, tornar seus métodos e funções disponíveis no nosso código.


###Criando DataFrames

Podemos criar um DataFrame a partir de um dicionário, associando nomes de colunas a listas de valores:




Para transformar o dicionário em um DataFrame, usamos a função `pd.Dataframe()`.

### **Agora é a sua vez!**

Crie um DataFrame a partir de um dicionário e exiba suas principais informações.

Também podemos criar um dataframe a partir de um arquivo como **csv** ("comma-separated values").
No caso estaremos lendo um arquivo disponível online, mas o caminho pode ser para um arquivo local também

In [None]:
url = "https://raw.githubusercontent.com/mwaskom/seaborn-data/master/iris.csv"


No caso do excel seria um caminho parecido, mas utilizando `pd.read_excel()`.

Para ter uma amostra do conteúdo do DataFrame, podemos usar o método `head()`

Outras funções úteis são:

* `.shape` para número de linhas e colunas
* `.info()` para informações sobre colunas e tipos de dados
* `.describe()` para estatísticas básicas (média, desvio padrão, mínimo, máximo)
* `.columns` para nomes das colunas

### Selecionando dados

Podemos acessar colunas de um DataFrame escrevendo o **nome do DataFrame** seguido do nome da coluna entre colchete.

Também podemos filtrar linhas usando condições:

### Criando novas colunas

É possível criar colunas a partir de cálculos com outras colunas. Cada nova coluna será automaticamente adicionada ao DataFrame.

### Estatísticas básicas

O Pandas oferece várias funções para calcular estatísticas de forma rápida em colunas de um DataFrame.

Média (`.mean()`)

Calcula o valor médio da coluna.

Mediana (`.median()`)

O valor central, menos afetado por valores muito altos ou baixos.

Moda (`.mode()`)

O valor mais frequente.

Mínimo (`.min()`) e Máximo (`.max()`)


Valores extremos da coluna.

Desvio padrão (`.std()`)


Mede o quanto os valores variam em torno da média.

Variância (`.var()`)


Parecido com o desvio padrão, mas elevado ao quadrado.

Contagem (`.count()`)

Quantos valores existem (não nulos).

### Ordenando e filtrando

Para organizar os dados podemos ordenar colunas utilizando `.sort_values()` e passando como parâmetro `by` a coluna de referência para a ordenação dos dados.

Já a filtragem de dados pode ser feita ao comparar uma determinada coluna com o valor desejado e, em seguida, utilizar essa condição dentro de `[]` no DataFrame.

### Tratamento de dados

Na prática, muitas vezes temos dados faltantes.
Vamos criar um exemplo com um dataset de plantas que possui valores ausentes (NaN)

Não se preocupe agora com np.nan, ele está nos auxiliando a atribuir um valor nulo no DataFrame.

Verificar valores ausentes

Podemos utilizar a função `fillna()` para auxiliar a preencher os espaços nulos.

Ou utilizar a função `dropna()` para remover as linhas com pelo menos um valor nulo

Remoção de linhas duplicadas.
Observe que o DataFrame abaixo possui uma linha duplicada

O pandas consegue identificá-las e eliminá-las através da função `drop_duplicates()`

### **🐧 Exercício: Explorando o Pandas com o Conjunto de Dados Palmer Penguins**

O conjunto de dados Penguins contém informações sobre três espécies de pinguins coletadas nas ilhas do arquipélago Palmer, incluindo características físicas como o comprimento e a profundidade do bico, o comprimento da nadadeira e o peso corporal.

URL para o CSV do conjunto de dados:
https://raw.githubusercontent.com/allisonhorst/palmerpenguins/main/inst/extdata/penguins.csv

1. Estamos interessados em saber qual é a massa corporal média dos pinguins de cada espécie.

    **DICA:**
    Utilize o conjunto de dados para calcular a média de body_mass_g agrupando por species e exiba o resultado em uma nova tabela ou com um print organizado no console.

2. Também queremos investigar se existe diferença no comprimento médio do bico (bill_length_mm) entre pinguins machos e fêmeas.

    **DICA:**
    Agrupe os dados por sex e calcule a média dessa variável, exibindo o resultado.

💡 Observação: Antes de iniciar as análises, verifique se há valores ausentes no conjunto de dados e, se necessário, trate-os adequadamente (por exemplo, removendo linhas com dados faltantes ou preenchendo valores).

# **Biblioteca Matplotlib**

A biblioteca `Matplotlib` é a ferramenta mais fundamental e amplamente utilizada para criar gráficos estáticos em Python. Ela oferece um controle incrível sobre cada aspecto de uma figura, desde os eixos e rótulos até cores e legendas. Permitindo criar gráficos com a qualidade exigida para artigos e apresentações.


Primeiro, vamos importar o submódulo `pyplot` da `matplotlib`, A convenção é importá-lo com o apelido `plt`

Vamos analisar o dataset de Iris...

### Gráfico de Linha (`plt.plot`)


##  Gráfico de Dispersão (`plt.scatter`)
Gráficos de dispersão (scatter plots) são ideais para investigar a relação entre duas variáveis numéricas.

## Gráfico de Barras (`plt.bar`)
Gráficos de barras são excelentes para comparar valores entre diferentes categorias.

### **Exercício Prático: Análise Morfológica de Pinguins na Antártida**

Imagine que você é um(a) biólogo(a) pesquisador(a) trabalhando na Antártida. Sua equipe coletou dados valiosos de três espécies de pinguins (_Adelie_, _Chinstrap_ e _Gentoo_) que vivem em três ilhas diferentes no arquipélago Palmer. Medidas corporais, como as dimensões do bico, o comprimento da nadadeira e a massa corporal, são cruciais para entender como essas espécies se adaptaram e se diferenciam.

Sua tarefa é usar a visualização de dados para encontrar padrões que ajudem a diferenciar as espécies e a entender melhor sua morfologia e distribuição:
- 1º: Limpar registros com dados nulos ou inconsistentes;
- 2º: Verifique qual das espécies de pinguins é em média mais pesada que as outras e forneça uma visualização;
- 3º: Compare a distribuição dos comprimentos dos bicos pelas profundidades dos bicos entre espécies;
- 4º: Verifique se há aumento do tamanho da asa conforme o aumento do peso da espécie identificada como mais pesada em 2ª.

O dataset está disponível na url: https://raw.githubusercontent.com/allisonhorst/palmerpenguins/main/inst/extdata/penguins.csv

Configuração e carregamento:

Análise e limpeza:

Removendo linhas com qualquer valor nulo:

Calcular a massa média por espécie: