---
#### Semana de Ciência de Dados com Python/IA - SENAI-DF - Vespertino - 22/07/2024 - Marcelo Pereira Avelino
##### 📝 Nível Zero

![image-2.png](attachment:image-2.png)

---

#### `01` - Importando a Biblioteca Pandas

![image.png](attachment:image.png)


In [9]:
# Importando a biblioteca Pandas

import pandas as pd

#### `02` - Carregar os dados

In [4]:
url = "dataset/aluguel.csv" # Definindo a URL ou caminho do arquivo CSV
pd.read_csv(url) # A função pd.read_csv(url) lê o arquivo CSV no caminho especificado pela variável url. Ela carrega o conteúdo do arquivo em um DataFrame, que é uma estrutura de dados bidimensional do Pandas.

Unnamed: 0,Tipo;Bairro;Quartos;Vagas;Suites;Area;Valor;Condominio;IPTU
0,Quitinete;Copacabana;1;0;0;40;1700;500;60
1,Casa;Jardim Botânico;2;0;1;100;7000;;
2,Conjunto Comercial/Sala;Barra da Tijuca;0;4;0;...
3,Apartamento;Centro;1;0;0;15;800;390;20
4,Apartamento;Higienópolis;1;0;0;48;800;230;
...,...
32955,Quitinete;Centro;0;0;0;27;800;350;25
32956,Apartamento;Jacarepaguá;3;1;2;78;1800;800;40
32957,Apartamento;São Francisco Xavier;2;1;0;48;1400...
32958,Apartamento;Leblon;2;0;0;70;3000;760;


 #### `03` - Visualizar os tipos de dados

 ![image.png](attachment:image.png)

In [11]:
# O comando print(type(url)) exibe o tipo da variável url. Como url foi definida como uma string (texto), o comando irá mostrar <class 'str'>.

print(type(url))

<class 'str'>


In [10]:
# TIPOS DE DADOS MAIS COMUNS

# Tipo str (string) - Usado para texto.
# Serve para armazenar palavras, frases, ou qualquer sequência de caracteres.
nome = "Marcelo"
saudacao = 'Olá, tudo bem?'
print(type(nome))  # Exibe: <class 'str'>
print(nome)  # Exibe: Marcelo
print(saudacao)  # Exibe: Olá, tudo bem?

# Tipo int (inteiro) - Usado para números inteiros, ou seja, sem parte decimal.
# Serve para armazenar valores numéricos inteiros, como contagens, idades, ou qualquer valor que não necessite de parte fracionária.
idade = 30
ano = 2024
print(type(idade))  # Exibe: <class 'int'>
print(idade)  # Exibe: 30
print(ano)  # Exibe: 2024

# Tipo float (real) - usado para números reais com parte decimal.
# Serve para armazenar valores numéricos que necessitam de parte fracionária, como preços, alturas, ou qualquer medida contínua.
preco = 19.99
altura = 1.75
print(type(preco))  # Exibe: <class 'float'>
print(preco)  # Exibe: 19.99
print(altura)  # Exibe: 1.75

<class 'str'>
Marcelo
Olá, tudo bem?
<class 'int'>
30
2024
<class 'float'>
19.99
1.75


`NÃO EXISTEM ACIDENTES - MESTRE OOGWAY`


![image-2.png](attachment:image-2.png)


O personagem Mestre Oogway acredita que tudo está interligado. Na ciência de dados, a análise exploratória com Pandas muitas vezes revela como diferentes variáveis estão interligadas e como elas influenciam umas às outras. Isso nos ajuda a descobrir insights significativos que não são meramente coincidências, mas que têm causas subjacentes.

**Conclusão**: Assim como no mundo de Oogway, onde "não existem acidentes", no mundo da ciência de dados, cada ponto de dados e cada análise realizada tem um propósito e pode revelar insights valiosos. Utilizar bibliotecas como Pandas ajuda os cientistas de dados a explorar, entender e aproveitar ao máximo esses dados, transformando o caos aparente em conhecimento significativo

In [13]:
# Demonstração de como a exploração de dados pode revelar padrões significativos.

import pandas as pd

# Criando um DataFrame de exemplo
data = {
    'Produto': ['A', 'B', 'C', 'D'],
    'Vendas': [100, 150, 200, 50],
    'Satisfacao': [3.5, 4.2, 4.8, 2.9]
}

df = pd.DataFrame(data)

# Explorando os dados
print("Dados Iniciais:\n", df)

# Calculando a média de vendas
media_vendas = df['Vendas'].mean()
print("\nMédia de Vendas:", media_vendas)

# Verificando a correlação entre vendas e satisfação
correlacao = df['Vendas'].corr(df['Satisfacao'])
print("\nCorrelação entre Vendas e Satisfação:", correlacao)

Dados Iniciais:
   Produto  Vendas  Satisfacao
0       A     100         3.5
1       B     150         4.2
2       C     200         4.8
3       D      50         2.9

Média de Vendas: 125.0

Correlação entre Vendas e Satisfação: 0.9995120760870789


#### `04` Fontes de Dados

![image.png](attachment:image.png)

* É nas fontes de dados que temos nossos maiores desafios e entendê-las faz parte do treinamento, para explorar e encontrar anomalias e conseguir limpar os dados para realizar consultas específicas e preparar os dados para a equipe de Machine Learning.
* Entender e trabalhar com diferentes fontes de dados é fundamental para a ciência de dados.
* Essas fontes podem apresentar desafios, como dados faltantes, formatos inconsistentes ou informações redundantes.
* Dentre as fontes de dados mais populares, podemos citar:

    **CSV (Comma Separated Values)**: Arquivo de valores separados por vírgula, onde cada linha representa um registro e cada coluna é separada por uma vírgula. Utilizado para armazenar dados tabulares, como planilhas.
        
    ```py
    import pandas as pd
    url = "caminho/para/arquivo.csv" # Lendo um arquivo CSV
    dados_csv = pd.read_csv(url_csv)
    print(dados_csv.head())  # Exibe as primeiras 5 linhas do DataFrame
    ```

    **XLSX (Planilha Excel Open XML)**: Arquivo de planilha do Microsoft Excel, utilizado para armazenar dados em formato tabular. Muito usado em empresas para relatórios, análises e armazenamento de dados.

    ```py
    url_xlsx = "caminho/para/arquivo.xlsx"
    dados_xlsx = pd.read_excel(url_xlsx)
    print(dados_xlsx.head())
    ```

    **JSON (JavaScript Object Notation):** Formato de texto leve para intercâmbio de dados, fácil de ler e escrever para humanos, e fácil de interpretar e gerar para máquinas. Usado para transmissão de dados entre servidor e cliente na web.

    ```py
    import json

    # Lendo um arquivo JSON
    with open('caminho/para/arquivo.json') as f:
        dados = json.load(f)
    print(dados)
    ```

    **HTML (HyperText Markup Language)**: Linguagem de marcação utilizada para criar páginas web. Estrutura e apresenta conteúdo na web.

    ```py
    from bs4 import BeautifulSoup
    import requests

    # Extraindo dados de uma página HTML
    url = "http://exemplo.com"
    response = requests.get(url)
    soup = BeautifulSoup(response.text, 'html.parser')
    print(soup.title)  # Exibe o título da página
    ```

    **SQL (Structured Query Language)**: Linguagem padrão para gerenciar e manipular bancos de dados relacionais. Usado para realizar consultas e manipular dados em bancos de dados.

    ```py
    import sqlite3

    # Conectando ao banco de dados SQLite
    conn = sqlite3.connect('caminho/para/banco_de_dados.db')
    cursor = conn.cursor()

    # Executando uma consulta SQL
    cursor.execute("SELECT * FROM tabela")
    dados = cursor.fetchall()
    print(dados)
    ```
---

#### `05` Equipe de ML-Web Django

![kung-fu-panda-4.jpg](attachment:kung-fu-panda-4.jpg)

#### Definições Simples e Práticas para Data Science

* O que é CSS? CSS É uma linguagem usada para descrever a aparência e formatação de um documento escrito em HTML. Ele controla o layout visual da página.

* O que é Framework? É estrutura de software que fornece suporte e ferramentas para desenvolver aplicativos de maneira mais eficiente. Ele inclui bibliotecas, ferramentas e convenções.
* O que é Django? É um framework web de alto nível para a linguagem Python que permite o desenvolvimento rápido e clean de aplicativos web.
* O que é Machine Learning? É uma subárea da inteligência artificial que envolve a criação de algoritmos que permitem que as máquinas aprendam a partir de dados e façam previsões ou decisões.
* O que é Data Science? É o campo que combina estatísticas, programação e conhecimento de domínio para extrair insights e conhecimento a partir de dados.
* É possível prever o futuro? Em data science, podemos fazer previsões baseadas em dados históricos usando modelos estatísticos e de machine learning, mas essas previsões são probabilísticas e não certezas.
* Resolvendo os desafios das minhas tarefas de DC, ajudará a equipe de ML-Django? Sim, resolver desafios em data science (DC) ajuda a criar modelos e insights que podem ser integrados em aplicações web utilizando frameworks como Django, potencializando soluções em machine learning (ML) e melhorando a eficiência da equipe.


In [5]:
# Lendo o arquivo CSV usando a função pd.read_csv
# 'pd.read_csv' é uma função da biblioteca pandas que lê arquivos CSV.
# 'sep=";"' indica que os dados no arquivo CSV estão separados por ponto e vírgula (;).

pd.read_csv(url,sep=";")


Unnamed: 0,Tipo,Bairro,Quartos,Vagas,Suites,Area,Valor,Condominio,IPTU
0,Quitinete,Copacabana,1,0,0,40,1700.0,500.0,60.0
1,Casa,Jardim Botânico,2,0,1,100,7000.0,,
2,Conjunto Comercial/Sala,Barra da Tijuca,0,4,0,150,5200.0,4020.0,1111.0
3,Apartamento,Centro,1,0,0,15,800.0,390.0,20.0
4,Apartamento,Higienópolis,1,0,0,48,800.0,230.0,
...,...,...,...,...,...,...,...,...,...
32955,Quitinete,Centro,0,0,0,27,800.0,350.0,25.0
32956,Apartamento,Jacarepaguá,3,1,2,78,1800.0,800.0,40.0
32957,Apartamento,São Francisco Xavier,2,1,0,48,1400.0,509.0,37.0
32958,Apartamento,Leblon,2,0,0,70,3000.0,760.0,


### Resumo do Livro: "O cientista de dados e os seus demônios" por Heverton Anunciação

**Quais engenheiros de softwares são esses?**
- O livro explora o perfil dos engenheiros de software que se especializam em ciência de dados. Eles são profissionais com uma sólida base em programação, matemática e estatística, capazes de desenvolver algoritmos complexos e trabalhar com grandes volumes de dados.

**De onde vêm esses cientistas de dados?**
- Heverton Anunciação aborda as diversas origens dos cientistas de dados, que podem vir de diferentes áreas como engenharia, matemática, estatística, física e até ciências sociais. O importante é a habilidade de analisar e interpretar dados, independentemente do background acadêmico.

**Como eles vivem?**
- O livro descreve o estilo de vida dos cientistas de dados, destacando o ambiente de trabalho dinâmico e colaborativo em empresas de tecnologia, startups e grandes corporações. Eles estão sempre aprendendo novas técnicas e ferramentas para se manterem atualizados no campo em rápida evolução.

**O que eles comem?**
- De maneira metafórica, a pergunta se refere ao tipo de conhecimento e habilidades que os cientistas de dados "consomem". Eles se alimentam de dados, estatísticas, algoritmos e novas tecnologias. Além disso, eles participam de conferências, workshops e cursos para continuar crescendo profissionalmente.

**Como se reproduzem?**
- Novamente, de forma figurativa, o livro trata de como novos cientistas de dados são formados. Através de programas de educação formal como graduações e pós-graduações, bem como bootcamps e cursos online. Além disso, a mentoria e a colaboração com colegas mais experientes são cruciais para o desenvolvimento de novos talentos na área.

- Heverton Anunciação, com um tom leve e informativo, desmistifica a vida e o trabalho dos cientistas de dados, destacando suas habilidades, origens diversas e a constante busca por conhecimento.

![maxresdefault.jpg](attachment:maxresdefault.jpg)

#### `06` Valorização dos Dados

`A frase "Para fazer algo especial, você só precisa acreditar que é especial`

**A pode ser aplicada à ciência de dados e ao uso de Python de várias maneiras, destacando a importância da crença no potencial dos dados e nas ferramentas que utilizamos para analisá-los.`**


**1. Valorização dos Dados**
Acreditar que os dados possuem valor é o primeiro passo para transformar informações brutas em insights significativos. Cientistas de dados que acreditam no potencial de seus dados estão mais propensos a explorar e descobrir padrões ocultos que podem ser cruciais para o negócio.

**2. Confiança nas Ferramentas**
Confiar nas ferramentas que você está usando, como as bibliotecas Pandas, NumPy, Matplotlib, etc., permite que você explore todo o potencial delas. Acreditar que essas ferramentas podem ajudá-lo a fazer algo especial com os dados é fundamental para obter resultados eficazes.

**3. Processo de Descoberta**
O processo de análise de dados pode ser desafiador e tedioso, mas acreditar que esse trabalho pode levar a descobertas importantes faz toda a diferença. Cada etapa, desde a limpeza dos dados até a modelagem, é essencial para chegar a resultados valiosos.

**4. Transformação dos Dados**
Os dados brutos podem parecer comuns, mas quando analisados e transformados corretamente, podem se tornar informações poderosas. Acreditar no potencial de transformação dos dados é essencial para qualquer cientista de dados.

**5. Inovação e Criatividade**
Acreditar que você pode fazer algo especial com os dados incentiva a inovação e a criatividade. Isso leva a novas abordagens e soluções que podem revolucionar a maneira como os dados são utilizados.

`A frase "Não existe ingrediente secreto. É você mesmo!" dita pelo Mestre Oogway no filme "Kung Fu Panda" pode ser interpretada na ciência de dados e no uso de Python de várias maneiras, destacando a importância da habilidade e dedicação do cientista de dados em vez de depender apenas das ferramentas ou técnicas.`

**1. Habilidade do Cientista de Dados**
A frase enfatiza que a verdadeira força ou valor não está nas ferramentas ou nos dados em si, mas na habilidade, conhecimento e intuição do cientista de dados. A interpretação, a análise e a aplicação prática são onde reside o "ingrediente secreto".

**2. Ferramentas como Extensões**
Ferramentas como Pandas, NumPy, e Matplotlib são poderosas, mas elas são apenas ferramentas. O verdadeiro diferencial é como o cientista de dados as utiliza. A eficácia de uma análise não depende apenas da ferramenta, mas de como ela é aplicada.

**3. Criatividade e Intuição**
A capacidade de olhar para os dados de maneira diferente, encontrar padrões inesperados, fazer perguntas relevantes e ter insights inovadores é o que realmente faz a diferença. A intuição e a criatividade são essenciais para extrair valor dos dados.

**4. Aprendizado e Crescimento Contínuo**
Assim como Po no filme, cientistas de dados devem continuar aprendendo e crescendo. A curiosidade e a vontade de aprender são cruciais para se adaptar às novas ferramentas e técnicas que surgem constantemente no campo da ciência de dados.

#### Importância das Bibliotecas Pandas e NumPy na Ciência de Dados

* `Amilcar Netto` enfatiza que a biblioteca Pandas é uma abstração de outra biblioteca fundamental chamada NumPy. Essa afirmação é crucial para entender a eficiência e a funcionalidade que o Pandas traz para a ciência de dados.

**Pandas:**

- O que é?: Uma biblioteca de código aberto para análise de dados em Python.
- Para que serve?: Facilita a manipulação e análise de dados estruturados. Fornece estruturas de dados rápidas, flexíveis e expressivas, como DataFrames.
- Como faz?: Utiliza NumPy como base para operações eficientes e rápidas em arrays multidimensionais.


**NumPy:**

- O que é?: Uma biblioteca fundamental para computação científica em Python.
- Para que serve?: Fornece suporte para arrays multidimensionais e funções matemáticas de alto desempenho.
- Como faz?: Implementa operações em arrays de maneira eficiente, sendo a base para outras bibliotecas como Pandas.


* `Heverton Anunciação` realça que 70% do tempo do cientista de dados é gasto em limpeza e preparação de dados. Esse processo é essencial para garantir a qualidade e a integridade dos dados antes da análise.

- O que é?: Limpeza e preparação de dados envolvem tratar valores ausentes, corrigir inconsistências e transformar os dados em um formato adequado para análise.
- Para que serve?: Garantir que os dados sejam precisos, completos e consistentes. Facilita a análise e a construção de modelos preditivos precisos.
- Como faz?: Utilizando ferramentas e técnicas específicas para identificar e corrigir problemas nos dados.

**Conclusão:**

- Pandas e NumPy: Trabalham juntos para fornecer uma base poderosa para manipulação e análise de dados. Entender a integração dessas bibliotecas é crucial para qualquer cientista de dados.
- Limpeza e Preparação de Dados: São etapas essenciais que consomem a maior parte do tempo do cientista de dados. Realizar essas etapas de forma eficaz é fundamental para obter resultados precisos e confiáveis.

In [15]:
# Exemplo de Uso Integrado

import numpy as np
import pandas as pd

# Criando um array NumPy
array_numpy = np.array([1, 2, 3, 4, 5])

# Criando um DataFrame Pandas usando o array NumPy
df_pandas = pd.DataFrame(array_numpy, columns=['Numeros'])

print("Array NumPy:")
print(array_numpy)

print("\nDataFrame Pandas:")
print(df_pandas)


Array NumPy:
[1 2 3 4 5]

DataFrame Pandas:
   Numeros
0        1
1        2
2        3
3        4
4        5


In [16]:
# Exemplo de Limpeza e Preparação de Dados
# Criando um DataFrame com dados faltantes e inconsistentes

dados = {
    'Nome': ['Ana', 'Bruno', 'Carlos', np.nan, 'Eduardo'],
    'Idade': [25, np.nan, 30, 22, np.nan],
    'Cidade': ['SP', 'RJ', np.nan, 'MG', 'SP']
}
df = pd.DataFrame(dados)

print("Dados Originais:")
print(df)

# Preenchendo valores ausentes na coluna 'Idade' com a média das idades
df['Idade'].fillna(df['Idade'].mean(), inplace=True)

# Removendo linhas onde 'Nome' ou 'Cidade' estão ausentes
df.dropna(subset=['Nome', 'Cidade'], inplace=True)

print("\nDados Após Limpeza:")
print(df)

Dados Originais:
      Nome  Idade Cidade
0      Ana   25.0     SP
1    Bruno    NaN     RJ
2   Carlos   30.0    NaN
3      NaN   22.0     MG
4  Eduardo    NaN     SP

Dados Após Limpeza:
      Nome      Idade Cidade
0      Ana  25.000000     SP
1    Bruno  25.666667     RJ
4  Eduardo  25.666667     SP


The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  df['Idade'].fillna(df['Idade'].mean(), inplace=True)


##### 📝 Nível 1

![image.png](attachment:image.png)

#### `Exercício 1`

* Mostre o cabeçalho do dataset

In [17]:
# primeiro crie uma variável df que representa dataframe
df = pd.read_csv("dataset/aluguel.csv",sep=";")

# mostre o dataframe com seus primeiros cinco registros (cabeçalho)
df.head()

Unnamed: 0,Tipo,Bairro,Quartos,Vagas,Suites,Area,Valor,Condominio,IPTU
0,Quitinete,Copacabana,1,0,0,40,1700.0,500.0,60.0
1,Casa,Jardim Botânico,2,0,1,100,7000.0,,
2,Conjunto Comercial/Sala,Barra da Tijuca,0,4,0,150,5200.0,4020.0,1111.0
3,Apartamento,Centro,1,0,0,15,800.0,390.0,20.0
4,Apartamento,Higienópolis,1,0,0,48,800.0,230.0,


**"Sabedoria e intuições digitais são ferramentas de abstração importante para um cientista de dados"**

Rômulo C. Silvestre

#### `NumPy`

![Tigress.webp](attachment:Tigress.webp)

Dados são produzidos a todo momento, sejam eles coletados ou gerados, por quase todos os eventos e nos mais diversos formatos.

#### A Ciência de Dados e Suas Áreas de Interseção
- A ciência de dados é uma disciplina multifacetada que combina conhecimentos de diversas áreas para extrair informações valiosas a partir de dados. Abaixo estão as principais áreas que se juntam para formar a base da ciência de dados:

**Análise de Dados:**

- O que é?: É o processo de inspecionar, limpar e modelar dados com o objetivo de descobrir informações úteis, informar conclusões e apoiar a tomada de decisões.
- Para que serve?: Ajuda a entender padrões, tendências e insights a partir dos dados, facilitando a tomada de decisões informadas.
- Como faz?: Utiliza ferramentas e técnicas estatísticas e computacionais para analisar dados.

**Administrador de Banco de Dados (DBA):**

- O que é?: Um profissional responsável por gerenciar e manter os sistemas de banco de dados, garantindo que os dados estejam seguros, disponíveis e bem organizados.
- Para que serve?: Assegura que os dados sejam armazenados de maneira eficiente e segura, e que possam ser acessados rapidamente quando necessário.
- Como faz?: Utiliza sistemas de gerenciamento de banco de dados (DBMS) e implementa políticas de segurança e backup.

**Matemática:**
- O que é?: A ciência dos números, quantidades e formas, e as relações entre eles.
- Para que serve?: Fornece a base teórica e as ferramentas para modelagem e resolução de problemas.
- Como faz?: Utiliza conceitos de álgebra, cálculo, geometria, e outras áreas da matemática para desenvolver modelos e analisar dados.

**Estatística:**
- O que é?: A ciência que lida com a coleta, análise, interpretação e apresentação de dados.
- Para que serve?: Ajuda a fazer inferências sobre populações a partir de amostras, e a validar os resultados da análise de dados.
- Como faz?: Utiliza técnicas como a regressão, testes de hipóteses, análise de variância, entre outras.

**Ciência da Computação:**
- O que é?: O estudo dos princípios e uso de computadores.
- Para que serve?: Fornece as ferramentas e técnicas para o processamento de grandes volumes de dados, e para o desenvolvimento de algoritmos e software.
- Como faz?: Utiliza linguagens de programação, estruturas de dados, algoritmos, e outros conceitos para desenvolver soluções computacionais.


#### Como Essas Áreas se Integram na Ciência de Dados
- A ciência de dados utiliza conhecimentos de todas essas áreas para transformar dados brutos em insights valiosos:
    - Coleta de Dados: Administradores de banco de dados configuram e mantêm sistemas para armazenar dados.
    - Limpeza e Preparação de Dados: Utiliza técnicas de análise de dados e estatística para garantir que os dados sejam precisos e completos.
    - Modelagem e Análise: Matemática e estatística fornecem as bases teóricas para modelagem de dados, enquanto a ciência da computação implementa esses modelos.
    - Interpretação e Comunicação: Análise de dados ajuda a interpretar os resultados e comunicar os insights de forma clara e eficaz.

NumPy é uma biblioteca que facilita a realização de cáculos cientificos, e também, a manipulação de dados.

Ela fornece:
- Recursos para análise numérica
- Álgebra linear
- Cálculos matriciais
- Entre outras funcionalidades.
- Permite abstrair diversos procedimentos matemáticos complexos.

In [13]:
import numpy as np

# Lista de valores de vendas de imóveis (em milhares de reais)
vendas_imoveis = [350, 450, 500, 600, 700]
print(type(vendas_imoveis))


# Calculando a média de vendas usando NumPy
media_vendas = np.mean(vendas_imoveis)

print(f'A média de vendas de imóveis é: {media_vendas} mil reais')

<class 'list'>
A média de vendas de imóveis é: 520.0 mil reais


In [None]:
# Exemplo de Integração na Prática

import pandas as pd
import numpy as np
from scipy import stats

# Coleta de dados: dados fictícios de um banco de dados
data = {
    'Nome': ['Ana', 'Bruno', 'Carlos', 'Daniela', 'Eduardo'],
    'Idade': [23, 35, 45, 32, 25],
    'Salário': [5000, 7000, 12000, 8000, 4500]
}

# Criação de um DataFrame
df = pd.DataFrame(data)

# Análise descritiva básica (Estatística)
media_idade = df['Idade'].mean()
mediana_salario = df['Salário'].median()
moda_idade = stats.mode(df['Idade'])[0][0]

# Resultados
print(f"Média de Idade: {media_idade}")
print(f"Mediana de Salário: {mediana_salario}")
print(f"Moda de Idade: {moda_idade}")

# Visualização de Dados (Ciência da Computação)
import matplotlib.pyplot as plt

plt.figure(figsize=(10, 5))
plt.bar(df['Nome'], df['Salário'])
plt.xlabel('Nome')
plt.ylabel('Salário')
plt.title('Salário por Pessoa')
plt.show()

#### `Scikit-Learn`

![KFP3-promo-crane1.webp](attachment:KFP3-promo-crane1.webp)

### Biblioteca Scikit-Learn para Machine Learning

A biblioteca Scikit-Learn é amplamente utilizada no mercado de Machine Learning por várias razões:

**O que é Scikit-Learn?**
- Scikit-Learn é uma biblioteca em Python que fornece ferramentas simples e eficientes para análise de dados e modelagem preditiva. É muito popular entre cientistas de dados e engenheiros de Machine Learning.

**Por que é o padrão de fato no mercado?**
- **Ampla Gama de Algoritmos**: Scikit-Learn implementa uma grande variedade de algoritmos de Machine Learning, como regressão, classificação, clustering e redução de dimensionalidade. Isso cobre a maioria das necessidades dos projetos de Machine Learning.
- **Facilidade de Uso**: A biblioteca é projetada para ser fácil de usar, com uma API consistente e bem documentada, facilitando a aplicação de algoritmos complexos mesmo para iniciantes.
- **Comunidade e Suporte**: Scikit-Learn tem uma comunidade ativa que contribui para seu desenvolvimento e suporte, tornando fácil encontrar ajuda e recursos online.

**Como a Scikit-Learn poupa tempo e evita erros?**
- **Implementações Otimizadas**: Os algoritmos já estão otimizados e testados, o que significa que os cientistas de dados não precisam se preocupar em implementar e otimizar esses algoritmos manualmente.
- **Consistência**: Usar uma biblioteca padronizada garante que o código seja mais fácil de ler, manter e compartilhar com outros profissionais.
- **Documentação e Exemplos**: Scikit-Learn vem com extensa documentação e muitos exemplos, o que acelera o aprendizado e a aplicação dos algoritmos.

**Exemplo de Uso**

```python
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score

# Carregando o conjunto de dados
data = load_iris()
X = data.data
y = data.target

# Dividindo os dados em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Criando e treinando o modelo
model = RandomForestClassifier()
model.fit(X_train, y_train)

# Fazendo previsões
y_pred = model.predict(X_test)

# Avaliando o modelo
accuracy = accuracy_score(y_test, y_pred)
print(f"Acurácia: {accuracy:.2f}")

### O Trabalho da Equipe de Machine Learning

A equipe de Machine Learning realiza várias etapas para construir modelos preditivos eficazes. Aqui está um resumo dessas etapas:

1. **Escolhendo o Melhor Algoritmo para Prever o Futuro**
   - **O que é?**: Selecionar o algoritmo de Machine Learning mais adequado para a tarefa em questão, como regressão, classificação, ou clustering.
   - **Para que serve?**: Diferentes algoritmos têm diferentes forças e fraquezas. Escolher o certo ajuda a obter melhores previsões.
   - **Como fazer?**: Testar vários algoritmos e comparar seu desempenho.

2. **O Tipo de Aprendizado (Supervisionado e Não Supervisionado)**
   - **Supervisionado**: Usa dados rotulados para treinar o modelo. Exemplo: classificação de emails como spam ou não spam.
   - **Não Supervisionado**: Usa dados não rotulados para encontrar padrões. Exemplo: clustering de clientes com base em comportamento de compra.

3. **Separação 70/30 (Aprender/Avaliar)**
   - **O que é?**: Dividir o conjunto de dados em duas partes: 70% para treinamento e 30% para avaliação.
   - **Para que serve?**: Garantir que o modelo seja capaz de generalizar bem para dados não vistos.
   - **Como fazer?**: Usar funções como `train_test_split` da biblioteca Scikit-Learn.

4. **Coloca para Treinar**
   - **O que é?**: Usar os dados de treinamento para ajustar o modelo.
   - **Para que serve?**: Ensinar o modelo a reconhecer padrões nos dados.
   - **Como fazer?**: Usar a função `fit` de um modelo Scikit-Learn.

5. **Avalia os Resultados e o Modelo**
   - **O que é?**: Medir o desempenho do modelo usando métricas como acurácia, precisão, recall, etc.
   - **Para que serve?**: Verificar se o modelo está funcionando bem.
   - **Como fazer?**: Usar funções de avaliação como `accuracy_score` da biblioteca Scikit-Learn.

6. **Realiza Otimizações no Modelo**
   - **O que é?**: Ajustar hiperparâmetros e melhorar a performance do modelo.
   - **Para que serve?**: Aumentar a precisão e a eficiência do modelo.
   - **Como fazer?**: Usar técnicas como validação cruzada e busca em grade (`GridSearchCV`).

### Exemplo de Uso

```python
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score

# Carregando o conjunto de dados
data = load_iris()
X = data.data
y = data.target

# Dividindo os dados em treino (70%) e teste (30%)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Escolhendo o algoritmo (Random Forest)
model = RandomForestClassifier()

# Colocando para treinar
model.fit(X_train, y_train)

# Fazendo previsões
y_pred = model.predict(X_test)

# Avaliando os resultados
accuracy = accuracy_score(y_test, y_pred)
print(f"Acurácia inicial: {accuracy:.2f}")

# Realizando otimizações (busca em grade)
param_grid = {'n_estimators': [50, 100, 200], 'max_depth': [None, 10, 20, 30]}
grid_search = GridSearchCV(model, param_grid, cv=5)
grid_search.fit(X_train, y_train)

# Avaliando o modelo otimizado
best_model = grid_search.best_estimator()
y_pred_optimized = best_model.predict(X_test)
accuracy_optimized = accuracy_score(y_test, y_pred_optimized)
print(f"Acurácia otimizada: {accuracy_optimized:.2f}")

#### `Matplolib`

![png-clipart-po-crane-monkey-tigress-mantis-kung-fu-panda-technic-kung-fu-thumbnail.png](attachment:png-clipart-po-crane-monkey-tigress-mantis-kung-fu-panda-technic-kung-fu-thumbnail.png)

### Matplotlib - Biblioteca para Gerar Gráficos

O **Matplotlib** é uma biblioteca em Python que usamos para criar diferentes tipos de gráficos. Ela é muito útil quando queremos visualizar nossos dados de maneira fácil e clara. Aqui estão alguns tipos de gráficos que podemos criar com Matplotlib:

1. **Gráfico de Pizza**
   - **O que é?**: Um gráfico que mostra as partes de um todo, como fatias de uma pizza.
   - **Para que serve?**: Mostrar a proporção de diferentes categorias em um conjunto de dados.
   - **Exemplo**:
     ```python
     import matplotlib.pyplot as plt

     labels = ['Maçã', 'Banana', 'Laranja', 'Uva']
     sizes = [20, 30, 25, 25]
     plt.pie(sizes, labels=labels, autopct='%1.1f%%')
     plt.title('Distribuição de Frutas')
     plt.show()
     ```

2. **Histograma**
   - **O que é?**: Um gráfico de barras que mostra a distribuição de dados em intervalos.
   - **Para que serve?**: Ver como os dados estão distribuídos em diferentes intervalos.
   - **Exemplo**:
     ```python
     import matplotlib.pyplot as plt

     data = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4]
     plt.hist(data, bins=4, edgecolor='black')
     plt.title('Histograma')
     plt.xlabel('Valores')
     plt.ylabel('Frequência')
     plt.show()
     ```

3. **Gráfico de Barras**
   - **O que é?**: Um gráfico que usa barras para mostrar a quantidade de diferentes categorias.
   - **Para que serve?**: Comparar quantidades entre diferentes categorias.
   - **Exemplo**:
     ```python
     import matplotlib.pyplot as plt

     categorias = ['A', 'B', 'C', 'D']
     valores = [5, 7, 2, 4]
     plt.bar(categorias, valores, color=['red', 'blue', 'green', 'purple'])
     plt.title('Gráfico de Barras')
     plt.xlabel('Categorias')
     plt.ylabel('Valores')
     plt.show()
     ```

4. **Gráfico de Linhas**
   - **O que é?**: Um gráfico que usa linhas para conectar pontos de dados.
   - **Para que serve?**: Mostrar a mudança de valores ao longo do tempo ou outra sequência.
   - **Exemplo**:
     ```python
     import matplotlib.pyplot as plt

     x = [1, 2, 3, 4, 5]
     y = [2, 3, 5, 7, 11]
     plt.plot(x, y, marker='o')
     plt.title('Gráfico de Linhas')
     plt.xlabel('X')
     plt.ylabel('Y')
     plt.show()
     ```

5. **Gráfico de Dispersão**
   - **O que é?**: Um gráfico que usa pontos para representar valores individuais.
   - **Para que serve?**: Mostrar a relação entre duas variáveis.
   - **Exemplo**:
     ```python
     import matplotlib.pyplot as plt

     x = [1, 2, 3, 4, 5]
     y = [2, 4, 1, 3, 5]
     plt.scatter(x, y, color='red')
     plt.title('Gráfico de Dispersão')
     plt.xlabel('X')
     plt.ylabel('Y')
     plt.show()
     ```

Com o **Matplotlib**, você pode criar todos esses tipos de gráficos e muito mais para visualizar seus dados de maneira interessante e informativa!

#### `Linguagem Python`

![viper.webp](attachment:viper.webp)

### Linguagem Python - Multiparadigma e Versátil

A linguagem **Python** é uma linguagem multiparadigma aplicada em diversas áreas, desde **programação IoT**, **Android**, **Web**, **Ciência de Dados**, **Inteligência Artificial** até **nanotecnologia**. 

Nela você pode aplicar os paradigmas:

1. **Orientado a Objetos**
   - **Definição**: Organiza o código em torno de objetos que têm atributos e métodos.
   - **Exemplo**:
     ```python
     class Carro:
         def __init__(self, marca, modelo):
             self.marca = marca
             self.modelo = modelo

         def exibir(self):
             print(f"Carro: {self.marca} {self.modelo}")

     meu_carro = Carro("Toyota", "Corolla")
     meu_carro.exibir()
     ```

2. **Funcional**
   - **Definição**: Foca em funções puras e imutabilidade, evitando estados mutáveis.
   - **Exemplo**:
     ```python
     def soma(a, b):
         return a + b

     resultado = soma(5, 3)
     print(resultado)
     ```

3. **Estruturado**
   - **Definição**: Organiza o código com controle de fluxo estruturado (loops, condicionais).
   - **Exemplo**:
     ```python
     for i in range(5):
         if i % 2 == 0:
             print(f"{i} é par")
         else:
             print(f"{i} é ímpar")
     ```

4. **Células de Notebook**
   - **Definição**: Permite programar utilizando células de notebook, como estamos fazendo agora.
   - **Exemplo**:
     ```python
     # Essa é uma célula de notebook
     print("Olá, mundo!")
     ```

### Cinco Características Interessantes no Python

1. **Multiplataforma**
   - **Definição**: Funciona em diferentes sistemas operacionais (Windows, macOS, Linux).
   - **Exemplo**:
     ```python
     import platform
     print(platform.system())  # Exibe o sistema operacional em uso
     ```

2. **Usos Diversos**
   - **Definição**: Pode ser usado para web, ciência de dados, automação, jogos, entre outros.
   - **Exemplo**:
     ```python
     # Automatizando uma tarefa simples
     import os
     os.system('echo "Automação com Python"')
     ```

3. **Indentação**
   - **Definição**: Usa indentação para definir blocos de código, tornando-o mais legível.
   - **Exemplo**:
     ```python
     for i in range(5):
         if i % 2 == 0:
             print(f"{i} é par")
         else:
             print(f"{i} é ímpar")
     ```

4. **Tipagem Dinâmica**
   - **Definição**: As variáveis não precisam ter um tipo específico declarado e podem mudar de tipo.
   - **Exemplo**:
     ```python
     variavel = 10
     print(type(variavel))  # Exibe: <class 'int'>
     variavel = "dez"
     print(type(variavel))  # Exibe: <class 'str'>
     ```

5. **Vasta Quantidade de Bibliotecas**
   - **Definição**: Possui uma grande variedade de bibliotecas que facilitam o desenvolvimento em diversas áreas.
   - **Exemplo**:
     ```python
     import numpy as np
     array = np.array([1, 2, 3, 4, 5])
     print(array)
     ```

### Exercício - Tipos de Comentários em Python

In [19]:
# Este comentário é de uma linha



In [20]:
"""
    Múltiplas linhas
    
"""
imovel = "lindo em Copacana" 
imovel


'lindo em Copacana'

# Exercício


In [21]:
x = input("Digite um número")
y = input("Digite outro número")
soma = x+y

soma
# O resultado será os numeros digitados concatenados e não somados, pois as variaveis geraram valores do tipo string, após o input.

'55'

In [22]:
x = int(input("Digite um número"))
y = int(input("Digite outro número"))
soma = x+y

soma
# O resultado será a soma dos numeros, pois os valores foram convertidos de str para int

10

In [19]:
# Leia o nome do usuário e mostre o valor lido:

nome = input("Qual o seu nome")
nome

'Marcelo'

# Exercício - Leia a idade do cliente da nossa imobiliária

In [22]:
idade = int(input("Digite sua idade: "))
print("Sua idade é", idade)

Sua idade é 18


### Tipagem

Arquivo de Exemplo: Tipos de Dados em Python

Este arquivo demonstra os principais tipos de dados em Python e como utilizá-los.

1. Tipos Numéricos:
   - int: Números inteiros
   - float: Números de ponto flutuante

2. Tipo Booleano:
   - bool: Valores booleanos (True ou False)

3. Tipo String:
   - str: Sequências de caracteres

4. Tipo Nulo:
   - None: Representa a ausência de valor

5. Operadores 'is' e 'is not':
   - Utilizados para verificar identidade de objetos, especialmente úteis com None.

6. Função type():
   - Utilizada para obter o tipo de um objeto.

In [None]:
# Exemplo de uso de números inteiros
a = 10
b = -5
print(type(a))  # Saída: <class 'int'>
print(type(b))  # Saída: <class 'int'>

In [None]:
# Exemplo de uso de números de ponto flutuante
c = 10.5
d = -2.3
print(type(c))  # Saída: <class 'float'>
print(type(d))  # Saída: <class 'float'>

In [None]:
# Exemplo de uso de valores booleanos
e = True
f = False
print(type(e))  # Saída: <class 'bool'>
print(type(f))  # Saída: <class 'bool'>

In [None]:
# Exemplo de uso de strings
g = "Olá, Mundo!"
h = 'Python é incrível!'
print(type(g))  # Saída: <class 'str'>
print(type(h))  # Saída: <class 'str'>

In [None]:
# Exemplo de uso do tipo None
i = None
print(type(i))  # Saída: <class 'NoneType'>

In [None]:
# Exemplo de uso dos operadores 'is' e 'is not'
j = None
k = 10
print(j is None)       # Saída: True
print(k is not None)   # Saída: True

In [None]:
# Exemplo de uso da função type()
l = 20
m = 15.6
n = "Python"
print(type(l))  # Saída: <class 'int'>
print(type(m))  # Saída: <class 'float'>
print(type(n))  # Saída: <class 'str'>

#### `Scipy`

![495px-MantisKFP2.webp](attachment:495px-MantisKFP2.webp)

# O que é SciPy?

## Biblioteca de Ferramentas Científicas

SciPy é uma biblioteca de ferramentas científicas que fornece muitas funções que lidam com:

- **Álgebra Linear**: Operações como inversão de matrizes, decomposição de valores singulares, etc.
- **Otimização**: Encontrar mínimos e máximos de funções.
- **Integração**: Cálculo de integrais de funções matemáticas.
- **Interpolação**: Estimar valores intermediários em um conjunto de dados.
- **Equações Diferenciais**: Resolução de equações diferenciais ordinárias e parciais.
- **Outras Tarefas Científicas e de Engenharia**: Muitas outras ferramentas úteis para a ciência e a engenharia.

## Baseado em NumPy

SciPy é construído sobre a biblioteca NumPy e fornece muitas funções que operam em arrays NumPy. Isso facilita a manipulação de grandes conjuntos de dados numéricos. NumPy é uma biblioteca fundamental para a computação científica em Python, e SciPy expande suas capacidades.

### Exemplos Simples com SciPy

```python
import numpy as np
from scipy import linalg, optimize

# Exemplo de Álgebra Linear
# Criação de uma matriz
A = np.array([[3, 2], [4, 1]])
# Cálculo da inversa da matriz
A_inv = linalg.inv(A)
print("Inversa da Matriz A:")
print(A_inv)

# Exemplo de Otimização
# Definição de uma função quadrática simples
def func(x):
    return x**2 + 5*np.sin(x)

# Encontrar o mínimo da função
result = optimize.minimize(func, x0=0)  # x0 é o ponto inicial
print("Mínimo da função:")
print(result.x)

# Vamos voltar para o nosso estágio

#### Exercício - Mostre 23 registros no cabeçalho

Responda?

**Gabarito**

In [51]:
df.head(23)

Unnamed: 0,Tipo,Bairro,Quartos,Vagas,Suites,Area,Valor,Condominio,IPTU
0,Quitinete,Copacabana,1,0,0,40,1700.0,500.0,60.0
1,Casa,Jardim Botânico,2,0,1,100,7000.0,,
2,Conjunto Comercial/Sala,Barra da Tijuca,0,4,0,150,5200.0,4020.0,1111.0
3,Apartamento,Centro,1,0,0,15,800.0,390.0,20.0
4,Apartamento,Higienópolis,1,0,0,48,800.0,230.0,
5,Apartamento,Vista Alegre,3,1,0,70,1200.0,,
6,Apartamento,Cachambi,2,0,0,50,1300.0,301.0,17.0
7,Casa de Condomínio,Barra da Tijuca,5,4,5,750,22000.0,,
8,Casa de Condomínio,Ramos,2,2,0,65,1000.0,,
9,Conjunto Comercial/Sala,Centro,0,3,0,695,35000.0,19193.0,3030.0


Exercício - Mostre o final do DataFrame

In [52]:
# Gabarito
df.tail()

Unnamed: 0,Tipo,Bairro,Quartos,Vagas,Suites,Area,Valor,Condominio,IPTU
32955,Quitinete,Centro,0,0,0,27,800.0,350.0,25.0
32956,Apartamento,Jacarepaguá,3,1,2,78,1800.0,800.0,40.0
32957,Apartamento,São Francisco Xavier,2,1,0,48,1400.0,509.0,37.0
32958,Apartamento,Leblon,2,0,0,70,3000.0,760.0,
32959,Conjunto Comercial/Sala,Centro,0,0,0,250,6500.0,4206.0,1109.0


Exercício - Qual a diferença entre Series e DataFrames?

Gabarito:

Series é um objeto array unidimensional
Dataframe é uma matriz bidimensional rotulada, ou seja, para a qual podem ser atribuídos rótulos (nomes)  aos seus atributos (colunas) e indices númericos às suas linhas.


Exercício - Considere uma lista de anos de lançamento de um imóvel. Insira os valores em Series


In [53]:
# Gabarito

lancamentos = pd.Series([2024,2025,2026,2027])
lancamentos

0    2024
1    2025
2    2026
3    2027
dtype: int64

**Gabarito - tupla**

In [54]:
lancamentos = pd.Series((2024,2025,2026,2027))
lancamentos

0    2024
1    2025
2    2026
3    2027
dtype: int64

#### Exercício - Crie series com dicionário

In [50]:
lancamentos = pd.Series({'jan':2024,'fev':2025,'mar':2026,'abr':2027})
lancamentos

jan    2024
fev    2025
mar    2026
abr    2027
dtype: int64

#### Exercício - Como examinar a quantidade de linhas do dataframe?

Gabarito

In [25]:
# antes vamos ver o tipo
df.dtypes

Tipo           object
Bairro         object
Quartos         int64
Vagas           int64
Suites          int64
Area            int64
Valor         float64
Condominio    float64
IPTU          float64
dtype: object

**Gabarito**

In [26]:
# vamos ver quantidade de linhas do dataframe
len(df)

32960

### Acesse apenas a coluna Suites

In [44]:
df['Tipo']

0                      Quitinete
1                           Casa
2        Conjunto Comercial/Sala
3                    Apartamento
4                    Apartamento
                  ...           
32955                  Quitinete
32956                Apartamento
32957                Apartamento
32958                Apartamento
32959    Conjunto Comercial/Sala
Name: Tipo, Length: 32960, dtype: object

In [45]:
df.Valor[2:4]

2    5200.0
3     800.0
Name: Valor, dtype: float64

Orientação a Objetos

- Classe
- Objeto
- Método
- Herança
- Encpsulamento
- Polimorfismo

(Quadro Branco.)

Arquivo de Exemplo: Aspectos Básicos da Orientação a Objetos em Python

Este arquivo apresenta os aspectos básicos da orientação a objetos em Python.

1. Definindo uma Classe
2. Método __init__
3. Métodos em uma Classe
4. Atributos de Instância
5. Utilizando a Referência 'self'
"""

## Exemplo

In [28]:

# 1. Definindo uma Classe
class Pessoa:
    pass  # 'pass' é usado para indicar que a classe está vazia, mas você pode adicionar membros posteriormente


# 2. Método __init__
class Carro:
    def __init__(self, modelo, ano):
        self.modelo = modelo
        self.ano = ano


# 3. Métodos em uma Classe
class Cachorro:
    def latir(self):
        return "Woof!"


# 4. Atributos de Instância
class Aluno:
    def __init__(self, nome, idade):
        self.nome = nome
        self.idade = idade


# 5. Utilizando a Referência 'self'
class Circulo:
    pi = 3.14  # Atributo de Classe

    def __init__(self, raio):
        self.raio = raio  # Atributo de Instância

    def calcular_area(self):
        return self.pi * (self.raio ** 2)


# Exemplos de Uso
if __name__ == "__main__":
    # 1. Definindo uma Classe
    pessoa = Pessoa()

    # 2. Método __init__
    carro = Carro(modelo="Civic", ano=2022)

    # 3. Métodos em uma Classe
    cachorro = Cachorro()
    print(cachorro.latir())

    # 4. Atributos de Instância
    aluno = Aluno(nome="Maria", idade=25)
    print(f"Nome: {aluno.nome}, Idade: {aluno.idade}")

    # 5. Utilizando a Referência 'self'
    circulo = Circulo(raio=5)
    area = circulo.calcular_area()
    print(f"Área do círculo: {area}")


Woof!
Nome: Maria, Idade: 25
Área do círculo: 78.5


### O que é uma classe?

In [37]:
class Imovel:
    def __init__(self,preco):
        self.preco = preco
        
    def alugar(self):
        return 'aluguei!'
        

In [42]:
## O que é um objeto, chamada ao construtor

In [38]:
casa = Imovel(preco=345.78)
casa.preco


345.78

### Métodos

In [39]:
print(casa.alugar())

aluguei!


In [54]:
df.head(40)

Unnamed: 0,Tipo,Bairro,Quartos,Vagas,Suites,Area,Valor,Condominio,IPTU
0,Quitinete,Copacabana,1,0,0,40,1700.0,500.0,60.0
1,Casa,Jardim Botânico,2,0,1,100,7000.0,,
2,Conjunto Comercial/Sala,Barra da Tijuca,0,4,0,150,5200.0,4020.0,1111.0
3,Apartamento,Centro,1,0,0,15,800.0,390.0,20.0
4,Apartamento,Higienópolis,1,0,0,48,800.0,230.0,
5,Apartamento,Vista Alegre,3,1,0,70,1200.0,,
6,Apartamento,Cachambi,2,0,0,50,1300.0,301.0,17.0
7,Casa de Condomínio,Barra da Tijuca,5,4,5,750,22000.0,,
8,Casa de Condomínio,Ramos,2,2,0,65,1000.0,,
9,Conjunto Comercial/Sala,Centro,0,3,0,695,35000.0,19193.0,3030.0


In [55]:
df[35:38]

Unnamed: 0,Tipo,Bairro,Quartos,Vagas,Suites,Area,Valor,Condominio,IPTU
35,Conjunto Comercial/Sala,Barra da Tijuca,0,1,0,22,700.0,,
36,Apartamento,Recreio dos Bandeirantes,3,1,1,105,2300.0,648.0,
37,Apartamento,Leblon,3,1,0,110,3900.0,1500.0,120.0
