# **1. Introdução ao Aprendizado de Máquina**

## **Antes de comerçarmos:**

Neste curso, você será exposto a diversos termos expressos em notação matemática. Buscaremos sempre ilustrar de forma intuitiva o significado de cada uma dessas notações. No entanto, para avançar no curso, é fundamental dedicar um tempo para compreendê-las, pois, à medida que os modelos se tornam mais complexos, nem sempre será possível oferecer uma explicação puramente intuitiva.

Se você não está familiarizado com notação matemática ou sente receio ao vê-la, não se preocupe! Pense nela como uma forma compacta de expressar muitas informações em poucas palavras — como uma linguagem própria da matemática. Encare isso como o aprendizado de um novo idioma. 

Boa sorte!

## **O que é Inteligência Artificial?**

## **Diferenças entre IA, Machine Learning e Deep Learning**

## **Definições iniciais**

### **O que são dados?**

Imagine que você quer entender melhor um grupo de pessoas. 

Para isso, você decide anotar algumas informações sobre cada uma delas, como altura *(em cm)*, peso *(em kg)* e idade *(em anos)*. Você observa uma pessoa e registra esses três valores. Depois, faz o mesmo com outra pessoa e assim por diante.

Cada conjunto de informações que você registra (neste caso, altura, peso e idade) constitui um **dado**, isto é,uma representação de algo do mundo real que queremos estudar ou analisar.

Suponha que coletamos os seguintes dados:

- Pessoa 1: 170cm de altura, 70kg e 25 anos.

- Pessoa 2: 160cm de altura, 55kg e 30 anos.

- Pessoa 3: 180cm de altura, 80kg e 28 anos.

Perceba que, com base nessas três informações podemos representar cada pessoa com três números, veja:

- Pessoa 1 -> (170, 70, 25).

- Pessoa 2 -> (160, 55, 30).

- Pessoa 3 -> (180, 80, 28).
  
Cada linha acima é um conjunto de informações sobre uma pessoa.

**Assim, o conjunto de dados que possuímos é: $$\{(170,70,25),(160,55,30),(180,80,28)\}$$**
 

### **O que são características?**

Agora, perceba que cada dado é formado por três números diferentes. Cada um deles representa um tipo específico de informação:

- O primeiro número indica a **altura**.

- O segundo número indica o **peso**.

- O terceiro número indica a **idade**.

Chamamos essas informações individuais de **características**. Elas são os aspectos que escolhemos para descrever cada pessoa.

Se tivéssemos escolhido outras informações, como cor dos olhos ou cidade onde mora, teríamos características diferetentes. Assim, **as características são os elementos que compõem cada dado.**

### **O que é um espaço de características?**

Agora que compreendemos que, no exemplo que estamos usando, cada pessoa é caracterizada por três atributos (altura, peso e idade), podemos pensar em um jeito de visualizar essas informações.

Imagine um gráfico em que cada ponto representa uma pessoa, sendo descrita por três características: altura, peso e idade:

- O **eixo X** representa a altura.

- O **eixo Y** representa o peso.

- O **eixo Z** representa a idade.

Cada pessoa pode ser representada por um ponto dentro desse espaço. **Esse espaço, onde todas as combinações possíveis de altura, peso e idade podem existir—isto é, onde essas características podem assumir quaisquer valores dentro de um intervalo permitido—é chamado de espaço de características.**  

Se tivéssemos apenas altura e peso, nosso espaço teria apenas dois eixos, como um gráfico bidimensional. Se adicionássemos mais características, precisaríamos de mais dimensões para representar tudo.

💡 Dica: Tente visualizar esse conceito de forma gráfica: imagine um ponto em um espaço tridimensional, onde o eixo X representa a altura, o eixo Y representa o peso e o eixo Z representa a idade. Esse ponto corresponde a uma pessoa dentro do nosso conjunto de dados. No início, pode parecer desafiador imaginar esse espaço, mas compreender essa ideia tornará o aprendizado muito mais intuitivo no futuro!

### **O que são vetores de características?**

Agora que entendemos que cada pessoa é representada por um ponto dentro do espaço de características, podemos dar um nome especial para essa representação: **vetor de características**

Um vetor de características é simplesmente um conjunto de números que descreve uma pessoa dentro desse espaço. Podemos imaginá-lo como uma "seta" que parte da origem do espaço de características e aponta diretamente para a posição (coordenadas) correspondente a essa pessoa.

Por exemplo, para a Pessoa 1, o vetor de características é $(170, 70, 25)$, o que significa:

- Altura: **170cm**.

- Peso: **70kg**.

- Idade: **25 anos**.

Se pensarmos em um gráfico tridimensional, onde cada eixo representa uma característica (altura, peso e idade), esse vetor nos dá a posição exata da pessoa nesse espaço. A "seta" que parte da origem até esse ponto é uma forma intuitiva de visualizar como cada observação do nosso conjunto de dados pode ser representada matematicamente.

Em resumo, vetor de características é um termo matemático que usamos para representar cada observação dentro do nosso conjunto de dados.

💡 Dica: Realmente tente imaginar que cada pessoa do nosso conjunto de dados é representada por uma seta partindo da origem e apontando para um ponto no espaço tridimensional. Essa seta nada mais é do que o vetor de características, que indica a posição exata da pessoa nesse espaço. No começo, pode ser desafiador visualizar essa ideia, mas pensar nos vetores como "setas direcionadas" ajudará a compreender melhor como os dados são organizados e analisados matematicamente!

## **Formalizando as definições iniciais**

Agora que construímos uma boa intuição, podemos formalizar esses conceitos matematicamente — mantendo o formalismo apenas no nível necessário por enquanto.

### **Dados**

- São um conjunto de observações $X = \{x_{1}, x_{2}, ..., x_{n}\}$, onde cada $x_{i}$ é uma observação.

- No nosso exemplo, os dados são o conjunto de pessoas que analisamos.

### **Características**

- São os atributos que usamos para descrever cada observação. 
  
- Por exemplo, para a observação: $x_{i} = (x_{i1}, x_{i2},...,x_{id})$, cada valor $x_{ij}$ representa um atributo específico da observação $x_{i}$ *(ex: altura, peso, idade)*, onde $j$ varia de $1$ até $d$.

### **Espaço de características**

- É o conjunto de todas as possíveis combinações dos atributos que utilizamos para descrever uma observação.

- Se cada observação é descrita por $d$ características, esse espaço contém todas as combinações possíveis desses $d$ atributos e é matematicamente representado por $R^{d}$.

- Intuitivamente, podemos imaginar esse espaço como um ambiente onde cada observação ocupa uma posição única com base nos valores de suas características.

### **Vetores de características**

- Representam cada observação dentro do espaço de características.

- No nosso exemplo, a **Pessoa 1** é representada pelo vetor: $x_{1} = (170,70,25) \in R^{3}$.

- De forma geral, para um espaço de características com $d$ dimensões, cada observação é um vetor da forma: $x_{i} = (x_{i1},x_{i2},...,x_{id}) \in R^{d}$, onde $i$ indica o número da observação e cada índice $j$ (com $j \in \{1,2,...,d\}$) representa uma característica dessa observação.

### 💡 Dica:

Não se preocupe se essas definições parecerem um pouco abstratas no começo! Você pode continuar avançando no curso sem dominar completamente essas notações matemáticas. No entanto, quanto mais confortável você estiver com essas notações, mais rápido será seu progresso e mais profundo será seu entendimento dos próximos tópicos.

Se algo não ficou claro, pergunte ao responsável pelo case e revise essas definições sempre que for estudar. Criar familiaridade com essas notaçãos ao longo do tempo tornará o aprendizado muito mais natural e intuitivo!

## **Tipos de aprendizado de máquina**