# <font color='green'>Introduction to Programming Logic</font>

## Fibonacci Sequence

The sequence was named after the Italian mathematician Leonardo of Pisa, better known as Fibonacci, who described, in the year 1202, the growth of a rabbit population from this sequence. This sequence, however, was already known in ancient times. The Fibonacci sequence has applications in financial market analysis, computer science, and game theory. 

The Fibonacci numbers are, therefore, the numbers that make up the following sequence: 
> **0,1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, 377, 610, 987, 1597, 2584, ...**

In mathematical terms, the sequence is defined recursively by the formula below: 
> **Fn = Fn-1 + Fn-2**

### Lesson 1 - Python function to find the value at any position in the Fibonacci Sequence

**Pseudocode**
1. Set the variable n (index) that represents the position of the number in the Fibonacci Sequence
2. If n is less then 0 or 0, the value is invalid, since the Fibonacci Sequence has no value in negative position.
3. If n is not less then 0, we check if n is equal to 1. If n is equal to 1 we return 0, because this is the first value in the Fibonacci Sequence.
4. If n is not equal to 1, we check if n is equal to 2. If the n is equal to 2 we return 1, because this is the second value in the Fibonacci Sequence.
5. If n is not in any of the previous conditions, we can find the value of the position n by applying the formula: Fn = Fn-1 + Fn-2.
6. **Since in the step 5 we have to calculate all the numbers in the Fibonacci Sequence up to the position n, we have to appy recursion.**

In [15]:
%%time
# find the value with iteration
def fibonacci(idx):
    seq = [0, 1]
    for i in range(idx):
        seq.append(seq[-1]+seq[-2])
    return seq[-2]

fibonacci(8)

CPU times: user 15 µs, sys: 2 µs, total: 17 µs
Wall time: 20 µs


21

In [13]:
%%time
# find the value with recursion
def findFibonacci(n):
    if n < 0:
        print("Incorrect input!")
    elif n == 0:
        return 0
    elif n == 1:
        return 1
    else:
        return findFibonacci(n-1) + findFibonacci(n-2)
    
findFibonacci(8)

CPU times: user 17 µs, sys: 2 µs, total: 19 µs
Wall time: 22.4 µs


21

In [9]:
# Executa a função para a posição 5
print(findFibonacci(5))

3


In [None]:
# Executa a função para a posição 21
print(encontraFibonacci(21))

In [None]:
# Executa a função para a posição 32
print(encontraFibonacci(32))

Here we used **recursion** that is when the function called itself. But recursion is not the only way to solve this problem.  We could use Dynamic Programming or Spatial Optimization, as I will show in the next lessons.  

### Other examples of recursive functions

In [16]:
# Countdown
def countdown(num):
    print(num)
    if num > 0:
        countdown(num-1)
    else:
        print('Happy New Year!')
        
    # To see what is happening in memory
    print(f"Order: {num}")

countdown(5)

5
4
3
2
1
0
Happy New Year!
Order: 0
Order: 1
Order: 2
Order: 3
Order: 4
Order: 5


Intel processors do not keep data in memory in the order you would expect. Instead the data is reverse stored. And only then the data is shown to us. It's like a stack, the last element in is the first element out.

In [17]:
# Factorial
def calculate_factorial(num):
    if num > 1: 
        num *= calculate_factorial(num - 1)
    
    # To see what is happening in memory
    print(f"Order: {num}")
    return num

print(calculate_factorial(3))

Order: 1
Order: 2
Order: 6
6


In [26]:
# Write all the positive even numbers samller or equal 8
def evenNums(num):
    print(num)
    if num % 2 != 0:
        print("please enter an even number")
    elif num == 2:
        return num
    else:
        return evenNums(num - 2)
    
evenNums(16)

16
14
12
10
8
6
4
2


2

### Aula 2 - Function to print all Fibonacci Sequence values up to a specific position. 

**Pseudocode**
1. Set the variable n to be the desired position in the FS (Fibonacci Sequence).
2. Set the variable n1 to the value of the first position in the FS.
3. Set the variable n2 to the value of the second position in the FS.
4. Define and initialize the variable count to serve as a counter, to know when we reach the end of the FS to the value of n.
5. If the value of n is less than zero, print a message on the screen indicating that n can't be negative, because we don't have a negative position in the FS.
6. If n is equal to 1, print n1.

7. Otherwise, we repeat the steps below as long as count is less than n:
    1. print n1 on the screen.
    2. add n1 with n2 to get the next value.
    3. Variable n1 receives the value of variable n2.
    4. Variable n2 receives the value calculated in 7.2.
    5. increments the counter
    
**Note**: We will not use a function in this example and we recommend that you save the code in a text file with a **.py** extension and then execute it in a terminal using 
> python file_name.py

In [29]:
# Program to display the Fibonacci Sequence up to the nth term, where n is given by the user.

# 1. Set the variable n to be the desired position in the FS.
n = 10

# 2. Set the variable n1 to the value of the first position in the FS.
n1 = 0

# 3. Set the variable n2 to the value of the second position in the FS.
n2 = 1

# 4. Set and initialize the variable count to serve as a counter, to know when we have reached the end of FS to the value of n.
count = 0

# 5. If the value of n is less than zero, print a message on the screen indicating that n cannot be negative, because we have no negative position in FS.
if n < 0:
    print("The position cannot be negative")

# 6. Otherwise, if n is equal to 1, print n1.   
elif n == 1:
    print("Fibonacci sequence up to ", n, ":")
    print(n1)

# 7. Otherwise, we repeat the steps below as long as count is less than n: 
else:
    print("Fibonacci sequence up to", n, ":")
    while count < n:

        # 7.1. Prints n1 on the screen.
        print(n1, end = ', ')
       
        # 7.2. Sum n1 with n2 to get the next value.
        nth = n1 + n2
       
        # 7.3. Variable n1 receives the value of variable n2.
        n1 = n2

        # 7.4. Variable n2 receives the value calculated in 7.2
        n2 = nth

        # 7.5. Increments the counter.
        count += 1

Fibonacci sequence up to 10 :
0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 

### Aula 3 - Programming with functions

#### Given two numbers, find the larger of them.

**Pseudocode**
1. Read two numbers, represented by the variables a and b.
2. If a is greater than b, return a as greater.
3. If not, return b.

In [31]:
# Function
def find_max2(a, b):
    if a > b:
        return a
    else:
        return b

In [32]:
# Running the function
find_max2(8, 9)

9

In [33]:
# Running the function
find_max2(10, 9)

10

#### Given 3 numbers, find the larger of them.

**Pseudocode**
1. Read three numbers, represented by the variables a, b and c.
2. If a is greater than b and c, return a as greater.
3. If b is greater than a and c, return b as greater.
4. If not, return c.

In [None]:
# Function
def find_max3(a, b, c):
    if a > b and a > c:
        print(a)
    elif b > a and b > c:
        print(b)
    else:
        print(c)

In [None]:
# Running the function
find_max3(8, 9, 10)

In [None]:
# Running the function
find_max3(10, 9, 8)

In [None]:
# Running the function
find_max3(8, 10, 9)

In [34]:
# We can also do it using the previous function
def find_max3_v2(a, b, c):
    if a < b:
        return find_max2(b, c)
    else:
        return find_max2(a, c)

In [35]:
# Running the function
find_max3_v2(8, 9, 10)

10

In [36]:
# Running the function
find_max3_v2(10, 9, 8)

10

In [38]:
# Running the function
find_max3_v2(8, 10, 9)

10

### Aula 4

In [None]:
# Função
def soma():
    soma = 0
    i = 1

    soma = soma + i 
    i = i + 1
    soma = soma + i 
    i = i + 1
    soma = soma + i 
    i = i + 1
    soma = soma + i 
    i = i + 1
    soma = soma + i 

    return soma

In [None]:
soma()

In [None]:
def soma(n):
    soma = 0
    for i in range(n+1):
        soma = soma + i
    return soma

In [None]:
soma(1000)

In [None]:
def soma(n):
    soma = 0
    i = 1
    while i <= n:
        soma = soma + i
        i = i + 1
    return soma

In [None]:
soma(1000)

### Aula 5

In [None]:
def somaRec(n):
    if n > 0:
        soma = somaRec(n - 1) + n
    else:
        soma = 0
    return soma

In [None]:
somaRec(1000)

### Aula 6

In [None]:
# Programa Python para pesquisa binária recursiva.
  
# Retorna o índice de x no vetor se x estiver presente, caso contrário -1
def pesquisaBinaria (vetor, primeira_pos, ultima_pos, x): 
  
    # Verifica se a última posição do vetor é maior ou igual a 1 para garantir 
    # que tenhamos um vetor de comprimento maior que zero
    if ultima_pos >= primeira_pos: 
  
        meio = primeira_pos + (ultima_pos - primeira_pos) // 2
  
        # Se o elemento estiver presente no meio em si
        if vetor[meio] == x: 
            return meio 
          
        # Se o elemento for menor que o meio, ele poderá estar presente apenas no sub-vetor esquerdo
        elif vetor[meio] > x: 
            return pesquisaBinaria(vetor, primeira_pos, meio-1, x) 
  
        # Senão, o elemento pode estar presente apenas no sub-vetor direito
        else: 
            return pesquisaBinaria(vetor, meio + 1, ultima_pos, x) 
  
    else: 
        # O elemento não está presente na matriz
        return -1
  
# Vetor de teste
listaNum = [ 12, 13, 40, 56, 93 ] 
x = 56
  
# Chamada da função
resultado = pesquisaBinaria(listaNum, 0, len(listaNum)-1, x) 
  
if resultado != -1: 
    print ("O elemento está presente no índice %d!" % resultado)
else: 
    print ("O elemento não está presente no vetor!")

### Exercício Aula 6

In [None]:
# Função principal do programa
def main():
    
    # Lista fora de ordem
    autores = ['Monteiro Lobato', 'José de Alencar', 'Cecília Meireles', 'Carlos Drummond de Andrade',
               'Machado de Assis', 'Clarice Lispector', 'Graciliano Ramos',
               'Guimarães Rosa', 'Ruth Rocha', 'Luis Fernando Veríssimo']
    
    # Lista ordenada
    autores_ordenados = sorted(autores)

    # Solicita que o usuário digite o nome do autor
    autor = input('Digite o nome do autor para pesquisar na lista: ')
    
    # Grava a posição retornada pela pesquisa binária
    position = binary_search(autores_ordenados, autor)
    
    # Imprime mensagem de acordo com o resultado da pesquisa binária
    print("\nLista Ordenada de Autores: \n")
    print(autores_ordenados)
    if position == -1:
        print("\n")
        print("Desculpe, mas esse autor não faz parte da lista.")
    else:
        print("\n")
        print(autor, "é parte da lista e está na posição", position + 1, "( equivalente ao índice", position, ") na lista ordenada de autores.")

# Função para a pesquisa binária
def binary_search(autores_ordenados, autor):
    
    # Variáveis de controle
    primeiro_elemento = 0
    ultimo_elemento = len(autores_ordenados) - 1
    position = -1
    achei = False

    # Loop
    while not achei and primeiro_elemento <= ultimo_elemento:
        
        # Calcula o meio
        meio = (primeiro_elemento + ultimo_elemento) // 2

        # Verifica o meio e compara os elementos
        if autores_ordenados[meio] == autor:
            achei = True
            position = meio
        elif autores_ordenados[meio] > autor:
            ultimo_elemento = meio - 1
        else:
            primeiro_elemento = meio + 1

    return position

# Executa o programa
main()

### Aula 7

In [None]:
# Ordenação por Bolha
def bubble_sort(lista):
    
    # Função que realiza a troca dos elementos
    def troca(i, j):
        lista[i], lista[j] = lista[j], lista[i]

    n = len(lista)
    trocado = True
    
    x = -1
    while trocado:
        trocado = False
        x = x + 1
        for i in range(1, n - x):
            if lista[i - 1] > lista[i]:
                troca(i - 1, i)
                trocado = True
                    
    return lista

# Lista não ordenada
listaNum = [9, 3, 5, 4, 6, 2, 7, 1, 8]

# Ordenada a lista
bubble_sort(listaNum)

### Aula 8

In [None]:
# Cria um dicionáro vazio
dicionario = dict()

# Adiciona pares de chaves/valores ao dicionário
# As letras são as chaves e os números os valores
dicionario['a'] = 1
dicionario['b'] = 2
dicionario['c'] = 3

# Podemos imprimir o dicionário
print(dicionario)

# Ou imprimir um valor com base em sua chave
print(dicionario['b'])

# Podemos usar um loop e imprimir as chaves
for chave in dicionario.keys():
    print(dicionario[chave])

# Podemos usar um loop e imprimir os pares chave/valor
for chave, valor in dicionario.items():
    print (chave,':', valor)

In [None]:
chaves = ['a', 'b', 'c']
valores = [1, 2, 3]
hash = {k:v for k, v in zip(chaves, valores)}
print(hash)
type(hash)

### Aula 9

In [None]:
# Criação do Grafo e implementação do Algoritmo BFS

# Função para criar um grafo padrão
from collections import defaultdict 
  
# Esta classe representa um grafo direcionado
# usando representação de lista de adjacências 
class Grafo: 
  
    # Construtor 
    def __init__(self): 
  
        # Dicionário padrão para armazenar o grafo 
        self.graph = defaultdict(list) 
  
    # Função para adicionar uma aresta ao grafo
    def addEdge(self,u,v): 
        self.graph[u].append(v) 
  
    # Função para o algoritmo BFS
    def BFS(self, s): 
  
        # Marque todos os vértices como não visitados
        visited = [False] * (len(self.graph)) 
  
        # Crie uma fila para o BFS
        queue = [] 
  
        # Marque o nó de origem s como visitado e inclua na fila
        queue.append(s) 
        visited[s] = True
  
        while queue: 
  
            # Remova um vértice da fila e imprima
            s = queue.pop(0) 
            print (s, end = " ") 
  
            # Obter todos os vértices adjacentes do vértices desenfileirados. 
            # Se um adjacente não foi visitado, marque-o visitado e inclua na fila
            for i in self.graph[s]: 
                if visited[i] == False: 
                    queue.append(i) 
                    visited[i] = True
  

  
# Cria uma instância da classe, construindo um grafo com diversas arestas
g = Grafo() 
g.addEdge(0, 1) 
g.addEdge(0, 2) 
g.addEdge(1, 2) 
g.addEdge(2, 0) 
g.addEdge(2, 3) 
g.addEdge(3, 3) 

print ("Aqui está o caminho a seguir para atravessar o grafo (começando do vértice 2):") 
g.BFS(2) 

### Aula 10

In [None]:
# Função para o algoritmo Backtracking
def permuta(combinacoes, lista):
    
    # Verificamos se o número de combinações é igual a 1
    # e retornamos a própria lista, pois não há combinações a fazer
    if combinacoes == 1:
        return lista
    
    # Se quisermos mais de 1 combinação dos elementos, começamos a recursão
    else:
        
        # Usamos list comprehension com recursão
        return [ y + x for y in permuta(1, lista) for x in permuta(combinacoes - 1, lista) ]

# Executa a função buscando diferentes combinações e aplicando a técnica de Backtracking
print(permuta(1, ["a","b","c"]))
print(permuta(2, ["a","b","c"]))
print(permuta(3, ["a","b","c"]))

### Aula 11

In [None]:
# Algoritmo guloso que busca a melhor combinação de alimentos para uma dieta de 1000 calorias.

# Classe para armazenar os alimentos
class Alimentos(object):
    
    # Construtor
    def __init__(self, n, v, c):
        
        # Nome do alimento
        self.nome = n
        
        # Valor do alimento em Reais
        self.valor = v
        
        # Número de calorias do alimento
        self.calorias = c
        
    # Método para obter o valor de cada alimento  
    def getValor(self):
        return self.valor
        
    # Método para obter o custo (1 dividido pelo número de calorias, calculado mais abaixo. Aqui retornamos apenas as calorias)   
    def getCusto(self):
        return self.calorias
  
    # Método para imprimir nome/valor/calorias
    def __str__(self):
        return self.nome + ': <' + str(self.valor) + ', ' + str(self.calorias) + '>'


# Cria o Menu com a lista de alimentos"
def criaMenu(nomes, valores, calorias):
    
    # Cria a lista vazia
    menu = []
    
    # De acordo com o tamanho da lista de valores, inserimos todos os itens na lista de menu
    for i in range(len(valores)):
        menu.append(Alimentos(nomes[i], valores[i], calorias[i]))
    return menu
    

# Algoritmo Guloso
def greedy(items, maxCost, keyFunction):
    
    # Copia todos os itens
    itemsCopy = sorted(items, key = keyFunction, reverse = True)
    
    # Lista de resultados
    resultado = []
    
    # Valor total
    totalValor = 0
    
    # Custo total
    totalCusto = 0.0
    
    # De acordo com o tamanho da lista de itens, realiza os seguintes cálculos
    for i in range(len(itemsCopy)):
        if (totalCusto + itemsCopy[i].getCusto()) <= maxCost:
            
            # adiciona os itens a lista de resultados
            resultado.append(itemsCopy[i])
            
            # Calcula o custo total
            totalCusto += itemsCopy[i].getCusto()
            
            # Calcula o valor total
            totalValor += itemsCopy[i].getValor()
            
    return (resultado, totalValor)     
    
# Função para executar o algoritmo guloso
def executaGreedy(items, constraint, keyFunction):
    result, val = greedy(items, constraint, keyFunction)
    print('Valor Total dos Itens para 1000 calorias =', val)
    for item in result:
        print(item)

# Função que gera o melhor cardápio pelo valor individual dos alimentos e pelo custo dos alimentos
def geraCardapio(alimentos, totCalorias):
    
    print('Usando o algoritmo guloso para buscar o melhor menu pelo valor dos alimentos para', totCalorias, 'calorias')
    executaGreedy(alimentos, totCalorias, Alimentos.getValor)
    
    print('\nUsando o algoritmo guloso para buscar o melhor menu pelo custo dos alimentos para', totCalorias, 'calorias')
    executaGreedy(alimentos, totCalorias, lambda x: 1/Alimentos.getCusto(x))

    
# Listas para testar o algoritmo
listaAlimentos = ['Frango', 'Milk Shake', 'Pizza', 'Hamburger', 'Batata Frita', 'Refrigerante', 'Maça', 'Laranja', 'Cenoura', "Alface"]
valores = [79, 18, 45, 38, 25, 9, 15, 10, 22, 12]
calorias = [114, 156, 359, 354, 365, 153, 97, 82, 79, 40]


# Cria o menu
menu_alimentos = criaMenu(listaAlimentos, valores, calorias)


# Busca o melhor menu para o consumo de 1000 calorias
geraCardapio(menu_alimentos, 1000) 

### Aula 12

In [None]:
# Imagine que você receba uma string como esta:
    
# marceloachaqueoclimapodemudar

# E seu trabalho é produzir uma saída como esta:
    
# marcelo acha que o clima pode mudar

# Como você resolveria esse problema? A Programação Dinâmica pode nos ajudar!
    
    

# Programação Dinâmica - Partição de Strings

# Input: marceloachaqueoclimapodemudar
# Output: marcelo acha que o clima pode mudar 

# Dicionário com as palavras disponíveis
dicionario = {
    "acha": True,
    "que": True,
    "o": True,
    "clima": True,
    "pode": True,
    "mudar": True
}

# Função de custo
def calculaCusto(palavra):
    """Avalia o custo de uma determinada palavra. 
    Retorna 0 se a palavra estiver no dicionário, ou o número de caracteres caso contrário.
    
    Argumentos:
        palavra (string): uma palavra cujo custo precisa ser avaliado.
    
    Retorno:
        O custo da palavra (int).
    """
    if palavra in dicionario:
        return 0
    else:
        return len(palavra)

# O cache para memorizar soluções parciais
# Aqui está a grande diferença da Programação Dinâmica, uma espécie de "memória" para armazenar soluções parciais
cache = {}

# Função para dividir a string de input
def divideString(input_string, inicio_index):
    """Esta função recursiva, tenta dividir a substring começando em 'inicio_index' em partições, ou seja, palavras!
    
    Argumentos:
        input_string (string): a string inicial que precisa ser dividida.
        inicio_index (int): queremos dividir a substring de input_string começando nesse índice
    
    Retorno:
        Uma forma de tupla da solução parcial e seu custo
    """
    
    # Já calculamos a solução ideal a partir do ponto
    if inicio_index in cache:
        return cache[inicio_index]

    # A substring para dividir
    substring = input_string[inicio_index:]

    # Estas são as condições de contorno
    # Se a substring estiver vazia, retorne uma string vazia sem nenhum custo
    if not len(substring):
        return '', 0

    min_cost = None
    min_string = None

    # Colocamos nossa próxima partição em algum lugar entre o início + 1 e o final do input_string
    for i in range(1, len(substring) + 1):
        
        # Dividimos o resto da string recursivamente
        rest_string, rest_cost = divideString(input_string, inicio_index + i)

        current_string = substring[:i]
        current_cost = calculaCusto(current_string) + rest_cost

        # Atualiza o custo mínimo e string, se for o melhor até agora
        if min_cost is None or current_cost < min_cost:

            # Se as duas partes não estiverem vazias, junte-as com espaço
            if current_string and rest_string:
                min_string = current_string + ' ' + rest_string
                
                # Adicionamos um custo ao espaço em branco para evitar a divisão de palavras desconhecidas 
                # em pequenos pedaços
                current_cost += 1
            else:
                min_string = current_string + rest_string

            min_cost = current_cost

    cache[inicio_index] = min_string, min_cost
    return min_string, min_cost

In [None]:
# Executa a função começando do índice 0
print(divideString("marceloachaqueoclimapodemudar", 0))

In [None]:
# Executa a função começando do índice 7
print(divideString("marceloachaqueoclimapodemudar", 7))

In [None]:
# Executa a função começando do índice 11
print(divideString("marceloachaqueoclimapodemudar", 11))

### Aula 14

In [None]:
# Pacotes para computação e matemática
import numpy as np
import math

# Classe para a função de Ativação Sigmoide
class Sigmoide():
    def __call__(self, x):
        return 1 / (1 + np.exp(-x))

# Algoritmo de Machine Learning - Regressão Logística
class RegressaoLogistica():
    
    # Construtor da Classe - define os atributos
    def __init__(self, learning_rate = .1, gradient_descent = True):
        self.param = None
        self.learning_rate = learning_rate
        self.gradient_descent = gradient_descent
        self.sigmoid = Sigmoide()

    # Inicializa os parâmetros
    def _inicializa_parametros(self, X):
        n_features = np.shape(X)[1]
        limit = 1 / math.sqrt(n_features)
        self.param = np.random.uniform(-limit, limit, (n_features,))
          
    # Converte uma matriz x para diagonal a fim de realizar os cálculos
    def make_diagonal(x):
        m = np.zeros((len(x), len(x)))
        for i in range(len(m[0])):
            m[i, i] = x[i]
        return m    

    # Função para o treinamento
    # Aqui está o coração do algoritmo, suas operações matemáticas
    # Usamos o gradiente descendente a fim de encontrar o melhor valor dos coeficientes,
    # aquilo que o modelo aprende no treinamento
    def treinamento(self, X, y, n_iterations = 4000):
        self._inicializa_parametros(X)
        for i in range(n_iterations):
            y_pred = self.sigmoid(X.dot(self.param))
            if self.gradient_descent:
                self.param -= self.learning_rate * -(y - y_pred).dot(X)
            else:
                diag_gradient = make_diagonal(self.sigmoid.gradient(X.dot(self.param)))
                self.param = np.linalg.pinv(X.T.dot(diag_gradient).dot(X)).dot(X.T).dot(diag_gradient.dot(X).dot(self.param) + y - y_pred)

    # Método para previsão com o modelo 
    def previsao(self, X):
        y_pred = np.round(self.sigmoid(X.dot(self.param))).astype(int)
        return y_pred

In [None]:
from sklearn.datasets import load_iris
import numpy as np

# Função para normalizar os dados
def normaliza_dados(X, axis=-1, order=2):
    l2 = np.atleast_1d(np.linalg.norm(X, order, axis))
    l2[l2 == 0] = 1
    return X / np.expand_dims(l2, axis)

# Função para randomizar os dados
def randomiza_dados(X, y, seed=None):
    if seed:
        np.random.seed(seed)
    idx = np.arange(X.shape[0])
    np.random.shuffle(idx)
    return X[idx], y[idx]

# Função para calcular a acurácia
def calcula_acuracia(y_true, y_pred):
    accuracy = np.sum(y_true == y_pred, axis=0) / len(y_true)
    return accuracy

# Função para dividir os dados em treino e teste
def train_test_split(X, y, test_size=0.5, shuffle=True, seed=None):
    if shuffle:
        X, y = randomiza_dados(X, y, seed)
    split_i = len(y) - int(len(y) // (1 / test_size))
    X_train, X_test = X[:split_i], X[split_i:]
    y_train, y_test = y[:split_i], y[split_i:]

    return X_train, X_test, y_train, y_test

# Função para execução do programa
def main():
    
    # Carregar os dados
    data = load_iris()
    
    # Normalizar os dados de entrada
    X = normaliza_dados(data.data[data.target != 0])
    
    # Carregar os dados de saída
    y = data.target[data.target != 0]
    y[y == 1] = 0
    y[y == 2] = 1

    # Dividir os dados em treino e teste
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, seed=1)

    # Definir o modelo
    modelo = RegressaoLogistica(gradient_descent=True)
    
    # Treinar o algoritmo e criar o modelo
    modelo.treinamento(X_train, y_train)
    
    # Usar o modelo treinado para fazer previsões
    y_pred = modelo.previsao(X_test)

    # Calcular a acurácia comparando valores previstos com valores observados
    acuracia = calcula_acuracia(y_test, y_pred)
    
    # Imprime a acurácia do modelo
    print ("Acurácia do Modelo:", acuracia)

 
# Executa o programa
if __name__ == "__main__":
    main()

### Aula 15

In [None]:
# Pacotes
import math
import numpy as np
import matplotlib.cm as cmx
import matplotlib.pyplot as plt
import matplotlib.colors as colors


##### Funções Auxiliares #####

# Função para normalizar os dados
def normaliza_dados(X, axis = -1, order = 2):
    l2 = np.atleast_1d(np.linalg.norm(X, order, axis))
    l2[l2 == 0] = 1
    return X / np.expand_dims(l2, axis)
    
# Função para calcular a distância euclidiana entre 2 vetores
def calcula_distancia_euclidiana(x1, x2):
    distance = 0
    for i in range(len(x1)):
        distance += pow((x1[i] - x2[i]), 2)
    return math.sqrt(distance)


##### Algoritmo K-means #####


# Classe para o algoritmo K-means
# Aprendizagem não supervisionada
class KMeans():
    
    # Construtor da classe
    def __init__(self, k=3, max_iterations=500):
        self.k = k
        self.max_iterations = max_iterations

    # Inicializa os centróides com k amostras randômicas de x
    def _init_random_centroids(self, X):
        n_samples, n_features = np.shape(X)
        centroids = np.zeros((self.k, n_features))
        for i in range(self.k):
            centroid = X[np.random.choice(range(n_samples))]
            centroids[i] = centroid
        return centroids

    # Retorna o índice mais próximo do centróide da amostra
    def _closest_centroid(self, sample, centroids):
        closest_i = 0
        closest_dist = float('inf')
        for i, centroid in enumerate(centroids):
            distance = calcula_distancia_euclidiana(sample, centroid)
            if distance < closest_dist:
                closest_i = i
                closest_dist = distance
        return closest_i

    # Associa as amostras de dados aos centróides mais próximos para criar os clusters (grupos)
    def _create_clusters(self, centroids, X):
        n_samples = np.shape(X)[0]
        clusters = [[] for _ in range(self.k)]
        for sample_i, sample in enumerate(X):
            centroid_i = self._closest_centroid(sample, centroids)
            clusters[centroid_i].append(sample_i)
        return clusters

    # Calcula novos centróides como a média das amostras em cada cluster
    def _calculate_centroids(self, clusters, X):
        n_features = np.shape(X)[1]
        centroids = np.zeros((self.k, n_features))
        for i, cluster in enumerate(clusters):
            centroid = np.mean(X[cluster], axis=0)
            centroids[i] = centroid
        return centroids

    # Classifica as amostras com o índice dos seus clusters
    def _get_cluster_labels(self, clusters, X):
        y_pred = np.zeros(np.shape(X)[0])
        for cluster_i, cluster in enumerate(clusters):
            for sample_i in cluster:
                y_pred[sample_i] = cluster_i
        return y_pred

    # Faz a previsão de cada cluster e retorna os índices dos clusters
    def predict(self, X):

        # Inicializa centróides como k amostras aleatórias de X
        centroids = self._init_random_centroids(X)

        # Iterar até convergência ou para iterações máximas
        for _ in range(self.max_iterations):
            
            # Atribuir amostras aos centróides mais próximos (criar clusters)
            clusters = self._create_clusters(centroids, X)
            
            # Salvar os centróides atuais para verificação de convergência
            prev_centroids = centroids
            
            # Calcular novos centróides a partir dos clusters
            centroids = self._calculate_centroids(clusters, X)
            
            # Se nenhum centróide mudou => convergência
            diff = centroids - prev_centroids
            if not diff.any():
                break

        return self._get_cluster_labels(clusters, X)

In [None]:
##### Funções Auxiliares Para o PCA #####

# Calcula a matriz de co-variância
def calculate_covariance_matrix(X, Y=None):
    if Y is None:
        Y = X
    n_samples = np.shape(X)[0]
    covariance_matrix = (1 / (n_samples-1)) * (X - X.mean(axis=0)).T.dot(Y - Y.mean(axis=0))

    return np.array(covariance_matrix, dtype=float)
 
# Calcula a matriz de correlação
def calculate_correlation_matrix(X, Y=None):
    if Y is None:
        Y = X
    n_samples = np.shape(X)[0]
    covariance = (1 / n_samples) * (X - X.mean(0)).T.dot(Y - Y.mean(0))
    std_dev_X = np.expand_dims(calculate_std_dev(X), 1)
    std_dev_y = np.expand_dims(calculate_std_dev(Y), 1)
    correlation_matrix = np.divide(covariance, std_dev_X.dot(std_dev_y.T))

    return np.array(correlation_matrix, dtype=float)


##### Classe Para o Plot dos Clusters em 2D #####


# Classe para criar o plot
class Plot():
    
    # Construtor da classe
    def __init__(self): 
        self.cmap = plt.get_cmap('viridis')
        
    # Função para transformar os dados
    def _transform(self, X, dim):
        covariance = calculate_covariance_matrix(X)
        eigenvalues, eigenvectors = np.linalg.eig(covariance)
        idx = eigenvalues.argsort()[::-1]
        eigenvalues = eigenvalues[idx][:dim]
        eigenvectors = np.atleast_1d(eigenvectors[:, idx])[:, :dim]
        X_transformed = X.dot(eigenvectors)

        return X_transformed

    # Plot do dataset X e seus correspondentes labels y em 2D usando PCA.
    def plot_in_2d(self, X, y=None, title=None, accuracy=None, legend_labels=None):
        X_transformed = self._transform(X, dim=2)
        x1 = X_transformed[:, 0]
        x2 = X_transformed[:, 1]
        class_distr = []

        y = np.array(y).astype(int)

        colors = [self.cmap(i) for i in np.linspace(0, 1, len(np.unique(y)))]

        # Plot de diferentes distribuições de classe 
        for i, l in enumerate(np.unique(y)):
            _x1 = x1[y == l]
            _x2 = x2[y == l]
            _y = y[y == l]
            class_distr.append(plt.scatter(_x1, _x2, color=colors[i]))

        # Plot da legenda
        if not legend_labels is None: 
            plt.legend(class_distr, legend_labels, loc=1)

        # Plot do título
        if title:
            if accuracy:
                perc = 100 * accuracy
                plt.suptitle(title)
                plt.title("Acurácia: %.1f%%" % perc, fontsize=10)
            else:
                plt.title(title)

        # Axis labels
        plt.xlabel('Componente Principal 1')
        plt.ylabel('Componente Principal 2')

        plt.show()

In [None]:
##### Execução do Programa #####

from sklearn.datasets import make_blobs

# Função para execução principal do programa
def main():
    
    # Carrega o dataset
    X, y = make_blobs()

    # Executa o algoritmo para k = 3
    clf = KMeans(k = 3)
    y_pred = clf.predict(X)

    # Projeta os dados com 2 componentes principais 
    p = Plot()
    p.plot_in_2d(X, y_pred, title = "Segmentação de Clientes com K-Means")


if __name__ == "__main__":
    main()

### Fim