Pé -> Metros -> Pé: Entrada do usuário que define a conversão
1 pé = 0,3048 metros
1 metro = 3,281 pés
Entregar 1 código por grupo de 2
Dado os arquivos em anexo:
anos.txt ⇒ ano de nascimento das pessoas em ordem
altura ⇒ alturas das pessoas em ordem
Importe os 2 arquivos e descubra a média de altura de quem nasceu entre 1998 e 2005.
Gerar o seguintes gráficos:
Gráfico 1 - Total de produtos Vendidos por mês - Linha
Gráfico 2 - Gráfico com todos os produtos vendidos por mês - Linha
Gráfico 3 - Comparativo de Creme Facial com Limpeza Facial por mês - Barras
Gráfico 4 - Histograma de quantidade de meses (y) e faixas de quantidades de produtos vendidos (1000-1999, 2000-2999, ...)
Gráfico 5 - Pizza. % da quantidade produtos vendidos no ano em cada produto
- importar os dados de CSV do dataset de seeds: https://raw.githubusercontent.com/celsocrivelaro/simple-datasets/main/seeds.csv
- colocar as linhas de cabeçalho:
a. Área A,
b. Perímetro P,
c. Extensão do núcleo,
d. Largura,
e. Coeficiente de Assimetria
f. Extensão do sulgo do núcleo. - remover colunas extras no final
- remover as linhas com valores nulos
- Adicionar um campo Compactação cujo o cálculo é C = 4piA/P^2
- Exportar para CSV o valor final
A partir das variáveis, calcular o preço estimado do diamante.
Usar:
- Dataset treinamento/testes
- Limpeza dos dados
- Seleção de dados de entrada que maximizam o resultado
- Calcular R2 do modelo
-
Fazer a função sigmoide
O valor a é o peso da variável x1
O valor b é o peso da variável x2
O valor c é o peso do víes -
Desenvolver a função de perda
Fazer a função de perda de Cross Entropy comparando valor de$Y$ (valor de entrada) com o valor de$f(x).$ -
Decida no gradiente
Desenvolva a descida do gradiente usando a função sigmoide$f(x)$ e a função de perda$L(f,y)$ . -
Plotagem com valores de hiperparâmetros diferentes
Tesar o algoritmo com variações do valores de hiperparâmetros:$\alpha$ (taxa de aprendizado), número de$N$ interações, e$\varepsilon$ (diferença da função de perda) -
Análises
Checar$\alpha$ com ordens de grandezas: 0.1, 0.01, 0.001
Quanto melhor o N, melhor.
$\varepsilon$ entre$10^{-3}$ e$10^{-6}$
Verificar qual é a melhor configuração para o aprendizado baseado na medida de acurácia.
Simplificações e premissas:
- FIFO nas filas, não há prioridade
- Os usuários chegam um por vez, não chegam em grupos ou lotes
- Será apenas uma fila para 1 ou c serviços.
Tente pensar situações comuns para cada problema. Os valores devem mudar de problema a problema:
- O tempo de serviço pode variar. No problema de pesagem de caminhões, a balança pode demorar para pesar mais uns caminhões do que outros por alguma distribuição de probabilidade
- A chegada de usuário pode mudar pelo tempo. Por exemplo, um serviço bancário pode ter picos em alguns horários
- Desistência de usuários se a fila está muito grande. No caso de fila de compra de ingressos, alguém pode desistir quando o tamanho da fila está grande
O que deverá ser medido:
- Tempos que os usuários demorar no sistema e nas filas
- Tamanho das filas e variações pelo tempo
- Desistências ou Tempos críticos na fila
Sobre as filas e o sistema:
- Escolher uma função de probabilidade para a chegada dos usuários
- Escolher uma função de probabilidade para o tempo do serviços de cada usuários
- Faça desistência ou marcações críticas de acordo de um tamanho
- Tamanho do tempo da simulações
- Quantidade de serviços ao mesmo tempo ou variações da quantidade pelo tempo
Fazer várias simulações com parâmetros e funções de distribuições diferentes e plotar:
- Tempo de entrada e saída dos usuários na fila
- Tamanho das filas pelo tempo