Skip to content

Meus estudos, resumos, projetos e aprendizados sobre ciência de dados.

Notifications You must be signed in to change notification settings

Gustavocaris/Data_Science

Repository files navigation

Typing SVG

♦️ Introdução   |    ♦️ Python Intro   |    ♦️ Pandas   |    ♦️ Numpy   |    ♦️ Matplotlib       ♦️ Machine_Learning       ♦️ Projetos      


Introdução

➤ Nesta pasta, tem uma seleção de PDFs que servem como ponto de partida os nossos estudos. É aqui que mantenho meus materiais teóricos, PDF's, print's epor aí vai.

➤ Conforme vou aprofundando ou estudando algo novo, vou colocando dentro dessa pasta. As vezes eu acesso esse arquivo para dar uma revisada quando tenho algum tempinho livre e não estou em casa.

codigo aqui

Python Intro

➤ Uma introdução à linguagem Python, contendo alguns fundamentos, bibliotecas, estruturas de dados, desafios para praticar um pouco e entre outros. Gosto sempre de acessar meu github no horario do almoço para sempre ir revisando algum topico ou resolvendo algum desafio.

➤ Conforme aprendo alguma funcionalidade nova, ou framework(django, flask) que futuramente posso vir a estudar... vou adicionando tudo aqui em PY

codigo aqui

Pandas

➤ usada para manipulação e análise de dados tabulares, pandas oferece estruturas de dados poderosas e flexíveis, principalmente os objetos DataFrame e Series, que permitem manipular e analisar dados de forma eficiente.

➤ DataFrame é uma tabela bidimensional com linhas e colunas, que permite armazenar e manipular dados. O pandas também oferece a estrutura de dados Series, que representa uma matriz unidimensional (lembra daquelas matrizes que a gente tinha em matematica na escola)`

Também podemos carregar dados em formatos diversos, como CSV, Excel, SQL, JSON e HTML. pandas ta alinhado com outras bibliotecas, então é fundamental saber

codigo aqui

Numpy

➤ Sempre deixo um texto introdutório no Jupyter para revisar o que estudei. Nesta pasta, esta meus estudos sobre a biblioteca NumPy, que fornece suporte para arrays multidimensionais, juntamente com uma ampla coleção de funções matemáticas para operar nesses arrays.

➤ Um array é uma estrutura multidimensional que nos permite armazenar dados na memória do nosso computador. possui algumas vantagens como maior velocidade de processamento, menos armazenamento interno na memoria, integração com outras bibliotecas.

  • De uma olhada diretamenta no arquivo:
  • codigo aqui

    Matplotlib

    ➤ usado para criação de graficos, visualizações estáticas, interativas e animadas em Python. Ela fornece uma interface para criar uma variedade de gráficos e figuras de alta qualidade. alem da opção de exportação de figuras para vários formatos de arquivo

    ➤ É com essa biblioteca que as coisas tomam forma, TUDO fica melhor com graficos e imagens. é claro que banco de dados muito grandes ficaria um pouco mais complicado, mas podemos filtrar uma informação especifica

  • https://matplotlib.org/stable/tutorials/pyplot.html
  • codigo aqui

    Machine_Learning

    ➤ O aprendizado de máquina é um subcampo da inteligência artificial. O aprendizado de máquina permite que o computador tome decisões com base em dados inseridos e faça previsões.

  • Imagine isso graficamente como: (Inteligência Artificial (aprendizado de máquina (deep learning))) veja a estrutura da IA.
  • ➤ Aqui estou vendo alguns conceitos de algoritmos de aprendizado, como árvore de decisão e regressão linear(tem outros, mas quero entender cada um antes de avnçar) o M.L até agora está sendo a parte mais complexa para entender. Também estou acompanhando um projeto e revisando algumas vezes sobre uma previsão de compras usando Machine Learning(vou fazendo anotações de texto dento do jupyter).

  • Tive contato com a biblioteca Scikit-learn nesses estudos, mas não busquei um aprofundamento maior, ainda.
  • Topico Observação
    Py
    Matematica ✅ curiosidade: trigonometria❤️
    Probabilidade e estatistica ✅ eu estudo mais com exercicios, para concretizar o raciocinio
    Arvore de Decisão Estudando no momento
    Regressão Linear ...
    KNN ...
    Regressão Logistica ...
    SVM ...
    K-MEANS ...

    Vale ressaltar: Esses arquivos são materiais práticos e teóricos que busco ter como BASE em ciência de dados. Afinal, eu não trabalho na área de T.I Estou em busca de uma oportunidade

    codigo aqui

    Projetos

    ➤ Este projeto teve um caráter mais introdutório, com uma base de dados MUITO pequena, apenas para interagir com os números e compreender seu funcionamento. O projeto consiste em:

    ➤ Imagine que uma empresa entrou em contato para aumentar suas vendas. Infos disponiveis:

    • A empresa tem 5 lojas e trabalha com vendas de bermudas
    • Como aumentar seu numero de vendas
    • Informações disponiveis: base de vendas

    codigo aqui

    ➤ Você trabalha em uma empresa de cartões de crédito e o diretor percebeu que o número de clientes que cancelam seus cartões tem aumentado significativamente, causando prejuízo para a empresa.

    ➤ o que fazer para EVITAR OS CANCELAMENTOS de cartões ?? Infos disponiveis:

    • Base de clientes atual
    • Base de clientes que cancelaram o cartão
    • hey? Bora descobrir o que está acontecendo ?

    codigo aqui

    ➤ Este projeto é um conjunto de dados do Kaggle. Vamos avaliar a precisão em relação aos valores totais, com base nos passageiros. Essas aulas são da hashtag programação.

    ➤ Vamos trabalhar com a base de treino e base de teste

    Projeto Em Desenvolvimento ainda

    codigo aqui

    back to top

    About

    Meus estudos, resumos, projetos e aprendizados sobre ciência de dados.

    Topics

    Resources

    Stars

    Watchers

    Forks

    Releases

    No releases published

    Packages

    No packages published

    Languages