### Ecossistema Python para aprendizado de máquina

O ecossistema Python está crescendo e pode se tornar a plataforma dominante para aprendizado de máquina. A principal razão para adotar o Python para aprendizado de máquina é porque é uma linguagem de programação de propósito que você pode usar tanto para P&D quanto para produção.

1. Python e seu uso crescente para aprendizado de máquina.
2. SciPy e a funcionalidade que ele fornece com NumPy, Matplotlib e Pandas.
3. scikit-learn que fornece todos os algoritmos de aprendizado de máquina.
4. Como configurar seu ecossistema Python para aprendizado de máquina e quais versões usar.

#### Python

Python é uma linguagem de programação interpretada de propósito geral. É fácil de aprender e usar principalmente porque a linguagem se concentra na legibilidade. A filosofia do Python é capturada em o Zen of Python que inclui frases como:

In [1]:
import this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


É uma linguagem popular em geral, aparecendo consistentemente no top 10 de programação idiomas em pesquisas no StackOver. É uma linguagem dinâmica e muito adequada para desenvolvimento interativo e prototipagem rápida com o poder de suportar o desenvolvimento de grandes aplicações. Também é amplamente utilizado para aprendizado de máquina e ciência de dados devido à excelente biblioteca suporte e porque é uma linguagem de programação de uso geral (ao contrário de R ou Matlab). Para exemplo, veja os resultados da pesquisa da plataforma Kaggle em 2011 e o KDD Nuggets Resultados da pesquisa de ferramentas de 2015.

Esta é uma consideração simples e muito importante. Isso significa que você pode executar o seu pesquisa e desenvolvimento (definir quais modelos usar) na mesma linguagem de programação que você usa para seus sistemas de produção. Simplificando muito a transição do desenvolvimento à produção.

#### SciPy

SciPy é um ecossistema de bibliotecas Python para matemática, ciências e engenharia. É um complemento para Python que você precisará para aprendizado de máquina. O ecossistema SciPy é composto por os seguintes módulos principais relevantes para aprendizado de máquina

* NumPy: uma base para o SciPy que permite trabalhar com eficiência com dados em arrays.

* Matplotlib: permite criar gráficos e plotagens 2D a partir de dados.

* Pandas: Ferramentas e estruturas de dados para organizar e analisar seus dados.

Para ser eficaz no aprendizado de máquina em Python, você deve instalar e se familiarizar com SciPy. Especificamente:

* Você preparará seus dados como matrizes NumPy para modelagem em algoritmos de aprendizado de máquina.

* Você usará o Matplotlib (e wrappers do Matplotlib em outros frameworks) para criar gráficos e gráficos de seus dados.

* Você usará o Pandas para carregar, explorar e entender melhor seus dados.

#### scikit-learn

A biblioteca scikit-learn é como você pode desenvolver e praticar aprendizado de máquina em Python. Isso é construído sobre e requer o ecossistema SciPy. O nome scikit sugere que é um plug-in SciPy ou kit de ferramentas. O foco da biblioteca são algoritmos de aprendizado de máquina para classificação, regressão, agrupamento e muito mais. Ele também fornece ferramentas para tarefas relacionadas, como avaliação de modelos, ajuste parâmetros e dados de pré-processamento.

Como o Python e o SciPy, o scikit-learn é de código aberto e pode ser usado comercialmente sob o BSD licença. Isso significa que você pode aprender sobre aprendizado de máquina, desenvolver modelos e colocá-los em operações com o mesmo ecossistema e código. Um motivo poderoso para usar o scikit-learn.

In [2]:
# scipy
import scipy
print(f'scipy: {scipy.__version__}')

# numpy
import numpy
print(f'numpy: {numpy.__version__}')

# matplotlib
import matplotlib
print(f'matplotlib: {matplotlib.__version__}')

# pandas
import pandas
print(f'pandas: {pandas.__version__}')

# scikit-learn
import sklearn
print(f'sklearn: {sklearn.__version__}')

scipy: 1.8.1
numpy: 1.23.0
matplotlib: 3.5.2
pandas: 1.4.3
sklearn: 1.1.1


In [3]:
%reload_ext watermark
%watermark -a "Caique Miranda" -gu "caiquemiranda" -iv

Author: Caique Miranda

Github username: caiquemiranda

pandas    : 1.4.3
scipy     : 1.8.1
numpy     : 1.23.0
sklearn   : 1.1.1
matplotlib: 3.5.2



### End.