# Bibliotecas

Como mencionado na seção 1, bibliotecas são conjuntos de códigos e funções que ampliam as capacidades do Python para além do que é permitido pela biblioteca padrão. Considerando que as necessidades gerais dos usuários são muitas vezes comuns, diferindo apenas em seus objetivos específicos, economizam-se tempo e recursos ao se utilizarem pacotes pré-programados, em vez de se "reinventar a roda" a cada demanda.

Como exemplo simples, retornamos ao seno da seção 1. Diversas aplicações, de física a engenharia e economia, empregam funções trigonométricas. É muito mais conveniente importar a biblioteca `math` e utilizar sua função `sin()` que programar uma função seno a cada código em que ela for necessária.

# Instalação de bibliotecas

Muitas bibliotecas de uso frequente já estão instaladas nos ambientes mais comuns, como Google Colab ou Anaconda.

Para as ausentes, existem diversos modos de baixar e instalar, sendo o mais comum o comando `pip install <biblioteca>`.

In [1]:
%pip install scipy



# Importação de bibliotecas

Para que sejam utilizadas no código, é necessário importar as bibliotecas com o comando `import`. É boa práticar importar todas as bibliotecas necessárias no início do *script*. As funções são utilizadas empregando a estrutra `biblioteca.função`, como no exemplo.

In [4]:
#Importa as bibliotecas
import numpy
import pandas
import math
import scipy

#Declara as variáveis
z = numpy.nan
x = (math.pi/6)

#Realiza a operação seno
y1 = math.cos(z)
y2 = math.sin(x)

#Imprime o resultado
print(y1)
print(y2)

#Cria o dataframe
df = pandas.DataFrame({'variavel':('x','z'),
                       'valor_var':(x,z),
                       'resultado_op':(y2,y1)})

#Exibe o dataframe
display(df)


nan
0.49999999999999994


Unnamed: 0,variavel,valor_var,resultado_op
0,x,0.523599,0.5
1,z,,


Neste código, importam-se três bibliotecas: `numpy`, `math` e `scipy`. A variável *z* é criada empregando-se a função `nan` da bibliotec `numpy`, que confere valores *NaN* a variáveis. Já a variável *x* é criada dividindo a constante `pi` da biblioteca `math`. Para obter-se as variáveis *y1* e *y2*, são usadas as funções `cos()` e `sin()` da biblioteca `math` em `z` e `x`, respectivamente. Finalmente, é criado um dataframe, empregando a função `DataFrame()` da biblioteca `pandas`. Falaremos mais sobre essa estrutura na próxima seção. Os resultados são exibidos por meio das funções `print()` e `display()`. Como são funções built-in, dispensam a aposição do pacote antes de seu nome.

**Atenção:** a importação de bibliotecas consome recursos computacionais. Importe apenas as bibliotecas necessárias para seu código. No exemplo, a biblioteca `scipy` é importada, mas nunca é utilizada, podendo ser excluída.

A importação de bibliotecas admite algumas variações. Bibliotecas utilizadas frequentemente no código podem receber um *alias* (ou máscara) por meio do comando `as` em `import`.

In [5]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

As funções devem ser referenciadas da maneira `alias.função`, quando do instanciamento de um alias.

**Atenção:** crie alias apenas para bibliotecas frequentemente utilizadas no código.

In [6]:
#Importa as bibliotecas
import numpy as np
import pandas as pd
import math as mt

#Declara as variáveis
z = np.nan
x = (mt.pi/6)

#Realiza a operação seno
y1 = mt.cos(z)
y2 = mt.sin(x)

#Imprime o resultado
print(y1)
print(y2)

#Cria o dataframe
df = pd.DataFrame({'variavel':('x','z'),
                       'valor_var':(x,z),
                       'resultado_op':(y2,y1)})

#Exibe o dataframe
display(df)

nan
0.49999999999999994


Unnamed: 0,variavel,valor_var,resultado_op
0,x,0.523599,0.5
1,z,,


Caso utilizemos poucas funções de uma biblioteca, é ótimo em termos de recursos importar somente elas, em vez do pacote inteiro. Para isso, empregamos `from` antes do comando `import`.

In [7]:
from statsmodels.formula import api
from sklearn.feature_selection import RFE
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from statsmodels.stats.outliers_influence import variance_inflation_factor

Neste caso, podemos utilizar o nome da função diretamente, sem antepor a biblioteca.

In [8]:
#Importa as bibliotecas
from numpy import nan
from pandas import DataFrame
from math import pi, cos, sin

#Declara as variáveis
z = nan
x = (pi/6)

#Realiza a operação seno
y1 = cos(z)
y2 = sin(x)

#Imprime o resultado
print(y1)
print(y2)

#Cria o dataframe
df = DataFrame({'variavel':('x','z'),
                       'valor_var':(x,z),
                       'resultado_op':(y2,y1)})

#Exibe o dataframe
display(df)

nan
0.49999999999999994


Unnamed: 0,variavel,valor_var,resultado_op
0,x,0.523599,0.5
1,z,,
