# Módulos e pacotes

- Em Python, um módulo é um arquivo (script) que contém código Python e pode ser importado em outros arquivos Python. Ele é usado para compartilhar funções, classes e variáveis entre arquivos.
- Já um pacote é uma coleção de módulos organizados em uma estrutura de diretórios. Ele permite a divisão de um aplicativo em múltiplos módulos, o que facilita a manutenção e o desenvolvimento. Tem a extensão .py e pode ser importado em outro script usando o comando import

Visite o PyPi, repositório de pacotes da Linguagem Python: https://pypi.org/


In [1]:
import numpy # Importando um pacote Python
from numpy import sqrt # importante uma função específica de um módulo
numpy.sqrt(25) # Usando um dos métodos do pacote Numpy

dir(numpy) # Verificando todos os métodos e atributos disponíveis no pacote
help(sqrt) # Help do método sqrt do pacote Numpy

Help on ufunc:

sqrt = <ufunc 'sqrt'>
    sqrt(x, /, out=None, *, where=True, casting='same_kind', order='K', dtype=None, subok=True[, signature, extobj])
    
    Return the non-negative square-root of an array, element-wise.
    
    Parameters
    ----------
    x : array_like
        The values whose square-roots are required.
    out : ndarray, None, or tuple of ndarray and None, optional
        A location into which the result is stored. If provided, it must have
        a shape that the inputs broadcast to. If not provided or None,
        a freshly-allocated array is returned. A tuple (possible only as a
        keyword argument) must have length equal to the number of outputs.
    where : array_like, optional
        This condition is broadcast over the input. At locations where the
        condition is True, the `out` array will be set to the ufunc result.
        Elsewhere, the `out` array will retain its original value.
        Note that if an uninitialized `out` array is 

# Listas de dados (Manipulação de arquivos)

- Objetos de arquivos interagem com arquivos, como áudio, texto, Excel etc
- Pacotes, bibliotecas ou módulos permitem a interação com arquivos

## Principais tipos de arquivos

TXT:
- TXT é a extensão de arquivo para arquivos de texto puro. Um arquivo TXT é um arquivo de texto simples sem formatação, como negrito, itálico ou fontes diferentes. 
- Ele pode ser aberto e editado com muitos aplicativos diferentes, incluindo editores de texto, processadores de texto e IDEs. 
- Arquivos TXT são amplamente utilizados para armazenar dados de texto simples, como listas, notas e documentos de texto. 
- Eles são universais e podem ser lidos em praticamente qualquer dispositivo ou sistema operacional.

CSV:
- CSV (Comma-Separated Values) é um formato de arquivo que armazena dados tabulares em formato de texto plano. 
- Cada linha do arquivo CSV representa uma linha da tabela e as colunas são separadas por vírgulas. 
- É amplamente utilizado para exportar e importar dados em diferentes aplicações, como planilhas e banco de dados. 
- É uma opção simples e universal para compartilhar dados, pois pode ser aberto e editado com muitos aplicativos diferentes, incluindo programas de planilha e editores de texto.

JSON:
- JSON (JavaScript Object Notation) é um formato de dados de texto simples e leve que é utilizado para transmitir informações em aplicações web. 
- É baseado em uma estrutura de objetos JavaScript e usa pares de chave-valor para representar dados. 
- É facilmente lido e escrito por máquinas e é amplamente utilizado como formato de intercâmbio de dados em aplicações web modernas.

## Manipular arquivos usando bibliotecas nativas do Python

Métodos básicos:
- open() #usada para abrir o arquivo
- read() #usada para ler o arquivo
- write() #usada para gravar no arquivo
- seek() #retorna para o início do arquivo
- readlines() #retorna a lista de linhas do arquivo
- close() #fecha o arquivo

In [2]:
# Leitura de arquivos
arq1 = open("aula10/arquivo1.txt", "r", encoding='utf8')  # Abrindo o arquivo para leitura (r)
print(arq1.read())  # Lendo o arquivo
print(arq1.seek(0,0))  # Retornar para o início do arquivo
print(arq1.read(10))  # Ler os primeiros 10 caracteres
print(arq1.tell())  # Contar o número de caracteres
print(arq1.seek(0,0))  # Retornar para o início do arquivo


FileNotFoundError: [Errno 2] No such file or directory: 'aula10/arquivo1.txt'

In [None]:
# Gravação de arquivos

arq2 = open("aula10/arquivo1.txt", "w")  # Abrindo arquivo para gravação (w)
# Quando abre para gravação, não permite a leitura (read)
arq2.write("Testando gravação de arquivos em Python ")  # Gravando arquivo
arq2.close()  # fechando arquivo após gravação
arq2 = open("arquivos/arquivo1.txt", "r")  # Lendo arquivo gravado
print(arq2.read())

In [None]:
# Criação de novo arquivo (solicitando nome do arquivo)

fileName = input("Digite o nome do arquivo: ")  # Solicita o nome para o novo arquivo
fileName = fileName + ".txt"  # acrescenta a extensão
arq3 = open(fileName, "w")  # Abrindo novo arquivo para gravação (w)
arq3.write("Incluindo texto no arquivo criado")  # acrescenta conteúdo ao arquivo
arq3.close()
arq3 = open(fileName, "r")
print(arq3.read())
arq3.close()


In [None]:
# Abrir dataset em csv e agrupar em linhas e colunas

f = open('aula10/salarios.csv', 'r')  #abre o arquivo CSV
dados = f.read()  #carrega os dados em uma variável
linhas = dados.split('\n')
dados_novo = []  # cria lista vazia para receber os dados
for linha in linhas:  # percorre cada linha de linhas
    linha_div = linha.split(",")  # divide o conteúdo da linha usando o separador (split)
    dados_novo.append(linha_div)  # adiciona o conteúdo dividido à lista criada antes
print(dados_novo)

count = 0
for linha in dados_novo:  # utilizando para contar as linhas da base
    count += 1 
print(count)

count = 0
for column in dados_novo[0]:  # utilizando para contar as colunas da primeira [0] linha da base
    count = count + 1
print(count)


In [None]:
# com with não precisa fechar o arquivo ao terminar

#utilizar with para abrir arquivo
with open('aula10/cientista.txt','r') as arquivo: # com o arquivo aberto
    conteudo = arquivo.read() #conteudo recebe o conteúdo do arquivo

print(len(conteudo)) # imprime o tamanho do texto
print(conteudo) # imprime o conteúdo

#utiliar with para gravar arquivo
with open('aula10/cientista.txt','w') as arquivo: 
    arquivo.write('Cientista de Dados') # usando slice pra fatiar parte do texto
    arquivo.write('\n') # imprime parágrafo
    arquivo.write('uma excelente alternativa de carreira')


## Desafio: Usando bibliotecas do Python

Exercício1 - Solicite ao usuário o nome do arquivo e utilize para criar um arquivo em formato .TXT. Depois, solicite ao usuário a digitação de um texto e grave o texto dentro do arquivo criado anteriormente
- Exigência: deve utiilizar métodos e funções já inclídas no Python

In [None]:
nome = input("Digite o nome do arquivo: ")  # Solicita o nome para o novo arquivo
nome = nome + ".txt"  # acrescenta a extensão
arq = open(nome, "w")  # Abrindo novo arquivo para gravação (w)
texto = input("Digite o conteúdo do arquivo: ") # solicita o conteúdo do arquivo
arq.write(texto)  # acrescenta conteúdo ao arquivo
arq.close()
arq = open(nome, "r")
print(arq.read())
arq.close()

## Manipular CSV usando pacote CSV

CSV é um pacote de recursos para leitura e escrita de dados tabulares em formato CSV

Documentação: https://docs.python.org/pt-br/3/library/csv.html

In [None]:
# Importando o módulo csv
import csv

# abrir arquivo números para escrita
with open('aula10/numeros.csv','w') as arquivo:
    writer = csv.writer(arquivo) # checa se arquivo existe, cria e abre para edição
    writer.writerow(('primeira','segunda','terceira')) # writerow vai escrever uma linha no arquivo
    writer.writerow((55,93,76)) 
    writer.writerow((62,14,86))


In [None]:
# Leitura de arquivos csv
with open('aula10/numeros.csv','r' , encoding='utf8', newline = '\r\n') as arquivo: # abrir arquivo para leitura. Encoding evita problema de formato e newline garante que linha em branco não gere problema
    leitor = csv.reader(arquivo) # ler o arquivo csv
    for x in leitor: # percorre as linhas do arquivo     
        print(x) # imprime a linha
    print ('Número de colunas:', len(x)) # imprime o número de colunas da linha

# Gerando uma lista com dados do arquivo csv
with open('aula10/numeros.csv','r') as arquivo:
    leitor = csv.reader(arquivo)
    dados = list(leitor)
    
print (dados)

# Imprimindo a partir da segunda linha da lista
for linha in dados[1:]:
    print (linha)



## Desafio: Usando pacote CSV

Exercício 2 - Crie um arquivo com o nome exe2.csv e escreva os dados da seguinte tabela neste arquivo. 
- Exigência: Deve utilizar pacote CSV 

Mês | Receita | Lucro operacional
----| ------- | -----------------
Jan | 80000   | 23430.30
Fev | 92430   | 25120.50
Mar | 79300   | 20200.00
Abr | 85454   | 26333.89

In [None]:
# Importando o módulo csv
import csv

# abrir arquivo números para escrita
with open('exe2.csv','w') as arquivo:
    writer = csv.writer(arquivo) # checa se arquivo existe, cria e abre para edição
    writer.writerow(('Mês','Receita','Lucro operacional')) # writerow vai escrever uma linha no arquivo
    writer.writerow(('Jan',80000,23430.30)) 
    writer.writerow(('Fev',92430,25120.50)) 
    writer.writerow(('Mar',79300,20200.00)) 
    writer.writerow(('Abr',85454,26333.89)) 


Exercício 3 - Percorra o arquivo criado acima e apresente os dados, uma linha por vês. Ao final das linhas, apresente o número de colunas e de linhas do arquivo. 
- Exigência: não deve apresentar ou contar as linhas em branco. deve utilizar a função with para facilitar a leitura

In [None]:
# Leitura de arquivos csv
with open('exe2.csv','r' , newline = '\r\n') as arquivo: 
    leitor = csv.reader(arquivo) # ler o arquivo csv
    cont_linhas = 0
    for linha in leitor: # percorre as linhas do arquivo     
        print(linha) # imprime a linha
        cont_linhas = cont_linhas + 1
    print ('Número de colunas:', len(x)) # imprime o número de colunas da linha
    print ('Número de linhas:', cont_linhas)

## Manipular CSV usando pacote Pandas

Pandas é um pacote (Anaconda) de recursos para manipulação de arquivos e análise de dados 

Doc1: https://pandasguide.readthedocs.io/en/latest/index.html

Doc2: https://www.w3schools.com/python/pandas/default.asp

In [3]:
# caso a IDE não encontre o pacote pandas, é preciso instalar primeiro
!pip install pandas



In [4]:
# aciona o pacote pandas e cria um alias (apelido) para facilitar
import pandas as pd  

arquivo = "salarios.csv"  # abrir arquivo csv
df = pd.read_csv(arquivo, sep=';')  # importa dados para a variável df usando a função read_csv
df.head()  # ler as primeiras linhas da dataset (padrão de 5 primeiras linhas)

FileNotFoundError: [Errno 2] No such file or directory: 'salarios.csv'

In [None]:
print(df.info()) 

In [None]:
df = pd.read_csv(arquivo, sep=';')  # importa dados para a variável df usando a função read_csv
pd.options.display.max_rows = 999 #forma de quebrar a regra de 60 linhas como padrão do print
print(df)

In [None]:
# contagem de linhas da base
print(len(df))

In [None]:
# contagem de elementos de uma coluna
df['Department'].value_counts()

In [None]:
# ler as últimas linhas da base
print(df.tail()) 

In [None]:
#adicionando mais uma linha ao dataframe
df1 = pd.DataFrame({'Name': ['João'], 'Position Title': ['Policial'], 'Department': ['Polícia'], 'Employee Annual Salary': [120000]})
df2 = df.append(df1)
print(df2.tail())

In [None]:
# criar agrupamento e apresentar os códigos de cada grupo
print(df.groupby('Department').groups)

# criar novo data a partir do agrupamento
df3 = df.groupby('Department')
df3.first() #apresenta a primeira linha de cada grupo


In [None]:
df.groupby('Department').sum() # agrupar utilizando uma das colunas e soma (ou concatena) demais colunas
df.groupby('Department').mean() #agrupar e calcular a média para as demais colunas numéricas

In [None]:
# criação de gráficos a  partir dos dataframes
import matplotlib.pyplot as plt

# gráfico de linha
df.plot()
plt.show()

In [None]:
# gráfico de dispersão
df.plot(kind = 'scatter', x = 'Department', y = 'Employee Annual Salary')
plt.show()

In [None]:
# gráfico do tipo histograma
df["Employee Annual Salary"].plot(kind = 'hist')

In [None]:
#help(df)

## Desafio: Usando pacote Pandas

Exercício 4 - Leia o arquivo empresa1.csv e apresente os resultados 3 primeiros resultados da tabela usando o método head()
- Exigência: deve utilizar o pacote pandas

In [None]:
import pandas as pd  

arquivo = "aula10/empresa1.csv" 
dfe = pd.read_csv(arquivo, sep=';') 
dfe.head(3) 

Exercício 5 - Apresente os dados do dataframe utilizando gráficos. Crie um gráfico de linha, simples, que apresente todos os indicadores ao longo do tempo. Crie um gráfico de dispersão para ajudar na relação entre EBITDA e Lucro operacional. Crie um histograma do Lucro do período. 

In [None]:
import matplotlib.pyplot as plt

dfe.plot()
plt.show()

In [None]:
dfe.plot(kind = 'scatter', x = 'EBITDA', y = 'Lucro operacional')
plt.show()

In [None]:
dfe["Lucro do período"].plot(kind = 'hist')

Exercício 6 - Agrupe a base acima por ano, em um novo dataframe, e apresente a soma das demais colunas

In [None]:
dfe.groupby('Ano').mean()

## Manipular arquivo JSON usando pacote JSON

JSON é um pacote útil na manipulação de arquivos e registro de configurações, principalmente em aplicações WEB

Documentação: https://docs.python.org/pt-br/3/library/json.html

JSON  |  Python
------|-------
object | dict
array | lista
string | str
number (int) | int
number (real) | float
true | True
false | False
null | None


In [None]:
# Importando o módulo Json
import json

# Criando um dicionário
dict = {'nome': 'Guido van Rossum',
        'linguagem': 'Python',
        'similar': ['c','Modula-3','lisp'],
        'users': 1000000}

# Convertendo o dicionário para um objeto json
json.dumps(dict)

# Criando um arquivo Json
with open('aula10/dados.json','w') as arquivo:
    arquivo.write(json.dumps(dict))

# Leitura de arquivos Json
with open('aula10/dados.json','r') as arquivo:
    texto = arquivo.read()
    data = json.loads(texto)
print (data)
print (data['nome']) # imprime dado v de um dos itens k


In [None]:
# Imprimindo um arquivo Json copiado da internet
from urllib.request import urlopen # habilita pacote urlopen
response = urlopen("http://vimeo.com/api/v2/video/57733101.json").read().decode('utf8') # lê arquivo json da internet
data = json.loads(response)[0] # salva dados do arquivo json em nova variável
print ('Título: ', data['title'])
print ('URL: ', data['url'])
print ('Duração: ', data['duration'])
print ('Número de Visualizações: ', data['stats_number_of_plays'])


In [None]:
# Copiando o conteúdo de um arquivo para outro usando pacote OS
import os
arquivo_fonte = 'aula10/dados.json'
arquivo_destino = 'aula10/json_data.txt'
open(arquivo_destino,'w').write(open(arquivo_fonte,'r').read()) # escreve no arquivo destino o que leu no arquivo fonte
