# **Relambrando o Python**

O objetivo desse tutorial é relembrar elementos importantes e básicos do Python que serão relevantes ao longo do curso. Portanto, seu objetivo não é prover informações aprofundadas e abrangentes da linguagem. Quando essas forem desejadas, as referências apresentadas ou materias digitais de boa qualidade serão as fontes mais adequadas para o aprofundamento.

Bom estudo! :-)

# **Tipos de Dados**


---

O trecho 1 abaixo ilustra os principais tipos de dados encontrados no Python.

Note que, diferente de outras linguagens de programação 
fortemente tipadas, o Python **NÃO** requer que você determine 
qual é o tipo de dados de uma variável **ANTES** de seu uso. Portanto, é uma classe de linguagem de programação denominada de Dynamically Typed.

In [None]:
# ------------
# Trecho 1 - Tipos dados Python
# ------------
name = 'Abraham Lincoln'
print( type( name ) )
name = 6.33999999999999999999999999999000000000000000000006
print( type( name ) )
name = 305127925769258727938193819283
print( type( name ) )
name = True
print( type( name ) )

# **Estrutura de Dados**

Além dos mencionados acima, o Python oferece outros tipos de dados mais complexos e interessantes na manipulação de dados, incluindo as discutidas nos trechos abaixo 
strings (str), lists (list), dictionaries (dict), tuples (tuple) ou vetores (array). Outras estruturas que vale à pena você saber mais são stacks, queues, priority queues, multisets, structs, maps e hask tables.

In [None]:
# ------------
# Trecho 2.a - Estruturas do Python
# String: sequência de um ou mais caracteres
# ------------
s = 'Hello world!'
print('O tamanho da string: ', len( s ))
print('O caracter na setima posicao na string: ', s[6])
print('Os caracteres entre a terceira e oitava posição: ', s[2:8] )
print('O caracter na segunda posição contado a partir do fim da string: ', s[-2])
print('Os três caracteres contados a partir do fim da string', s[-3:12])
print(s + ' ' + 'I am here')

In [None]:
# ------------
# Trecho 2.b - Estruturas do Python
# List: lista de valores ordenados
# ------------
l = [1,2,3,4,5]
print('O tamanho da lista: ', len(l))
print('O valor na terceira posicao na string: ', l[2])
print('Os valores na segunda e terceira posição na lista: ', l[1:3])
print('O valor na segunda a partir do fim da lista: ', l[-2])
print('Os três valores contados a partir do fim da lista: ', l[-3:5])
m = [-20,-30,-40]
print( l + m )

In [None]:
# ------------
# Trecho 2.c - Estruturas do Python
# Dict: coleção de pares chave-valor
# ------------
d = { '91': 'Edson Arantes do Nascimento' }
d['92'] = 'Lionel Messi'
d['93'] = 'Dept of Computer Science'
print(d)
print('Quem é O cara: ', d['91'] )

In [None]:
# ------------
# Trecho 2.d - Estruturas do Python
# Tuple: lista de valores ordenados onde a posição do valor possui um significando semântico, 
# como atributos de um tupla de um banco de dados relacional
# ------------
t = ( 2013, 10, 28, 14, 15, 0 )
print('O tamanho da tupla: ', len(t))
print('O valor na terceira posicao na tupla: ', t[0])
print('Os valores na segunda e terceira posição na lista: ', t[1:3])
print('O valor na segunda a partir do fim da lista: ', t[-2])
print('Os três valores contados a partir do fim da lista: ', t[-3:6])
t1 = (-20,-30,-40)
print( t + t1 )

In [None]:
# ------------
# Trecho 2.e - Estruturas do Python
# Vetores: Armazena múltiplos valores em uma única variável.
# É possível utilizar a idea de vetores por meio de uma lista (list) ou utilizando a
# biblioteca Numpy (caso discutido baixo)
# ------------

# Importando NUMPY
import numpy as np

# Cria um vetor bidimensional, tbém conhecida como matriz NxM
vetorBidim = np.array([[2,3,5,7],[11,13,17,19], [23,29,30,37,], [41,43,47,49]])
print('Qual é o meu tipo de dado?', vetorBidim.dtype)
print('Qual é minha dimensionalidade e com quantos elementos?', vetorBidim.shape)
print('Os elementos da linha 1 e coluna 1 são: ', vetorBidim[0,:], vetorBidim[:,0])
print('Obtendo elementos a partir dos extremos: ', vetorBidim[0,-1], vetorBidim[-1,0])
print('Cortando o vetor bidimensional: ', vetorBidim[1:3,[1,3]])
print('Cortando o vetor bidimensional: ', vetorBidim[1:3,1:3])
vetorFiltro = vetorBidim%2 == 0
print('Eu quero uma vetor de valores pares!', vetorBidim[vetorFiltro])

# É possível determinar o tipo de dados no momento da definição do vetor
vetorUnidim = np.array([1, 20, 3, -4], dtype='S')
print('Qual é o meu tipo de dado?', vetorUnidim.dtype)
print('Qual é o meu tipo de dado?', vetorUnidim[1:3])
print('Qual é minha dimensionalidade e com quantos elementos?', vetorUnidim.shape)
print('Meu vetor ordenado', np.sort(vetorUnidim))


# Geração randômica de vetores
vetorRand = np.random.randint(100, size=(3, 5))
print('Meu vetor randômico', vetorRand) 


# **Condicionais**

Instruções condicionais permitem determinar quais declarações são executadas ou quantas vezes.

In [None]:
# ------------
# Trecho 3 - Condicionais no Python
# IF - estrutura de decisão 
# For/While - estruturas de repetição cujo conteúdo é posicional (deve estar tabulado como abaixo)
# ------------
grade = [7.5, 3.2, 9.1]
for g in grade:  # O ':' é obrigatório!
    if g >= 9:   # O ':' é obrigatório!
      passed = True
      letter = 'A'
    elif g >= 8:
      passed = True
      letter = 'B'
    elif g >= 6:
      passed = True
      letter = 'C'
    elif g >= 5:
      passed = True
      letter = 'D'
    else:
      passed = False
      letter = 'F'
    print( g, passed, letter )

# **Manipulando Arquivos TEXTO**

Arquivos cujos valores são separados por tamanhos pré-estabelecidos, isto é, sem o uso de qualquer separador.

In [None]:
# ------------
# Trecho 4 - Manipulação de Arquivos Texto no Python
# ------------

# Carga do Pydrive - API que facilita o acesso a arquivos no Google Drive
from pydrive.auth import GoogleAuth
from pydrive.drive import GoogleDrive
from google.colab import auth
from oauth2client.client import GoogleCredentials

#
auth.authenticate_user()
gauth = GoogleAuth()
gauth.credentials = GoogleCredentials.get_application_default()
drive = GoogleDrive(gauth)

# Uma vez realizada a autenticação, carregamos para o COLAB corrente o arquivo informado
# Note que esse operação tornará o arquivo disponível na seção ARQUIVOS
# Ao encerrar a seção, este arquivo desaparece
downloaded = drive.CreateFile({'id':"1bNCVd2jtqctBz5xB1OOzrluCSSjzZXrG"})   # replace the id with id of file you want to access
downloaded.GetContentFile('arquivoTEXTO.txt')

# 1o. Parm: Nome do Arquivo
# 2o. Parm: Modo de Acesso - leitura (r), Gravação com truncagem do arquivo (w), Append no final do arquivo (a), dentre outros
# 3o. Parm: Coding / Encoding dos caracteres
inp = open( 'arquivoTEXTO.txt', 'r+', encoding='utf8' )
line = inp.readlines()
print(' Esse arquivo possui ', len (line), ' linhas' )
for l in line:
  print (l)

# Acrescentando uma linha no final do arquivo
var = '\r\n' + 'Pale shelter        Tears for Fears' + '\r\n'
inp.write(var)

# Volta ao início do arquivo e apresenta o novo conteúdo
inp.seek(0)
print ('\n \n Temos um novo conteúdo.....')
line = inp.readlines()
for l in line:
  print (l)

# Fecha arquivo
inp.close()

# **Manipulando Arquivos CSV**

Arquivos cujos valores são separados por vírgula (usualmente), mas também podem apresentar outros separadores como ponto-e-vírgula, espaço ou tabulação. Para a manipulação desses arquivos iremos utilizar a biblioteca PANDAS.

Os trechos de código abaixo apresentam:

*   Trecho 5.a: Carga do Arquivo CSV utilizado para sua sessão
*   Trecho 5.b: Manipulação do Arquivo via PANDAS - Características
*   Trecho 5.c: Manipulação do Arquivo via PANDAS - Filtro e Acesso linha-a-linha






In [None]:
# ------------
# Trecho 5.a - Manipulação de Arquivos Texto no Python
# Carga do Pydrive - API que facilita o acesso a arquivos no Google Drive
# Essa operação carrega um arquivo que está em um certo GDrive para a sua sessão GColab
# ------------
from pydrive.auth import GoogleAuth
from pydrive.drive import GoogleDrive
from google.colab import auth
from oauth2client.client import GoogleCredentials
#
auth.authenticate_user()
gauth = GoogleAuth()
gauth.credentials = GoogleCredentials.get_application_default()
drive = GoogleDrive(gauth)

# Uma vez realizada a autenticação, carregamos para o COLAB corrente o arquivo informado
# Note que esse operação tornará o arquivo disponível na seção ARQUIVOS
# Ao encerrar a seção, este arquivo desaparece
downloaded = drive.CreateFile({'id':"1c0FiLWc3TftkY07nK4zx3WX5Ry-3hMfw"})   # replace the id with id of file you want to access
downloaded.GetContentFile('population.csv')

In [None]:
# ------------
# Trecho 5.b - Manipulação de Arquivos Texto no Python
# Utiliza biblioteca PANDAS para carregar os dados CSV e obter suas características
# PANDAS - biblioteca de data manipulation que estende o NUMPY
# ------------
import pandas as pd

#
fi = pd.read_csv('population.csv')

# Caracteristicas do Arquivo
print('Qual é o meu tipo? \n', type(fi))
print('Qual é o meu número de Linhas e Colunas? \n', fi.shape)
print('Quais são minhas Colunas? \n', fi.columns)
print('Informações estatísticas (só para atributos numéricos) \n', fi.describe())
print('Espaço ocupado \n',fi.dtypes)

# Caracteristicas de um Atributo específico, por exemplo, Year
print('Qual é o domínio do atributo? \n', fi.Year.unique())

# Nossa PRIMEIRA Visualização
fi.Year.plot.hist()

In [None]:
# ------------
# Trecho 5.c - Manipulação de Arquivos Texto no Python
# Utiliza biblioteca PANDAS para carregar os dados CSV e obter suas características
# PANDAS - biblioteca de data manipulation que estende o NUMPY
# ------------

# É necessário executar o trecho 5.a!!!
fi = pd.read_csv('population.csv')

# Manipulando valores Linha-por-Linha de colunas específicas
print ('\n Leitura linha-a-linha....\n')
for index, row in fi.iterrows():
    print('Linha: ', index, 'Pais: ', row['Country Name'], 'Populacao :', row['Value'])
    if index > 5:
       break

# Filtrando valores por POSIÇÃO
print ('\n Filtros por blocos....\n')
print('Os valores de uma das colunas do arquivo: \n', fi[['Country Code','Value']])
print('As linhas 20 e 294 de uma coluna específica \n', fi.loc[[20, 294], ['Country Name']])
print('As 4 primeiras e últimas linhas \n', fi[:4])
print('As 4 últimas linhas \n', fi[-4:])
print('As linhas 20 a 24 \n', fi[20:24])

# Filtrando valores por CONDIÇÃO
print ('\n Filtros por condição....\n')
fiFiltered = fi[fi['Year'] == 1972]
print ('\n Quantos registros de 1972? \n', fiFiltered.shape[0])
fiFiltered = fi[(fi['Year'] >= 1970) & (fi['Year'] <= 1990)]
print ('\n Quantos registros entre 1970 e 1990? \n', fiFiltered.shape[0])
fiFiltered = fi[fi['Country Name'].str.lower().str.contains("br")]
print ('\n Quantos registros possuem br no nome do pais? \n', fiFiltered.shape[0])
fiFiltered = fi[fi['Year'].isin ([1972,1981,1990])]

# Liberando espaço ao eliminar o dataframe
del fi

# **Funções**

Mecanismo elegante que permite organizar o código.

O trecho 7.a apresenta a definição de uma função e sua chamada ordinária em qualquer ponto de um programa. Por sua vez, o trecho 7.b apresenta como aplicar uma função utilizando PANDAS.

In [None]:
# ------------
# Trecho 7.a - Funções no Python
# ------------

# Define uma função que realiza o cálculo de FIBONACCI
def fib( n ):
  if n <= 0:
    return 0
  elif n == 1:
    return 1
  else:
    return fib( n - 1 ) + fib( n - 2 )

# Uma vez definida a funão, pode-se chamá-la à vontade
print (fib (2))
print (fib (5))

In [None]:
# ------------
# Trecho 7.b - Funções no Python
# Utilizando PANDAS
# ------------

# É necessário executar o trecho 5.a!!!
fi = pd.read_csv('population.csv')

# Filtra somente registros de certo país
fiFiltered = fi[fi['Country Name'].str.lower().str.contains("brazil") & (fi['Year'].isin([1980,1990,2000]))]
total = fiFiltered.Value.sum()

# Define função que realiza o cálculo do percentual frente ao total
def CalculatePercentage(v):
    return v/total*100

# Aplica a função sobre o atributo 'value'
fiFiltered.Value = fiFiltered.Value.apply(CalculatePercentage)
print (fiFiltered)