# Introdução à linguagem Python para Ciência de Dados - Conceitos intermediários

Neste notebook apresentamos diversos conceitos importantes da linguagem Python. Embora seja possível fazer diversas analises conhecendo apenas o básico da linguagem, analises mias avançadas demandam que os cientistas tenham um maior dominio do Python.


## Tipos de Variáveis e formatação de strings

Variáveis possuem tipos e frequentemente precisamos fazer uma conversão entre estes tipos. O exemplo abaixo declara e converte várias variáveis.

In [1]:
area1 = 30
area2 = "45"
area3 = 35.5

print("Valores: ", area1, area2, area3)
print("Tipos: ", type(area1), type(area2), type(area3))

area1 = str(area1) #converte para String
area2 = float(area2) #converte para Float
area3 = int(area2) #converte para Inteiro

print("Novos valores: ", area1, area2, area3)
print("Novos tipos: ", type(area1), type(area2), type(area3))

Valores:  30 45 35.5
Tipos:  <class 'int'> <class 'str'> <class 'float'>
Novos valores:  30 45.0 45
Novos tipos:  <class 'str'> <class 'float'> <class 'int'>


Um tipo importante de viariável é o tipo *String* (texto). Frequentemente precisamos construir Strings que combinem diversos valores. Um método útil neste caso é o `format`, que permite a substituição de pontos marcados com chaves ({}) por valores passados como parâmetro.

In [2]:
area1 = 45
area2 = 60

frase1 = "Área 1 = {}, Área 2 = {}.".format(area1, area2)
print(frase1)

Área 1 = 45, Área 2 = 60.


O método `format` também permite a formatação da aparência dos números. Abaixo construímos a string de forma a ter dois dígitos decimais para os valores de aluguel:

In [3]:
aluguel1 = 780
aluguel2 = 1100

print("Aluguel 1 = {:.2f}, Aluguel 2 = {:.2f}.".format(aluguel1, aluguel2))

Aluguel 1 = 780.00, Aluguel 2 = 1100.00.


## Dicionários

Dicionário é um tipo de dado que nos permite dar nomes aos valores armazenados. Por exemplo, para armazenar as características de um imóvel, podemos definir um dicionário como no exemplo abaixo:

In [4]:
apartamento1 = {"endereco": "Av V. Guarapuava, 1000", "area": 45, "aluguel": 800}
apartamento1

{'endereco': 'Av V. Guarapuava, 1000', 'area': 45, 'aluguel': 800}

Podemos preencher e acessar os valores do dicionário separadamente:

In [5]:
apartamento2 = {}

apartamento2["endereco"] = "Av Sete de Setembro, 170"
apartamento2["area"] = 53
apartamento2["aluguel"] = 950

print(apartamento2)
print(apartamento2['aluguel'])

{'endereco': 'Av Sete de Setembro, 170', 'area': 53, 'aluguel': 950}
950


Podemos criar uma lista de dicionários e acessar os valores como demonstrado abaixo:

In [6]:
apartamentos = [apartamento1, apartamento2]

print("Aluguel do Apartamento 2:", apartamentos[1]["aluguel"])
print("Todos os Apartamentos:" , apartamentos)

Aluguel do Apartamento 2: 950
Todos os Apartamentos: [{'endereco': 'Av V. Guarapuava, 1000', 'area': 45, 'aluguel': 800}, {'endereco': 'Av Sete de Setembro, 170', 'area': 53, 'aluguel': 950}]


## Operadores de controle de fluxo

Ao escrever um programa, muitas vezes precisamos mudar a ação a ser tomada dependendo do estado das nossas variáveis. O operador mais utilizado neste caso é o `if`. Por exemplo, abaixo imprimimos uma frase dependendo do valor do aluguel:

In [7]:
aluguel = 1300

if (aluguel < 900): print("Barato")
if (aluguel >= 900 and aluguel < 1400): print("Médio")
if (aluguel >= 1400): print("Caro")

Médio


Caso precisemos executar vários comandos dentro de um mesmo `if`, devemos escrever um bloco de comandos. No Python, blocos de comando não possuem delimitadores. Os blocos são definidos pelo alinhamento (indentação) dos comandos como no exemplo abaixo:

In [8]:
aluguel = 2300

if (aluguel > 2000): 
    # início do bloco -- as linhas abaixo estão 4 espaços à direita da linha do if
    print("Concedendo desconto..")
    desconto = 20 # 20% de desconto
    aluguel = aluguel - (aluguel * (desconto/100))

print("Valor final:", aluguel)

Concedendo desconto..
Valor final: 1840.0


Um comando `if` pode ter um bloco de execução alternativa. Um bloco iniciado por `else` só é executado se o teste do `if` falhar (for falso). Veja o exemplo abaixo:

In [9]:
aluguel = 1300

if (aluguel < 900): 
    print("Barato")
else: 
    if (aluguel < 1400): 
        print("Médio")
    else: 
        print("Caro")

Médio


Outra operação importante é o `for`, que nos permite iterar sobre uma lista e executar ações associadas aos seus valores. No exemplo abaixo percorremos a lista de apartamentos definida anteriormente para calcular a média dos aluguéis:

In [10]:
total_aluguel = 0
numero_apartamentos = 0

for ap in apartamentos:
    total_aluguel = total_aluguel + ap["aluguel"]
    numero_apartamentos = numero_apartamentos + 1

media = total_aluguel/numero_apartamentos
print("Média: ", media)

Média:  875.0


## Operações de comparação e lógicas

No exemplo do comando `if` acima, pode-se notar a comparação `aluguel < 900`. Esta operação retorna valores Booleanos True (verdadeiro) ou False (falso). Veja abaixo diversos exemplos de comparações. 

In [11]:
print("50 > 30", 50 > 30) # maior
print("50 >= 30", 50 >= 30) # maior ou igual
print("50 == 50", 50 == 50) # igual
print("50 != 50", 50 != 50) # diferente

50 > 30 True
50 >= 30 True
50 == 50 True
50 != 50 False


Qualquer operação que retorne True or False pode ser estendida em uma operação lógica. Usamos parênteses para delimitar operações diferentes. Por exemplo, para testar se um valor de aluguel está entre 900 e 1000, podemos usar o operador lógico AND:

In [12]:
aluguel = 950

(aluguel >= 900) and (aluguel <= 1000)

True

Os outros operadores lógicos são o OR e o NOT:

In [13]:
aluguel = 900
condominio = 600

not ((aluguel > 1000) or (condominio > 500))

False

## List Comprehensions

List Comprehension é uma forma simplificada para se construir novas listas a partir de listas existentes. Por exemplo, abaixo definimos uma lista de números e criamos uma nova lista com estes números ao quadrado:

In [14]:
numeros = [5, 3, 7, 2]

quadrados = [numero * numero for numero in numeros]

print(quadrados)

[25, 9, 49, 4]


Usando a lista de apartamentos definida acima, podemos criar uma lista com os preços por metro quadrado dos apartamentos:

In [15]:
print(apartamentos)

custo_por_m2 = [ap['aluguel']/ap['area'] for ap in apartamentos]

custo_por_m2

[{'endereco': 'Av V. Guarapuava, 1000', 'area': 45, 'aluguel': 800}, {'endereco': 'Av Sete de Setembro, 170', 'area': 53, 'aluguel': 950}]


[17.77777777777778, 17.92452830188679]

O código acima é equivalente ao código abaixo:

In [16]:
custo_por_m2 = []

for ap in apartamentos:
    custo = ap['aluguel']/ap['area']
    custo_por_m2.append(custo)

custo_por_m2

[17.77777777777778, 17.92452830188679]

## Funções

Funções agrupam uma porção do código com um objetivo específico. As funções possuem parâmetros que permitem "personalizar" a execução a cada chamada. Abaixo definimos uma função que calcula o valor total a ser pago mensalmente em um apartamento:

In [17]:
def total_a_pagar(aluguel, condominio, taxa): # define 3 parâmetros
    total_taxa = condominio * taxa/100 # calcula valor da taxa (percentual sobre condomínio)
    total = aluguel + condominio + total_taxa
    return total # valor retornado pela função

# Chamadas à função:
total1 = total_a_pagar(1000, 300, 10)
total2 = total_a_pagar(1400, 450, 5)

print(total1, total2)

1330.0 1872.5


Funções podem ter parâmetros default. Quando especificamos um valor default, só precisamo passá-lo como parâmetro se quisermos usar um valor diferente. A função abaixo demonstra isto, definindo o valor default da taxa como 10%:

In [18]:
def total_a_pagar2(aluguel, condominio, taxa = 10): # define 3 parâmetros
    total_taxa = condominio * taxa/100 # calcula valor da taxa (percentual sobre condomínio)
    total = aluguel + condominio + total_taxa
    return total # valor retornado pela função

print("Total: ", total_a_pagar2(1000, 300))

Total:  1330.0


Podemos também chamar a função deixando os nomes dos parâmetros explícitos. Assim não precisamos seguir a mesma ordem da definição da função na hora de passar os parâmetros:

In [19]:
total = total_a_pagar2(condominio = 300, aluguel = 1000)

print("Total: ", total)

Total:  1330.0


### Exercício

Defina e use uma função que recebe como parâmetro uma lista de apartamentos (use a lista `apartamentos` definida acima). A função deve calcular e retornar a média do aluguel dos apartamentos.

In [20]:
# Resposta:

aluguel_total = 0

for ap in apartamentos:
    aluguel_total += ap['aluguel']

mean = aluguel_total / len(apartamentos)
print("Media aluguel: ", mean)

Media aluguel:  875.0


## Classes

Classes são usadas para representar valores e operações de forma integrada. Por exemplo, abaixo definimos uma classe `Apartamento` para armazenar os valores de aluguel/condomínio e também oferecer uma função (método) para calcular o total. 

In [21]:
class Apartamento:
    #definições de inicialização da classe
    def __init__(self, aluguel, condominio):
        # self neste caso é uma referência à instância da classe (objeto)
        self.aluguel = aluguel
        self.condominio = condominio

    def calcular_total(self):
        return self.aluguel + self.condominio
# Inicializando uma instância
ap1 = Apartamento(1000, 300)

# Alterando o valor de um atributo
ap1.condominio = 400

# Chamando um método
print("Total: ", ap1.calcular_total())

Total:  1400
