# Introdução à linguagem Python para Ciência de Dados

Este notebook tem como objetivo cobrir conceitos básicos sobre a linguagem Python para uso em tarefas de Ciência de Dados. Os conceitos abaixo já são suficientes para começar a aprender sobre as ferramentas de ciência de dados. Conceitos mais avançados da linguagem serão explorados em outro Notebook. 

Execute cada célula de código abaixo para ver o resultado da execução dos comandos. Para executar uma célula, clique sobre ela e então clique no ícone `Run` na barra de ferramentas acima.

Para aprender outros conceitos e praticar a linguagem Python, os seguintes sites são recomendados:

- [W3 Schools - Python](https://www.w3schools.com/python/)
- [Python Brasil](https://python.org.br/introducao/)

## Comandos e Variáveis

Uma linguagem de programação nos permite controlar o que o computador deve fazer através de comandos. Por exemplo, abaixo estamos requisitando que o computador imprima uma mensagem.

In [1]:
# O código abaixo imprime uma mensagem na tela
print("Olá Mundo!")

Olá Mundo!


**Variáveis** são usadas para armazenar valores. Sempre que temos que armazenar algo para uso futuro, podemos inicializar uma variável com o valor desejado. Por exemplo, abaixo inicializamos uma variável chamada `mensagem` com o valor `"Olá Mundo!!!"`. As aspas indicam que o valor armazenado é uma *String* (texto). 

In [1]:
mensagem = "Olá Mundo!!!"

print(mensagem)

Olá Mundo!!!


Variáveis também podem armazenar valores numéricos. Abaixo definimos duas variáveis contendo números *Inteiros*. Em seguida estas variáveis são usadas para iniciar uma terceira variável, que neste caso contém o resultado de uma operação de adição.

In [3]:
area1 = 45
area2 = 60

total = area1 + area2

print(total)

print("Área total:", total)

105
Área total: 105


Para que um comando seja ignorado ou para deixar claro o que uma linha de código está fazendo, podemos usar **comentários de código**. Basta iniciar a linha a ser comentada com um `#`. Veja exemplos abaixo.

In [3]:
area1 = 45
area2 = 60

# Total recebe a soma de area1 e area2
total = area1 + area2

print("Área total:", total)

Área total: 105


### Operações

Na célula acima utilizamos a operação de soma para obter o valor total da área. As demais operações matemáticas básicas são:

- Subtração: -
- Multiplicação: *
- Divisão: /


### Exercício

Execute abaixo os comandos necessários para calcular a média das áreas usando as variáveis definidas acima. Imprima o resultado com o comando `print`.

In [4]:
# Responda aqui

media = total / 2
print("Media:", media)


Media: 52.5


## Listas

Listas são variáveis que armazenam sequências de valores. Abaixo definimos duas listas contendo informações sobre apartamentos (rua, área e valor do aluguel). 

In [14]:
apartamento1 = ["Av V. Guarapuava, 1000", 45, 800]
apartamento2 = ["Av Sete de Setembro, 170", area2, 700 + 250]

print(apartamento1)
print(apartamento2)

['Av V. Guarapuava, 1000', 45, 800]
['Av Sete de Setembro, 170', 60, 950]


Para ter acesso a um valor dentro de uma lista, usamos o índice do item desejado entre colchetes. Por exemplo, abaixo obtemos o valor do terceiro item da lista `apartamento1`. Perceba que os índices iniciam do 0, por isso o primeiro valor é de índice 0, o segundo de índice 1, etc. 

In [15]:
apartamento1 = ["Av V. Guarapuava, 1000", 45, 800]

aluguel1 = apartamento1[2]

aluguel1

800

Também podemos atribuir um novo valor em uma posição de índice. Abaixo atribuimos o valor 850 para o terceiro item da lista.

In [16]:
apartamento1[2] = 850

apartamento1

['Av V. Guarapuava, 1000', 45, 850]

Podemos criar listas vazias como na primeira linha abaixo. Para adicionar valores em uma lista (vazia ou não), usa-se o método `append`. Abaixo adicionamos informações sobre um outro apartamento, um valor por vez.

In [17]:
apartamento3 = []

apartamento3.append("Av Marechal Deodoro, 2130")
apartamento3.append(50)
apartamento3.append(1050)

apartamento3

['Av Marechal Deodoro, 2130', 50, 1050]

Podemos também criar uma lista que contém outras listas. Abaixo criamos a lista `apartamentos` que contém os três apartamentos definidos anteriormente.

In [18]:
apartamentos = [apartamento1, apartamento2, apartamento3]

apartamentos

[['Av V. Guarapuava, 1000', 45, 850],
 ['Av Sete de Setembro, 170', 60, 950],
 ['Av Marechal Deodoro, 2130', 50, 1050]]

Podemos acessar cada apartamento usando os índices, como anteriormente:

In [19]:
apartamentos[1]

['Av Sete de Setembro, 170', 60, 950]

Para acessar valores nas listas internas, primmeiro especificamos o índice na lista principal seguido do índice na lista interna. Por exemplo, abaixo obtemos o terceiro valor do segundo apartamento na lista.

In [20]:
apartamentos[1][2]

950

### Exercício

Adicione um novo apartamento à lista *apartamentos* (defina os dados como preferir). Calcule a área média dos apartamentos contidos na lista.

In [21]:
# Responda aqui
apartamentos.append(["Av Jorge Amado, 20", 100, 2000])

total_areas = 0
for ap in apartamentos:
    total_areas += ap[1]

media_areas = total_areas / len(apartamentos)

print("Media areas:", media_areas)

Media areas: 63.75


## Importação de módulos

Módulos no Python são pacotes que adicionam funcionalidades à linguagem. Por exemplo, o módulo `math` possui diversas funções matemáticas úteis, como potência, raiz quadrada, etc. Abaixo importamos este módulo e imprimimos alguns valores:

In [22]:
import math

print(math.pi)

3.141592653589793


Podemos dar apelidos aos módulos. Abaixo usamos o apelido `m` para o módulo `math`.

In [23]:
import math as m

# imprime a raiz quadrada de 4
print(m.sqrt(4))

2.0


Podemos também importar funções individuais. Abaixo importamos apenas a função `sqrt`. Desta forma não precisamos usar o nome do módulo ao chamar a função.

In [24]:
from math import sqrt

print(sqrt(4))

2.0
