<p style="text-align:center; font-size: 0.875em; color:White; background-color:DodgerBlue;">Prof. Cláudio Fleury - Set/2021</p>  

# Introdução

Existem duas versões principais da linguagem Python: **Python 2** e **Python 3**, e por sinal, são bem diferentes. Este curso usará a versão **Python 3**, por ela oferecer suporte a recursos mais recentes e pela outra versão que já não tem mais suporte desde 2022.

**Python** é uma linguagem muito simples e tem uma sintaxe muito direta. A instrução mais simples em Python é a que realiza a saída de dados: `print()` - ela imprime uma linha e também inclui a mudança para uma nova linha.

Para imprimir uma *string* em Python 3, basta escrever:  
(para executar a seguinte célula de código: <font color="blue" face="Verdana, Geneva, sans-serif" size="-1">selecione a célula e tecle </font>`[Shift]+[Enter]` ou `[Ctrl]+[Enter]`)

In [3]:
print("Curso de Introdução à Linguagem Python 3 - Turma 202308")

Curso de Introdução à Linguagem Python 3 - Turma 202308


# Elementos da Linguagem Python

<ul><li><b>Vocabulário</b>: nomes de variáveis e palavras reservadas</li>
    <li><b>Sentenças</b>: padrões de sintaxe válida</li>
    <li><b>Textos</b>: programa para resolver um problema</li>
    <li><b>Gramática</b>: regras</ul>

## 1. Palavras Reservadas
Não podem ser usadas como identificadores de variáveis, funções ou classes.
<img src="img/palavras_reservadas.png" alt="Relação de Palavras reservadas na Ling. Python" width=350px>  

| Palavra-chave | Descrição
|:---:|:---
|and| Um operador lógico
|as| Para criar um apelido (*alias*)
|assert| Para depuração (*debugging*)
|break| Para interromper um laço de repetição
|class| Para definir uma classe
|continue| Para continuar na próxima iteração de um laço
|def| Para definir uma função do usuário
|del| Para excluir um objeto
|elif| Usado em declarações condicionais (**senão se**)
|else| Usado em declarações condicionais (**senão**)
|except| Usado no tratamento de exceções (o que fazer quando ocorre uma exceção)
|False| Valor booleano, resultado de operações de comparação
|finally| Usado em exceções (bloco de cód. sempre executado)
|for| Para criar um laço `for`
|from| Para importar partes específicas de um módulo
|global| Para declarar uma variável global
|if| Para fazer uma declaração condicional
|import| Para importar um módulo
|in| Para verificar se um valor está presente em uma lista, tupla, etc.
|is| Para testar se duas variáveis são iguais
|lambda| Para criar uma função anônima
|None| Representa um valor nulo
|nonlocal| Para declarar uma variável não local
|not| Um operador lógico
|or| Um operador lógico
|pass| Uma declaração nula (declaração que não faz nada)
|raise| Para levantar (gerar) uma exceção
|return| Para sair de uma função e retornar um valor
|True| Valor booleano, resultado de operações de comparação
|try| Para fazer uma tentativa... com tratamento de exceção
|while| Para criar um laço com teste no início
|with| Usado para simplificar o tratamento de exceções
|yield| Para finalizar uma função, retorna um gerador

In [4]:
import keyword
print(keyword.kwlist, len(keyword.kwlist))

['False', 'None', 'True', '__peg_parser__', 'and', 'as', 'assert', 'async', 'await', 'break', 'class', 'continue', 'def', 'del', 'elif', 'else', 'except', 'finally', 'for', 'from', 'global', 'if', 'import', 'in', 'is', 'lambda', 'nonlocal', 'not', 'or', 'pass', 'raise', 'return', 'try', 'while', 'with', 'yield'] 36


## 2. Sentenças

Podem ser formadas a partir do uso dos elementos da linguagem, tais como: variáveis, operadores, constantes, palavras reservadas, funções, classes etc.

```python
x = 2                # atribuição de uma constante numérica à variável 'x'
x = x + 100          # atribuição de expressão aritmética à variável 'x'
print(x)             # função de apresentação de valor da variável 'x' (saída de dados)
```
Essas sentenças serão interpretadas pela linguagem na ordem em que são apresentadas, ou seja, de cima para baixo, uma a uma.

>* A primeira sentença, **`x = 2`**, armazena a informação à direita do operador de atribuição `=`, nesse caso a constante numérica **`2`**, à variável chamada **`x`**.  
>* A segunda sentença, **`x = x + 100`**, armazena o resultado da expressão à direita do operador de atribuição **`=`**, nesse caso o valor **`102`**, à variável chamada **`x`**.  
>* E a terceira sentença **`print(x)`** mostra o valor corrente da variável **`x`**, nesse caso o valor **`102`**, na parte inferior da mesma célula do Jupyter Notebook com essa sequência de sentenças (*script*).  


In [6]:
x = 2                # atribuição de uma constante numérica à variável 'x'
x = x + 100          # atribuição de expressão aritmética à variável 'x'
print(x)             # função de apresentação de valor da variável 'x' (saída de dados)

102


## 3. Textos (*Scripts* Python)
* Execuções interativas (usando o interpretador padrão) são boas para experimentos e programas de 3 a 4 linhas.
* A maioria dos programas efetivos possuem mais de 4 linhas, e geralmente digitamos os comandos em um arquivo (*script*) e dizemos ao Python para executar os comandos existentes naquele arquivo. De certa forma, estamos dando um roteiro (*script*) a ser seguido pelo interpretador Python.
* Por convenção, usamos `.py` como extensão dos arquivos com roteiros Python.

### Interativo  X  Script
No modo **interativo** o usuário digita as sentenças Python diretamente na linha de comandos, logo depois do *prompt* **`>>>`**, e finaliza a sentença com um [Enter]. Na sequência o interpretador analisa a sentença, e se estiver correta, ele apresenta o resultado do comando.

No modo ***script*** o interpretador Python executará, um a um, os comandos existentes no arquivo informado pelo usuário como *script*.

In [7]:
# Script 1
# Função criada pelo usuário
def dobro(x):
    print(x * 2)

dobro(200)
dobro(-23.44)

400
-46.88


In [8]:
# Script 2
# Mostra a palavra e a qtde de ocorrências em um texto gravado em arquivo (.txt)
nomearq = input("Arquivo: ")
arq = open(nomearq)
contagens = {}                 # dicionário vazio
for linha in arq:
    palavras = linha.split()
    for palavra in palavras:
        contagens[palavra] = contagens.get(palavra,0) + 1
contmaior = None
palavfreq = None
for palavra, contagem in contagens.items():
    if contmaior is None or contagem > contmaior:
        palavfreq = palavra
        contmaior = contagem
print(f"Palavra mais frequente '{palavfreq}', com {contmaior} ocorrências.")

Arquivo: curso.txt
Palavra mais frequente 'Google', com 4 ocorrências.


In [8]:
print(contagens)

{'Nate,': 1, 'da': 1, 'equipe': 1, 'do': 2, 'Google': 4, 'Colab,': 1, 'compartilha': 1, 'recursos': 1, 'menos': 1, 'conhecidos': 1, 'mas': 1, 'poderosos': 1, 'Colaboratory,': 1, 'que': 1, 'lhe': 1, 'permitem': 1, 'explorar': 1, 'dinamicamente': 1, 'o': 2, 'Pandas': 1, 'DataFrames,': 1, 'ver': 1, 'seu': 2, 'histÃ³rico': 1, 'de': 1, 'comandos': 1, 'executados': 1, 'no': 1, 'notebook': 1, 'e': 1, 'impulsionar': 1, 'sua': 1, 'produtividade.': 1, 'Ã©': 2, 'um': 2, 'bom': 2, 'companheiro,': 2, 'ninguÃ©m': 1, 'pode': 1, 'negar.': 1, 'comandos,': 5}


### Estruturas de Controle do Fluxo de Execução do *Script*

* Sequencial
```python
x = 2
print(x)
x = x + 100
print(x)
```

* Condicional (Alternativa)
```python
x = 12
if x < 10:
     print("Menor que 10")
if x > 20:
     print("Maior que 20")
print("Fim.")
```

* Repetição (Laço)
```python
n = 0
while n < 10:
     print(n+1)
     n = n + 1
print("Fim.")
```

## 4. Regras
### 4.1 Recuo (Indentação)
A ling. Python usa **indentação** para delimitar blocos de comandos, em vez de chaves, como na ling.s C/C++. Pode-se usar tabulações ou espaços em branco, mas o recuo padrão determina quatro espaços. Por exemplo:

In [7]:
x = 1
if x == 1:
    # recuo de 4 espaços em branco
    print("x é 1.")
y = 33

x é 1.


### 4.2 Exercício
Use a função `print()` para imprimir **'Olá, Mundo!'**.

In [5]:
print("Olá, Mundo!")

Olá, Mundo!


## 5. Tipos de Dados
Tipos de dados são a classificação ou categorização de itens de conhecimento. Eles representam o tipo útil que informa quais operações podem ser executadas em dados específicos. Como tudo na programação Python é um objeto, os **tipos de dados** são definidos por **classes** e as variáveis **objetos** (são instâncias) dessas classes.

Python define o **tipo de dados** de uma variável com base no valor que é atribuído a ela. O interpretador Python altera dinamicamente o tipo da variável se um novo valor, de diferente tipo de dado, for atribuído à variável.



### 5.1 Números  

| Tipo | Formato | Descrição |  
| :--- | :---: | :--- |  
| int | a = 10 | Inteiro com sinal, também podem ser representados em octal e hexadecimal |  
| float | a = 45.67 | (.) Valores reais de ponto flutuante |  
| complex | a = 3.14J | (J) Contém um número inteiro no intervalo de 0 a 255.|  

Python faz a conversão de variáveis automaticamente. Pode-se usar funções de conversão do Python: `int(), long(), float(), complex()` para converter dados de um tipo pra outro. Além disso, a função `type()` retorna informações sobre como os dados são armazenados em uma variável.

In [4]:
mensagem = 'Bom dia'
n = 85
pi = 3.14159

print(type(mensagem))           # Isso retornará uma string
print(type(n))                  # Isso retornará um inteiro
print(type(pi))                 # Isso retornará um real

<class 'str'>
<class 'int'>
<class 'float'>


### 5.2 Strings
Uma string é uma sequência ordenada de caracteres. Strings são uma espécie de arranjo (_array_). Como muitas outras linguagens de programação, strings em Python são **vetores de bytes** que representam caracteres **Unicode**. No entanto, o Python não possui um tipo de dados específico para caractere: um único caractere é simplesmente uma string de comprimento unitário.

Cria-se uma **string** colocando caracteres delimitados por aspas (simples: ', duplas: " ou triplas: '''). Somente as strings entre aspas triplas ''' continuam automaticamente no final da instrução de linha.

In [8]:
prenome = 'joão'
sobrenome = 'silva'
mensagem = '''Esta é uma string que se estenderá por várias linhas. Usando caracteres de nova linha
e sem espaços para as próximas linhas. O final das linhas dentro desta string também
conta como uma nova linha quando impressa'''
print(prenome.title(), sobrenome.title())
print(mensagem)

João Silva
Esta é uma string que se estenderá por várias linhas. Usando caracteres de nova linha
e sem espaços para as próximas linhas. O final das linhas dentro desta string também
conta como uma nova linha quando impressa


No Python temos dois tipos de strings: **Unicode** e **bytestrings**, ou seja, strings são armazenadas como caracteres ou como bytes, respectivamente. 

Uma **bytestring**, também chamada de **string normal**, sempre é codificadas com __UTF-8__ e não carrega qualquer informação com ela sobre sua codificação. (Por esta razão, o __Django__ assume que toda **bytestring** é codificado com **UTF-8**. Na maioria dos casos quando o __Django__ está lidando com strings, ele as converterá para __Unicode__ antes de mais nada. Então, como uma regra geral, se você passa uma **bytestring**, esteja preparado para receber uma string __Unicode__ de volta no resultado).

Se seu código usa somente dados **ASCII**, então ele é seguro para usar **strings normais**, passando-as à vontade, porque o **ASCII** é um sub-conjunto do **UTF-8**.

Páginas de códigos usuais para língua portuguesa usada no Brasil: 850, 1252, 65001.
<img src="img/code_page.png" width=500)>

Strings armazenadas como caracteres são representadas como **Unicode** em Python 2 ou **str** em Python 3. A especificação de uma string Unicode pode ser feita adicionando 'u' antes da string. Por exemplo, `u'hello'` será uma string Unicode (Python 2).

Strings armazenadas como bytes são representadas como **str** em Python 2 ou **bytes** em Python 3. A especificação de uma string de bytes pode ser feita adicionando 'b' antes da string. Por exemplo, `b'hello'` será uma string de bytes.

Formato de texto `UTF-8` (_8-bit Unicode Transformation Format_) é um tipo de codificação binária de comprimento variável (1 a 4 bytes/caracter) que representa qualquer caractere universal padrão do Unicode, sendo também compatível com o ASCII (128 caracteres: Unicode U+0000 a U+007F). São necessários dois bytes para caracteres Latinos com diacríticos[^1], assim como para caracteres dos alfabetos Grego, Cirílico, Armênio, Hebraico, Sírio e Thaana (Unicode U+0080 a U+07FF).  

Quatro bytes pode parecer muito para um caractere (*code point*), mas muito raramente são utilizados. Além disso, **UTF-16** (a principal alternativa ao **UTF-8**) necessita também de quatro bytes para os *code points*. A definição de qual dos dois é mais eficiente (UTF-8 ou UTF-16) depende da variedade de *code points* usados. 

Um caractere com um _code point_ abaixo de `U+0080` é codificado com apenas um byte que contém o seu _code point_, os quais correspondem exatamente aos 128 caracteres do ASCII de 7 bits.

<hr>
[^1]: Um diacrítico é um sinal gráfico que se coloca sobre, sob ou através de uma letra para alterar a sua fonética, isto é, o seu som, ou para marcar qualquer outra característica linguística.

In [15]:
type('IFG'), type(b'IFG'), type(u'IFG')

(str, bytes, str)

### 5.3 Listas
**Lista** é um tipo de variável muito útil no armazenamento de uma série de itens de dados delimitados por colchetes, [ ], e separados por vírgula(s). 

In [9]:
A = [ ]                 # variável do tipo lista, em branco
B = [1, 23, 45, 67]     # variável do tipo lista de 4 números
C = [2, 4, 'joão']      # uma lista podem conter diferentes tipos de dados

### 5.4 Tuplas
Tupla é um agrupamento de itens, tal como numa lista, e são manipuladas de maneira semelhante. Mas, as tuplas são fixas em tamanho quando são atribuídas. Em Python, são consideradas imutáveis em comparação a uma lista, que é mutável em tamanho e itens. Tuplas são delimitadas por parênteses, ( ).

In [10]:
grupo = ('jesuíno', 'gafanhoto', 'felizberto', 'florinda')

Tuplas são mais rápidas que listas. Se você está definindo um conjunto constante de valores e tudo o que você vai fazer com ele é percorrê-lo (iterar por ele), então use uma tupla em vez de uma lista.

### 5.5 Dicionários
Dicionários em Python são listas de pares **Chave:Valor**. Este é um tipo de dados muito poderoso para armazenar informações relacionadas, que podem ser associadas por meio de chaves. A principal operação de um dicionário é extrair um valor baseado no nome da chave. 

Ao contrário das listas, onde são usados números de índice para se acessar um item da lista, os dicionários permitem o uso de uma chave para acessar seus membros. Os dicionários também podem ser usados para classificar, iterar e comparar dados.

Os dicionários são delimitados por chaves, { }, com pares separados por uma vírgula (,) e os valores de chave separados por dois pontos (:). Em dicionários a **Chave** deve ser única. Exemplo de como usar dicionários:

In [11]:
quartos = {'joão': 405, 'maria': 202}
quartos['joão'] = 605      # defina o valor associado à chave 'joão' para 605
print (quartos['maria']) 
quartos['josé'] = 305      # acrescenta uma novo par: chave 'josé' com o valor 305
print (quartos.keys())     # imprime uma lista das chaves no dicionário
print('josé' in quartos)   # testa para ver se 'josé' está no dicionário --> True.

202
dict_keys(['joão', 'maria', 'josé'])
True


# Fim.
<p style="text-align:right;"><a href='../Índice.ipynb' target="_self">Volta ao Índice</a></p>

## Referências 

1. [Python para Todos (pdf)](http://do1.dr-chuck.com/pythonlearn/PT_br/pythonlearn.pdf), 2020, em português.  
2. [Python Data Types (site)](https://developer.rhino3d.com/guides/rhinopython/python-datatypes/)

Obs.: Para iniciar a extensão **nbextension** no browser sempre que um novo notebook for carregado:

          $ jupyter nbextension enable rise --py --sys-prefix