# Tipos de Dados

> Um **tipo de dado** define uma coleção de valores de dados e um conjunto de operações predefinidas sobre eles. Programas de computador produzem resultados por meio da manipulação de dados. Um fator importante para determinar a facilidade com a qual eles realizam suas tarefas é quão bem os tipos de dados disponíveis na linguagem usada casam com objetos do mundo real do problema tratado. Logo, é crucial uma linguagem oferecer suporte para uma coleção apropriada de tipos e estruturas de dados.

## Tipos Primitivos

Tipos de dados não definidos em termos de outros são chamados de `tipos de dados primitivos`. Praticamente todas as linguagens de progrmação fornecem um conjunto de tipos de dados primitivos.

### Tipos numéricos

#### Inteiro

É o tipo mais comum. Os hardwares suportam vários tamanhos de inteiros. Alguns dos tamanhos são suportados nativamente por algumas linguagens de programação, por exemplo os tipos (com sinal) `short`, `int` e `long`. Linguagens como `C`, `C++` e `C#` incluem também inteiros sem sinal.

<br>

#### Ponto flutuante

É o tipo de dado que modela os números reais, ou aproximação de determinados valores ($\pi$, por exemplo).

Valores de ponto flutuante são representados como frações e expoentes, uma forma emprestada da notação científica. A maioria dos computadores mais modernos usa o formato padrão para ponto flutuante da `IEEE`, chamdo `IEEE Padrão de Ponto Flutuante 754` (*`IEEE Floating-Point Standard 754`*). A maioria das linguagens incluem dois tipos: `float` e `double`, onde o primeiro é o tamanho padrão, normalmente armazenado em 4 bytes, enquanto o segundo (de dupla precisão) costuma ocupar o dobro de armazenamento.

Em `Python` é implementado somente o `float`, porém comumente como equivalente ao `double` da linguagem `C`.

A coleção de valores que podem ser representados por um tipo de ponto flutuante é definida em bits de sinal, expoente e fração. Por exemplo, o `float32` (float de 32 bits) é definido da seguinte forma: 1 bit de sinal, 8 bits para expoente e 23 bits para fração. Maiores detalhes [neste link](https://en.wikipedia.org/wiki/Single-precision_floating-point_format).

<br>

#### Complexo

Valores complexos são representados como pares ordenados de valores de ponto flutuante. Em `Python`, a parte imagináveis de um literal complexo é especificada seguindo-a por `j` ou `J`. Exemplo: `(7 + 3j)`.

<br>

### Tipos booleanos

É, possivelmente, o tipo mais simples, pois só possui dois valores. Em `Python` os valores booleanos são as palavras `True` e `False`. Porém é comum sua representação através dos inteiros `0` (falso) e `1` (verdadeiro).

<br>

### Caracteres

Dados na forma de caracteres são armazenados nos computadores como codificações numéricas. Tradicionalmente, a codificação mais utilizada era a ASCII (*American Standard Code for Information Interchange*) de 8 bits.

Devido à globalização e, consequentemente, a necessidade de os computadores se comunicarem de forma adequada, o [`Consórcio Unicode`](https://en.wikipedia.org/wiki/Unicode_Consortium) publicou em 1991 o padrão `UCS-2` (*Universal coded Character Set 2*), um conjunto de caracteres de 16 bits, geralmente chamada de `Unicode`, o qual incliu os caracteres da maioria das linguagens naturais do mundo.

Atualmente vem se tornando padrão o `UTF-8` (*UCS Transformation Format*), que associa uma sequência de 1 a 4 bytes com cada caractere `Unicode`. O tamanho variável da codificação tem seu motivo na eficiência, uma vez que 1 byte é suficiente para codificar os caracteres mais comuns.

<br>

### Cadeias de caracteres

Uma palavra, ou uma frase, é uma `cadeia de caracteres`. Linguagens como `C` tratam palavras ou frases como um `vetor` ou `array` de caracteres, finalizados por um caractere nulo `\0` ou uma quebra de linha `\n`. Linguagens mais modernas, como `Java` e `Python` tratam as cadeias de caractere como um "tipo primitivo" chamado `String`, facilitando bastante sua manipulação.

---

## Estruturas de Dados

As `estruturas de dados` mais comuns nas linguagens são os `arrays`, também conhecidos como `vetores`. Consistem basicamente em uma `lista` unidimensional indexada.

Quando o `array`/`vetor` possui duas ou mais dimensões, então temos uma `matriz`, onde cada elemento é indexado por pelo menos dois valores (um para linha e outro para coluna).

Cada linguagem possui seu próprio conjunto de estruturas de dados implementada de forma nativa, possibilitando também a implementação de outros tipos de estrutura ou ainda sua combinação.

Em `Python`, as estruturas de dados nativas são:

* `Listas`;
* `Strings`;
* `Tuplas`;
* `Conjuntos (Sets)`;
* `Dicionários`.

<br>

### Listas

Uma lista é uma sequência ordenada separada por vírgula `,` e envolto em colchetes `[ ]`.

In [1]:
# Lista vazia
vazia = []

In [2]:
# Lista de valores inteiros e pares
pares = [2, 4, 6, 8, 10]

In [3]:
# Lista com tipos de dados diferentes
diferentes = [1, 2.0, True, complex(2, 3)]

Acessando elementos individuais ou um grupo de elementos. A sintaxe é `a:b`, onde `a` é o primeiro índice, incluso, e `b` é o último índice, porém não incluso. Exemplo: `0:6`, inclui os índices de 0 a 5.

In [4]:
pares[0]

2

In [5]:
# Acessando o último elemento da lista
diferentes[-1]

(2+3j)

In [7]:
pares[0:2]

[2, 4]

In [8]:
pares[3:]

[8, 10]

In [9]:
diferentes[:3]

[1, 2.0, True]

Concatenando listas

In [10]:
lista_concatenada = pares + diferentes
lista_concatenada

[2, 4, 6, 8, 10, 1, 2.0, True, (2+3j)]

Adicionando elementos à lista

In [11]:
# No índice desejado

pares.insert(0, 0)
pares

[0, 2, 4, 6, 8, 10]

In [12]:
# Ao fim da lista

diferentes.append('a')
diferentes

[1, 2.0, True, (2+3j), 'a']

In [13]:
# Múltiplos elementos ao fim da lista
diferentes.extend([complex(1, 2), 'b'])
diferentes

[1, 2.0, True, (2+3j), 'a', (1+2j), 'b']

Modificando elementos da lista

In [14]:
print(pares)
pares[0] = -2
pares

[0, 2, 4, 6, 8, 10]


[-2, 2, 4, 6, 8, 10]

Criando uma matriz como uma lista de listas

In [54]:
matriz = [[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]]
matriz

[[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]]

In [61]:
# Imprimindo uma matriz de forma "estilizada"

linhas, colunas = 3, 4

for linha in range(linhas):
    for coluna in range(colunas):
        print(matriz[linha][coluna], end=" ")
    print()

1 2 3 4 
5 6 7 8 
9 10 11 12 


In [62]:
# Forma elegante de se criar uma matriz (usando [list comprehension](https://www.geeksforgeeks.org/python-list-comprehension-and-slicing/))

matriz = [[coluna for coluna in range(4)] for linha in range(4)]
 
print(matriz)

[[0, 1, 2, 3], [0, 1, 2, 3], [0, 1, 2, 3], [0, 1, 2, 3]]


Contudo, manipular matrizes é mais fácil ao se utilizar a biblioteca [Numpy](https://numpy.org/).

<br>

### Strings

Uma `String`, como já vimos, é um conjunto de caracteres. Em `Python` uma `String` pode ser expressa com aspas simples `' '` ou aspas duplas `" "`. Uma `String` pode ser também associada a uma variável e, portanto, ser manipulada.

Para imprimir algum conteúdo no terminal é preciso utilizar a função `print`. E, caso você queira "ler" algum conteúdo do terminal, basta utilizar a função `input`.

Vimos, há pouco, que um comentário de 1 linha pode ser escrito ao se utilizar `#` antes. Se você necessitar de um comentário, ou string de várias linhas, basta utilizar aspas simples ou duplas três vezes: `''' ... '''`.

In [15]:
a = 'Minha String'
a

'Minha String'

In [16]:
a = "Minha String"
a

'Minha String'

In [17]:
"""
Comentário com
várias
linhas
"""
a = 'Olá mundo!'
a

'Olá mundo!'

In [18]:
'''
Comentário com
várias
linhas
'''
a = 'Olá de novo mundo!'
a

'Olá de novo mundo!'

In [19]:
# A função input recebe como parâmetro a mensagem que será mostrada ao usuário
a = input("Escreva alguma coisa: ")

print(a)

Mensagem do usuário


`Strings` podem ser `concatenadas` com o operador de adição `+`. Ao mesmo tempo, você pode repetir uma string ao multiplicá-la por algum valor escalar.

In [20]:
a = 'Es'
b = 'tringue'

a+b

'Estringue'

In [21]:
a = 'Ra'
b = 'ta'

a + 3*b

'Ratatata'

In [22]:
a = 'ta'
b = 'ravô'

5*a + b

'tatatatataravô'

Lembrando que uma string é um `conjunto` de caracteres, é possível acessar cada caractere da string.

In [23]:
a = 'Olá mundo!'

a[0]

'O'

In [24]:
# De uma posição até o fim
a[3:]

' mundo!'

In [25]:
# A última posição
a[-1]

'!'

In [26]:
# A função len retorna o comprimento. Neste caso, o comprimento da String, incluindo os espaços vazios
len(a)

10

In [27]:
# Strings são imutáveis. Não dá para trocar o 'O' pelo 'A'
a[0] = "A"
a

TypeError: 'str' object does not support item assignment

Como é um conjunto, então é também possível `iterar` sobre uma string:

In [28]:
for i in a:
    print(i)

O
l
á
 
m
u
n
d
o
!


<br>

### Tuplas

Tuplas são quase idênticas a listas, ou seja, são uma sequência ordenada de valores ou elementos, os quais podem ser de diferentes tipos. São duas as principais diferenças:

1. Tuplas são imutáveis.
2. Tuplas são envoltas em parênteses `( )`.

Uma vez que são imutáveis, não é possível adicionar ou remover elementos de uma tupla. Por causa disso, é possível criar `constantes` com múltiplos valores, os quais podem ser acessados mais rapidamente do que em uma lista.

In [29]:
# Tupla vazia
tupla_vazia = ()

In [30]:
# Criando uma tupla vazia com a função nativa
tupla_vazia = tuple()

In [31]:
# Tupla com apenas 1 elemento
tuplinha = (1, ) # tem que ter a vírgula, mesmo que tenha só 1 elemento

In [32]:
# Tupla de inteiros
tuplint = (1, 2, 3, 4)
tuplint

(1, 2, 3, 4)

In [33]:
# Tupla de tipos diferentes, sem usar os parênteses
tupliferente = 1, 2.0, complex(4, 5), 'Que?'

Tuplas também podem ser concatenadas

In [34]:
tupla_concatenada = tuplint + tupliferente
tupla_concatenada

(1, 2, 3, 4, 1, 2.0, (4+5j), 'Que?')

Podemos acessar elementos únicos, ou um conjunto deles, através dos índices

In [35]:
tuplint[2]

3

In [36]:
tupliferente[2:]

((4+5j), 'Que?')

<br>

### Conjuntos (Sets)

Um `Set` em `Python` é um conjunto `não ordenado` de valores ou elementos. O `Set` é mutável, porém cada elemento é imutável. Além disso essa estrutura de dados não permite múltiplas ocorrências do mesmo elemento.

Um `Set` é criado ao se utilizar chaves `{ }`, ou a função nativa `set`.

In [37]:
# Criando um conjunto vazio
conjunto_vazio = set()

In [38]:
# Conjunto de inteiros
inteiros = {1, 2, 3, 4, 5}
inteiros

{1, 2, 3, 4, 5}

In [39]:
# Conjunto de caracteres ... a função set 'quebra' a string
caraquiteres = set('Python Sets')
print(caraquiteres)

{'y', ' ', 'e', 'o', 'h', 'P', 'n', 't', 'S', 's'}


Perceba que existem duas letras `s`. Mas não era proibido valores duplicados? Nesse caso existe a diferença entre `S` e `s`.

O método `add` adiciona um elemento único, enquanto o método `update` adiciona vários novos elementos. Duplicatas são ignoradas.

In [40]:
caraquiteres.add('T')
caraquiteres

{' ', 'P', 'S', 'T', 'e', 'h', 'n', 'o', 's', 't', 'y'}

In [41]:
caraquiteres.update(['s', 'r', 't', 'u', 'v'])
caraquiteres

{' ', 'P', 'S', 'T', 'e', 'h', 'n', 'o', 'r', 's', 't', 'u', 'v', 'y'}

Para remover um item é possível utilizar o método `pop`. Não é possível indicar o índice que queremos, pois o `Set` é `não ordenado`.

In [42]:
print(inteiros)
inteiros.pop()
print(inteiros)

{1, 2, 3, 4, 5}
{2, 3, 4, 5}


O conjunto `inteiros` está *aparentemente* ordenado por causa da `função hash` que é utilizada para armazenar os valores.

Se soubermos o elemento exato que queremos retirar do `Set`, é possível utilizar o método `remove`.

In [43]:
print(caraquiteres)
caraquiteres.remove('T')
print(caraquiteres)

{'y', ' ', 'e', 'T', 'r', 'o', 'h', 'P', 'n', 'v', 't', 'u', 'S', 's'}
{'y', ' ', 'e', 'r', 'o', 'h', 'P', 'n', 'v', 't', 'u', 'S', 's'}


Se o elemento especificado no método `remove` não estiver no conjunto, será gerado um erro. Para que o erro não seja gerado, pode ser utilizado o método `discard`.

E se o `Set` não tem índices, então não tem como iterar, certo?

Na verdade o `Python` permite a iteração, pois o `for` não itera sobre os índices, mas sim sobre os elementos.

In [44]:
for i in caraquiteres:
    print(i)

y
 
e
r
o
h
P
n
v
t
u
S
s


<br>

### Dicionários

Um `Dicionário` é um conjunto ordenado de pares `chave-valor`. Os elementos são separados por vírgula `,` e a chave é separada do valor por dois pontos `:`. Essa estrutura de dados é envolta em chaves `{ }`.

In [45]:
# Criando um dicionário vazio
dicio_vazio = {}

In [46]:
# Criando dicionário vazio com a função nativa
dicio_vazio = dict()

In [47]:
# Dicionário com chaves inteiras
diciointeiro = {1:'a', 2:'b', 3:'c', 4:'d', 5:'e'}
diciointeiro

{1: 'a', 2: 'b', 3: 'c', 4: 'd', 5: 'e'}

In [48]:
# Chaves de tipos diferentes
dicioferente = {1:'a', complex(7,8):'b', 3.0:'c'}
dicioferente

{1: 'a', (7+8j): 'b', 3.0: 'c'}

In [49]:
# Valores são acessados pela chave
diciointeiro[1]

'a'

Adicionando novos elementos

In [50]:
# Adicionando ao definir uma nova chave e seu valor correspondente
diciointeiro[6] = 'f'
diciointeiro

{1: 'a', 2: 'b', 3: 'c', 4: 'd', 5: 'e', 6: 'f'}

Atualizando um elemento

In [51]:
diciointeiro[1] = 'aa'
diciointeiro

{1: 'aa', 2: 'b', 3: 'c', 4: 'd', 5: 'e', 6: 'f'}

A `iteração` sobre um `dicionário` acontece pelas suas chaves.

In [52]:
for i in dicioferente:
    print(i)

1
(7+8j)
3.0


In [53]:
for i in dicioferente:
    print(dicioferente[i])

a
b
c


---

## Exercícios

1. [Vetores e matrizes](https://www.facom.ufu.br/~backes/gbt017/ListaPython04.pdf)
2. [Strings](https://wiki.python.org.br/ExerciciosComStrings)
3. [Listas](https://wiki.python.org.br/ExerciciosListas)