<img src='letscodebr_cover.jpeg' align='left' width=100%/>

# Ada Tech [DS-PY-004] Técnicas de Programação I (PY) Aulas 4 e 5 : Pandas - Index.

## Index

###  Intro

O [índex](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Index.html) é uma sequência imutável usada para indexação e alinhamento. O objeto básico que armazena rótulos de eixo para todos os objetos pandas.

Uma instância de `Index` pode ser pensada como um [`_imutable_array_`](https://docs.couchbase.com/mobile/2.8.0/couchbase-lite-net/api/Couchbase.Lite.IMutableArray.html) ou como um conjunto ordenado.

Os `DataFrames` têm duas instâncias associadas da classe `Index`, uma descreve as linhas e a outra descreve as colunas. Para acessar a instância de `Index` associada às linhas de um `DataFrame` usamos [`df.index`](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.index.html) e para a instância associada às colunas usamos [`df.columns`](https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.columns.html).

### `Index` como um arranjo imutável


O que significa ser [imutável](https://www.mygreatlearning.com/blog/understanding-mutable-and-immutable-in-python/#:~:text=collection%20of%20data.-,Immutable%20Definition,of%20these%20objects%20is%20permanent.)?

Um objeto imutável é aquele cujo estado (valor de cada um de seus atributos) não pode ser modificado depois de criado. E o que acontece se tentarmos modificá-lo? Vamos tentar.

In [1]:
import pandas as pd
ind = pd.Index([2, 3, 5, 7, 11])
ind

Index([2, 3, 5, 7, 11], dtype='int64')

In [2]:
try:

    ind[1] = 0

except Exception as e: print(e)

Index does not support mutable operations


Podemos indexar e fatiar de forma semelhante a um arranjo.

In [3]:
ind[1]

3

In [4]:
ind[ : : 2]

Index([2, 5, 11], dtype='int64')

Instâncias de `Index` têm atributos semelhantes aos dos arranjos `Numpy`:

In [5]:
print(ind.size, ind.shape, ind.ndim, ind.dtype)

5 (5,) 1 int64


### `Index` como um conjunto ordenado

Podemos utilizar operações sobre conjuntos com as instâncias de `Index` seguindo as convenções de Python.

In [6]:
indA = pd.Index([1, 3, 5, 7, 9])
indB = pd.Index([2, 3, 5, 7, 11])

#### intersecção

dados dois conjuntos $A$ e $B$, sua [interseção](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Index.intersection.html) é outro conjunto que contém aqueles elementos que pertencem à $A$ e que pertencem à $B$, simultaneamente.

In [7]:
(set(indA) & set(indB))

{3, 5, 7}

#### union

dados dos conjuntos A y B, su unión es otro conjunto que tiene todos los elementos que pertencen a A más todos los elementos que pertencen a B

#### União

dados dois conjuntos $A$ e $B$, sua [união](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Index.union.html) é outro conjunto que contém todos os elementos que pertencem à $A$ e todos os elementos que pertencem à $B$.

In [8]:
(set(indA) | set(indB))

{1, 2, 3, 5, 7, 9, 11}

#### diferença simétrica

Dados dois conjuntos $A$ e $B$, a [diferença simétrica](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Index.symmetric_difference.html) é outro conjunto cujos elementos são aqueles que pertencem a um dos conjuntos iniciais, sem pertencer a ambos simultaneamente.

In [9]:
(set(indA) ^ set(indB))

{1, 2, 9, 11}

#### diferença

Dados dois conjuntos $A$ e $B$, a [diferença](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Index.difference.html) é outro conjunto com os elementos do primeiro conjunto sem os elementos do segundo conjunto.

In [10]:
(set(indA).difference(set(indB)))

{1, 9}

## Construtor

In [11]:
ind = pd.Index([2, 3, 5, 7, 11])
ind

Index([2, 3, 5, 7, 11], dtype='int64')