In [1]:
# lista
my_var_list = ['a', 1, 'outra string', 6.28]

# dicionário
my_var_dict = {
    0: 'a',
    1: 1,
    2: 'outra string',
    3: 6.28,
}

# uma variável pra cada valor
my_var_0 = 'a'
my_var_1 = 1
my_var_2 = 'outra string'
my_var_3 = 6.28

Essas 3 abordagens armazenam exatamente as mesmas informações na memória do computador.
E todas elas permitem o acesso programático dos valores.
Porém, as possibilidades e características são diferentes.

No caso de `my_var_list` os valores só podem ser acessados através de índices inteiros. Porém isso garante que os dados estão ordenados.

No caso de `my_var_dict` os valores podem ser acessados por chaves, permitindo dar "nomes" a cada valor. Porém esses valores são intrinsecamente não ordenados.

No caso das variáveis separadas, podemos trabalhar com cada valor separadamente, o que é mais complicado com as estruturas. Porém, precisamos replicar código ou acabar criando uma estrutura para poder fazer uma mesma operação com todos esses valores. Inclusive...

In [2]:
my_var_list_inception = [
    my_var_0,
    my_var_1,
    my_var_2,
    my_var_3
]

assert my_var_list_inception == my_var_list

In [3]:
my_var_dict_inception = {
    0: my_var_0,
    1: my_var_1,
    2: my_var_2,
    3: my_var_3
}

assert my_var_dict_inception == my_var_dict

In [4]:
# ou ainda...
my_var_dict_compr = {index: value for index, value in enumerate(my_var_list)}
assert my_var_dict_compr == my_var_dict

my_var_list_compr = [value for value in my_var_dict.values()]

Exercício!

`my_var_dict_compr` é garantidamente igual a `my_var_dict`, prometi isso com o assert da célula acima! Explique como isso é verdade (recomendo escrever).
    dica: não sabe o que faz enumerate? `help(enumerate)`, tente bater cabeça com a documentação um pouco, mas não demais. Travando, pesquise na internet.

`my_var_list_compr` tem um porém! Que porém é esse?
    dica: gostaríamos de poder afirmar, com certeza absoluta, que `my_var_list_compr` é idêntica a `my_var_list`. Ou seja, que podemos escrever `assert my_var_list_inception == my_var_list` assim como foi feito para o dicionário.

Pontos extras...
Tendo achado o porém da `my_var_list_compr`, escreva uma versão onde é possível colocar o `assert`.
    dica1: use `dir()` e `help()` pra descobrir um método útil
    dica2: Google não vai ajudar diretamente aqui, mas indiretamente pode com a pergunta certa
    dica3: se tem dificuldade com a sintaxe de comprehension, considere um loop

____________________________________________________
Voltando...

In [5]:
proto_matriz = [
    [1,2,3],
    [4,5,6],
    [7,8,9]
]

In [6]:
proto_matriz[0][1]

2

In [7]:
proto_matriz[0]

[1, 2, 3]

-----------------------------
Pandas vai fornecer uma interface (classe) onde será possível angariar vantagens de listas (estruturas ordenadas), e de dicionários (indexação arbitrária, e outras).
Essa estrutura se chama `pandas.Series`.

E, assim como listas fornecem uma abstração para matrizes através de listas de listas, Pandas trará uma abstração de tabela através de `Series` de `Series`.
A analogia não é perfeita, e as diferenças forçam a biblioteca a oferecem uma outra interface chamada `pandas.DataFrame`.

Pandas é construída pra ter boa performance.

Em Python isso não é exatamente trivial.
Então Pandas foi toda escrita em cima de uma biblioteca chamada numpy, que por sua vez tem muito código escrito em C.
Geralmente é verdade que, se Python e rápido, então é C num pacotinho amigável de Python (#JuliaFTW).

In [8]:
import pandas

In [9]:
from_var_list = pandas.Series(my_var_list)

In [10]:
from_var_list

0               a
1               1
2    outra string
3            6.28
dtype: object

------------------------------------------
Maneira direta de criar uma Series... usar seu método construtor.

Obrigatoriamente precisa ser passado algum objeto python que pode armazenar valores estruturados.
O termo técnico é **iterable** (basicamente alguma coisa que podemos botar num loop).

In [11]:
from_var_list[2]

'outra string'

In [12]:
from_var_dict = pandas.Series(my_var_dict)

from_var_dict

0               a
1               1
2    outra string
3            6.28
dtype: object

--------------------------------------------
Acesso aos dados, como em listas e dicionários, é feito por índices.

Observe que o display das variáveis criadas mostra 3 informações:
 - índices
 - valores
 - dtype

De notável, vemos principalmente que dtype é único para a Series inteira.
Em ambos os casos até agora, esse *dtype* foi `object`, o que quer dizer uma variável python qualquer.

In [13]:
lst_1 = [1,2,3]
lst_2 = [1,2,3.0]
lst_3 = [1,2,'3']
lst_char = ['a', 'b', 'c']

ser_1 = pandas.Series(lst_1)
ser_2 = pandas.Series(lst_2)
ser_3 = pandas.Series(lst_3)
ser_char = pandas.Series(lst_char)

In [14]:
ser_1

0    1
1    2
2    3
dtype: int64

In [15]:
ser_2

0    1.0
1    2.0
2    3.0
dtype: float64

In [16]:
ser_3

0    1
1    2
2    3
dtype: object

In [17]:
ser_char

0    a
1    b
2    c
dtype: object

----------------------------------------------------------------
Dos exemplos acima podemos ver que o pandas se esforça pra achar um tipo numérico comum para atribuir à Series toda.
Falhando, cai no caso object.

Tristemente, não há uma separação para string.
Essa decisão foi tomada pois strings não tem ganho de performance na identificação do dtype, então não existe esforço em identificar esse caso.

Porém, o cientista de dados, analista que usa a biblioteca gosta de saber se é tudo string, é uma informação útil.
Existem planos para incluir essa diferenciação pra ajudar os seres por trás dos teclados.
Portanto esse comportamenteo pode mudar em versões futuras da biblioteca.

In [18]:
ser_2_int = pandas.Series(lst_2, dtype=int)

In [19]:
ser_2_int

0    1
1    2
2    3
dtype: int32

In [20]:
type(ser_2_int[0])

numpy.int32

---------------------------------------------------
Mas, pedindo com jeitinho, o `dtype` pode ser o que preferimos... dentro do limite do razoável, claro

In [21]:
ser_char.index

RangeIndex(start=0, stop=3, step=1)

In [22]:
ser_1_char = pandas.Series(lst_1, index=lst_char, name='char_indexed')

ser_1_char

a    1
b    2
c    3
Name: char_indexed, dtype: int64

In [23]:
ser_1_char['a']

1

In [24]:
datum = {':-)': 6.283185, ':-(': 3.141592}

ser_str_keys = pandas.Series(datum)

ser_str_keys

:-)    6.283185
:-(    3.141592
dtype: float64

In [25]:
ser_str_keys = pandas.Series(datum, index=[':-)', ':sad_face:'])

ser_str_keys

:-)           6.283185
:sad_face:         NaN
dtype: float64

---------------------------------------------------
Também podemos passar pro método contrutor um outro iterable a ser usado como índice.

No caso dos dados serem um dicionário, as chaves serão usadas como índice.
Se além disso for passado algum valor pra index, temos o comportamento acima.
Basicamente, o index que foi passado vai ser o índice da Series, se o dicionário contiver uma chave correspondente, usa o valor do dicionário, NaN caso contrário

In [26]:
bad_series = pandas.Series(data=lst_3, index=['a', 'a', 'b'], name='bad')

bad_series

a    1
a    2
b    3
Name: bad, dtype: object

In [27]:
bad_series['a']

a    1
a    2
Name: bad, dtype: object

In [28]:
type(ser_1_char['a'])

numpy.int64

In [29]:
type(bad_series['a'])

pandas.core.series.Series

---------------------
Diferente de dicionários, Series podem ter repetição de índice.

Esse comportamento será importante para que existam DataFrames com múltiplos índices.
De todo jeito, "as is", é possível indexar Series por algum tipo de classificação, e filtrar facilmente de acordo com essa classificação.
Claro, melhor mesmo num caso desses é ter um DataFrame com 2 colunas e filtrar pela classificação, mas apressado come cru! Ainda estamos em Series!!

Observe que no caso em que o índice não é único, o valor de retorno é uma Series.
Acontece o mesmo com listas, se acessamos um único elemento através de um índice, recebemos um objeto do tipo que estiver naquele lugar, se acessamos múltiplos elementos por um slice, recebemos algo como outra lista

In [30]:
ser_1

0    1
1    2
2    3
dtype: int64

In [31]:
ser_1[ [True, False, True] ]

0    1
2    3
dtype: int64

--------------
A característica mais confusa sobre acessos a Series...

podemos usar uma lista de booleanos para especificar exatamente quais elementos queremos da Series.
Lembrando que Series são ordenadas, então isso faz algum sentido.

In [32]:
ser_1 + ser_2_int

0    2
1    4
2    6
dtype: int64

In [33]:
ser_1 + 2*ser_2_int

0    3
1    6
2    9
dtype: int64

In [34]:
ser_1 + 3*ser_2_int / ser_2

0    4.0
1    5.0
2    6.0
dtype: float64

In [35]:
ser_1 != ser_3

0    False
1    False
2     True
dtype: bool

In [36]:
ser_char[ ser_1 == ser_3 ]

0    a
1    b
dtype: object

---------------
Aritmética para Series!

Tudo feito para facilitar transformações entre colunas.

As operações booleanas acabam sendo usadas para fazer filtros.
Além das exemplificadas aqui, temos: `>`, `<`, `&`, `|`