# Series

In [1]:
import pandas as pd

## Create a Series Object from a List
- A pandas **Series** is a one-dimensional labelled array.
- A Series combines the best features of a list and a dictionary.
- A Series maintains a single collection of ordered values (i.e. a single column of data).
- We can assign each value an identifier, which does not have to *be* unique.

In [2]:
# As listas vão combinar dicionários e listas, sendo uma classe com seus parâmetros para criação de um objeto (como vimos, uma classe é um projeto)
# Precisamos de dados para a lista, então vamos declarar
sorvete = ["Chocolate", "Creme", "Morango", "Manga"]
pd.Series(sorvete)
# A ordem é exatamente a mesma da lista, porém cada item terá um ID automático (caso não coloquemos)

0    Chocolate
1        Creme
2      Morango
3        Manga
dtype: object

In [3]:
loteria = [4, 5, 35, 64]
pd.Series(loteria)
# Notamos que o tipo de data é específicado nas séries

0     4
1     5
2    35
3    64
dtype: int64

In [4]:
registros = [True, False, False, True]
pd.Series(registros)

0     True
1    False
2    False
3     True
dtype: bool

## Create a Series Object from a Dictionary

In [5]:
exemplo = {
    "Notebook": 5000.99,
    "Tela": 500.54,
    "Mouse": 100
}
pd.Series(exemplo)
Atenção a boa prática e identações
# Aqui teremos uma lista sem índices, uma vez que já há uma chave (id) relacionado ao item em questão, mas ele separará e adequará ele na lista, com os valores (que são os preços no exemplo e as chaves (que são os itens) relacionados, que funcionarão como index e valores de fato
# Também é mantida a ordem dos dados que inserimos, ou seja, eles continuam vindo de forma que respeitem listas ou dicionários ordenados


SyntaxError: invalid syntax (4205932517.py, line 7)

## Intro to Series Methods
- The syntax to invoke a method on any object is `object.method()`.
- The `sum` method adds together the **Series'** values.
- The `product` method multiplies the **Series'** values.
- The `mean` method finds the average of the **Series'** values.
- The `std` method finds the standard deviation of the **Series'** values.

In [None]:
# Podemos definir valores de lista diretamente na série
# Para podermos utilizar métodos em uma série, temos de referenciar uma variável, pois a instância é criada com o comando e tem de estar relacionada a uma variável
precos = pd.Series([5.29, 5.48, 9.48])

In [None]:
# Com o tab, podemos ver todos os comandos a serem utilizados
precos.sum()
precos.product()
precos.mean()

## Intro to Attributes
- An **attribute** is a piece of data that lives on an object.
- An **attribute** is a fact, a detail, a characteristic of the object.
- Access an attribute with `object.attribute` syntax.
- The `size` attribute returns a count of the number of values in the **Series**.
- The `is_unique` attribute returns True if the **Series** has no duplicate values.
- The `values` and `index` attributes return the underlying objects that holds the **Series'** values and index labels.

In [None]:
# Métodos são comandos que damos a um determinado objeto, fazendo uma operação com ele
# Um atributo é uma característica que já está no dado, sem necessidade de operação. Ela já é intríseca, como um nome é um atributo do ser humano (estão interligados)
moveis = pd.Series(["Cadeira", "Mesa", "Armario", "Privada"])

In [None]:
moveis.size
# Vemos que também são apresentados diferentes comandos quando damos tab, alguns deles são os atributos, que não necessitam de parâmetros por serem características, não operações ou mudanças no código, fazem parte dele, não vão operar
# Pensamos nos objetos como um carro, que é construído de pequenos atributos, suas peças, já pertencentes a ele. Isso explica tanto os atributos como a prórpia composição da série, que possui seus pequenos itens e tem suas ordens, podendo inclusive ser mensurados

In [None]:
moveis.is_unique

In [None]:
moveis.values

In [None]:
moveis.index

In [None]:
type(moveis.values)
# Caso combinemos métodos de ambas as bibliotecas, o Python tende a demonstrar o caminho do resultado, falando que foi retirado de outra biblioteca e o especificando (como no exemplo, onde especifica a biblioteca e demonstra o valor de nosso código com o caminho especificado

In [None]:
type(moveis.is_unique)
# Tipo é caracterizado como um método por fazer uma operação para verificar os tipos contidos no dado informado, pois os dados podem ser diversos, então não são próprios, ou seja, não são atributos, eles têm de ser analisados para depois serem respondidos

In [None]:
# Alguns métodos são muito diferentes, como avarage sendo mean, vale a pena pesquisar

## Parameters and Arguments
- A **parameter** is the name for an expected input to a function/method/class instantiation.
- An **argument** is the concrete value we provide for a parameter during invocation.
- We can pass arguments either sequentially (based on parameter order) or with explicit parameter names written out.
- The first two parameters for the **Series** constructor are `data` and `index`, which represent the values and the index labels.

In [None]:
frutas = ["Mexerica","Melancia","Tomate","Banana","Maçã"]
dias_semana = ["Segunda", "Terça", "Quarta", "Quinta", "Sexta"]

In [None]:
# Para verificar os parâmetros que podemos passar nos métodos (quase tudo com parênteses), utilizamos shift + tab, assim como no excel podemos ver explicação e quais parâmetros passar para modificar ou utilizar o método
# Abaixo seguem os parâmetros apresentados para o método, mostrando que podem ser modificados e estão implícitos para serem utilizados, podemos passá-los de acordo com a necessidade
# Podemos inclusive definir o index (por exemplo) como uma lista de com a mesma quantidade de valores ou então combinar duas listas com esse meio, pois o index dela vai ser os itens da outra, podemos então externalizar os index (mesmo número de valores)
pd.Series(data = frutas, index = dias_semana)
pd.Series(frutas, dias_semana)
pd.Series(frutas, index = dias_semana)
# especificando parâmetros, podemos demonstrar contexto para o código, então é uma boa prática não deixarmos implícitos e sim explícitos, facilitando a leitura do código e verificação dos parâmetros
# Além disso, podemos escrever desordenadamente quando explícito
# Podemos inclusive combinar as maneiras de escrever

In [None]:
# Podemos identificar parâmetros sem obrigatoriedade de utilização quando o modelo padrão dele é none, ou seja, se todos forem none, podemos até não utilizar nenhum

## Import Series with the pd.read_csv Function
- A **CSV** is a plain text file that uses line breaks to separate rows and commas to separate row values.
- Pandas ships with many different `read_` functions for different types of files.
- The `read_csv` function accepts many different parameters. The first one specifies the file name/path.
- The `read_csv` function will import the dataset as a **DataFrame**, a 2-dimensional table.
- The `usecols` parameter accepts a list of the column(s) to import.
- The `squeeze` method converts a **DataFrame** to a **Series**.

In [None]:
# Facilita deixar os arquivos analisados dentro do mesmo diretório dos notebooks, uma vez que podemos colocar o caminho do arquivo de uma maneira mais simplista
# Podemos também personalizar o caminho com /../ ou outros, mas é recomendado sempre utilizarmos caminhos mais simples considerando que os arquivos podem mudar
pd.read_csv("pokemon.csv")
# Podemos inclusive utilizar o tab para nomes de arquivos quando estamos escrevendo o caminho. Além de questões do método, caso estejamos no lugar correto, ele mostrará os arquivos que podemos utilizar no método também
# Dataframes são tabelas multidimensionais em python

In [None]:
# Diferente das séries, os datasets são bidimensionais, ou seja, precisam de duas referências (horizontal e vertical) para encontrar valores. A série vai precisar apenas do valor horizontal, sendo mais simples nesta consideração
# No momento o interesse é trabalharmos com séries, ou seja, procurar os dados com o parâmetro horizontal
# Para tal, temos de extrair apenas uma coluna do conjunto de dados, para posteriormente fazermos junções entre diferentes séries (colunas) as relacionando com seus valores e index, contudo, partindo de apenas uma série de valores
pd.read_csv("pokemon.csv", usecols=["Name"]).squeeze("columns")
pokemon = pd.read_csv("pokemon.csv", usecols=["Name"]).squeeze("columns")
# O método squeeze vai nos apresentar uma visão geral da série, com nome, tamanho e tipo, além de uma visualização de lista, mais simplista e no modelo de uma série. Além disso é necessário o parâmetro para adequar a leitura a uma série, pois não comporta a leganda acima da coluna ou index, então adequamos a uma série e então passamos para a série
# Logo, temos de passar essa visualização de dataframe para série, para depois considerar uma série, o modelo com legendas é um dataframe (primeiro exemplos) e a série é o exemplo simplificado (squeezed) e temos de estar nele para ser caracterizado como uma
# Lembremos que uma vez que o objeto se torna adequado a uma série, ele vira uma série, ou seja, todas as funcionalidades de uma série vão fazer jus a ele, logo, se não declararmos a série como pd.Series(pd.read_csv...) ainda assim consideramos e ele se torna uma série, pois fazemos com que ele tenha os atributos e se adeque no modelo de uma série, podendo ser utilizado assim
# No exemplo que citamos, é representada uma série mesmo sem pd.Series(pd.read_csv("pokemon.csv", usecols=["Name"]).squeeze("columns")), pois o objeto já é uma série, então declararmos, já que se enquadra no projeto da classe e é adequado para classificar uma série, acaba sendo redundância, afinal, o objeto já constitui todos os elementos de uma série e já é uma série (provando que é uma redundância) 

In [None]:
pd.read_csv("google_stock_price.csv")

In [None]:
google = pd.read_csv("google_stock_price.csv", usecols=["Price"]).squeeze("columns")
google

In [None]:
google_serie = pd.Series(pd.read_csv("google_stock_price.csv", usecols=["Price"]).squeeze("columns"))
google_serie
# Fazendo as adequações, podemos então incluir a leitura a uma série propriamente dita para utilizar os atributos e métodos da série em si, não da leitura, então ela será um objeto da série e poderá ser utilizada como tal

In [None]:
# Podemos ainda definir o index como sendo uma outra coluna do CSV e para isso não precisamos importar novamente o csv, como em uma leitura pd.Series(importação 1, importação 2)
# Daí que fica interessante observarmos as propriedades, pois como a série comporta duas colunas, podemos passar ambas já prontas
# Deste modo, como a classe comporta duas características e passamos uma (ela autopreenche), podemos já passar as duas e para isso conseguimos na extração definir uma coluna para index e passamos pronto para a série como ela será
# # Fazendo com que tenhamos index e valores, já que ela suporta ambos e podemos passar um, outro ou os dois já formatados
# Com isso, podemos fazer com que a série se torne algo semelhante ao dicionário, com chaves e valores diferentes e definidos por nós
# Ou seja, podemos personalizar e trazer duas colunas de valores em um objeto que originalmente permitiria uma, fazendo também uma relação e conexão de duas colunas, dois valores e chaves para considerar na pesquisa, utilizar como pesquisa, parâmetros ou então análises
# Como em alguns casos não utilizamos o valor em si do index, pode ser interessante e útil fazer essa conexão entre chaves e valores com duas colunas, para que mostremos por exemplo a relação dos registros já em um item mais simples e fazendo uma relação com os registros como seria em um mais complexo como dataframe ou banco de dados (já incluindo a relação neste objeto simples pois um corresponde ao outro como vimos muitas vezes e como acontece nos registros do banco
pd.Series(pd.read_csv("pokemon.csv", usecols=["Type", "Name"], index_col = ["Name"]).squeeze("columns"))

In [None]:
# É importante também dizer que mesmo quando utilizamos esta forma de representação, conseguimos pesquisar via index numérico, pois o python fará a contagem ordenadamente, então mesmo assim conseguimos utilizar o atributo, mesmo que o index não seja existente ele faz este procedimento pois "existe internamente", devemos se adequar e verificar cada caso de uso

## The head and tail Methods
- The `head` method returns a number of rows from the top/beginning of the `Series`.
- The `tail` method returns a number of rows from the bottom/end of the `Series`.

In [1]:
google = pd.read_csv("google_stock_price.csv", usecols=["Price"]).squeeze("columns")
pokemon = pd.read_csv("pokemon.csv", usecols=["Name"]).squeeze("columns")
pokemon.head()
pokemon.head(1)
# Utilizamos para obter amostras da série, podemos inclusive verificar quais atributos são possívels (padrão é 5) para seu uso, é uma boa prática começarmos a fazer isso

NameError: name 'pd' is not defined

In [None]:
google.tail()
google.tail(6)
google

In [None]:
# Basicamento um top ou limit do SQL

## Passing Series to Python's Built-In Functions
- The `len` function returns the length of the **Series**.
- The `type` function returns the type of an object.
- The `list` function converts the **Series** to a list.
- The `dict` function converts the **Series** to a dictionary.
- The `sorted` function converts the **Series** to a sorted list.
- The `max` function returns the largest value in the **Series**.
- The `min` function returns the smalllest value in the **Series**.

In [None]:
google = pd.read_csv("google_stock_price.csv", usecols=["Price"]).squeeze("columns")
pokemon = pd.read_csv("pokemon.csv", usecols=["Name"]).squeeze("columns")

In [None]:
len(google)
type(google)
list(pokemon) #conversão para listas, já que é apto no formato, sempre devemos pensar que antes de transformar em um "objeto", ele tem de satisfazer o projeto, assim como fazemos para google e pokemon
sorted(pokemon) #Basicamente podemos utilizar como order
max(pokemon)
len(max(pokemon)) #Podemos combinar funções para por exemplo saber o tamanho do maior item
dict(pokemon)
max(google)

## Check for Inclusion with Python's in Keyword
- The `in` keyword checks if a value exists within an object.
- The `in` keyword will look for a value in the **Series's** index.
- Use the `index` and `values` attributes to access "nested" objects within the **Series**.
- Combine the `in` keyword with `values` to search within the **Series's** values.

In [None]:
google = pd.read_csv("google_stock_price.csv", usecols=["Price"]).squeeze("columns")
pokemon = pd.read_csv("pokemon.csv", usecols=["Name"]).squeeze("columns")

In [None]:
# in pode ser utilizada para diversos fins, ela procurará um conjunto dentro do conjunto atual que temos, seja uma string, lista, série etc.
"Bulbasaur" in pokemon.values # Por padrão o in vai puxar o index, então falará se aquele index existe, podemos fazer com que procure valores ou ambos combinados na lista pela utilização da função
"Pikachu" in pokemon.values # É como um check

## The sort_values Method
- The `sort_values` method sorts a **Series** values in order.
- By default, pandas applies an ascending sort (smallest to largest).
- Customize the sort order with the `ascending` parameter.

In [None]:
google = pd.read_csv("google_stock_price.csv", usecols=["Price"]).squeeze("columns")
pokemon = pd.read_csv("pokemon.csv", usecols=["Name"]).squeeze("columns")

In [None]:
google.sort_index(ascending=False)
google.sort_values(ascending=False)
# Aqui vemos um exemplo de order by, por exemplo, contudo, no python devemos observar os atributos dos métodos para então conseguir lidar
# Muitos deles serão false ou true, não necessitando de desc por exemplo, ou seja, se o ascending é true como padrão, basta definirmos como false que será o contrário, irá considerar o descendente
# Isso se aplica para outros parâmetros que veremos e devemos ter em mente, pois em python podemos definir atributos como true e false e algumas características mudam assim, sem precisar especificar como em SQL (por exemplo), então primeiro observamos o método e depois mudamos os parâmetros de acordo com a linguagem e regras

In [None]:
# Podemos combinar métodos para por exemplo conseguir o top 5, top 10 e outras amostras menores e ordenadas, assim como em SQL. Combinamos para poder analisar amostragens específicas e personalizadas
pokemon.sort_values(ascending=False).head()

## The sort_index Method
- The `sort_index` method sorts a **Series** by its index.
- The `sort_index` method also accepts an `ascending` parameter to set sort order.

In [None]:
google = pd.read_csv("google_stock_price.csv", usecols=["Price"]).squeeze("columns")
pokemon = pd.read_csv("pokemon.csv", usecols=["Name"]).squeeze("columns")

In [None]:
google.sort_index(ascending=False).head(8)

## Extract Series Value by Index Position
- Use the `iloc` accessor to extract a **Series** value by its index position.
- `iloc` is short for "index location".
- Python's list slicing syntaxes (slices, slices from start, slices to end, etc.) are supported with **Series** objects.

## Extract Series Value by Index Label
- Use the `loc` accessor to extract a **Series** value by its index label.
- Pass a list to extract multiple values by index label.
- If one index label/position in the list does not exist, Pandas will raise an error.

In [None]:
pokemon = pd.Series(pd.read_csv("pokemon.csv", usecols=["Type", "Name"], index_col = ["Name"]).squeeze("columns"))

In [None]:
# Podemos extrair valores de uma série a partir dos rótulos, como index que se tornaram valores, ou seja, labels não numéricas e informacionais que referenciam ao valor com uma informação, de forma que ambos representam valores mas um identifica o outro 
pokemon.loc["Bulbasaur"]
# Caso utilizemos a sintaxe pokemon["Bulbasaur"] ou com um index, dará certo mas isso abre espaço para ambiguidade e imprecisão, de forma que podemos querer procurar um dado e haver uma confusão de valores caso por exemplo o index também represente um valor, ou seja, devemos evitar essas questões ambíguas e direcionar bem o código, deixando objetivo e sem espaços para erro
# Temos também de considerar que para procurar múltiplos index ou labels, eles têm de ser armazenados em uma lista, fora da lista podemos pesquisar intervalors (requisição de x labels) e únicos apenas, pois representam um fator, para vários, podemos utilizar listas e inclusive isso nos ajuda caso seja uma pré-existente por exemplo, como dito anteriormente
pokemon.loc[["Charizard", "Bulbasaur", "Pikachu"]]
pokemon.loc["Bulbasaur":]

## The get Method on a Series
- The `get` method extracts a **Series** value by index label. It is an alternative option to square brackets.
- The `get` method's second argument sets the fallback value to return if the label/position does not exist.

In [None]:
pokemon = pd.Series(pd.read_csv("pokemon.csv", usecols=["Type", "Name"], index_col = ["Name"]).squeeze("columns"))

In [None]:
# Podemos utilizar o get para pesquisar um valor alternativo caso o parâmetro de pesquisa não seja atingido, que pode ser personalizado para valores não encontrados e retornar mensagens padrões neste caso
pokemon.get("Pikchu")
#Vemos que com o get não há erro apresentado, pois ele está condicionado a trazer o valor caso encontrado e se não encontrar, não retorna, pois seu objetivo é apenas veriificar se o valor está e retornar para corresponder, não checar como nos outros casos se ele obrigatoriamente está (como não achou valor, não trouxe e não apresentou erros pois não é obrigatoriedade encontrar ou corresponder e sim chamar o elemento)
#Podemos então inserir o valor alternativo retornado, que pode ser utilizado como sinalizador em casos de não encontrar ou ser utilizado para outras razões, ams sempre com a ideia de que será retornado em caso de não encontrar
#Uma boa opção para utilizarmos como boa prática, pois evita erros e além de retornar valores, retorna respostas e mensagens de não correspondencia que podem ser utilizadas
pokemon.get("pikchu", "Não encontrado")

## Overwrite a Series Value
- Use the `loc/iloc` accessor to target an index label/position, then use an equal sign to provide a new value.

In [None]:
pokemon = pd.Series(pd.read_csv("pokemon.csv", usecols=["Name"]).squeeze("columns"))
# Podemos utilizar os parâmetros de localização para atribuição de valores pelo símbolo de igualdade, afinal, aquele valor vai ser igual ao index, ou seja, aquele valor passa a ser igual a correspondência do index, nos levando a alteração da série para que corresponda, ela vai ser mudada e passará a representar aquele valor
pokemon.iloc[2] = "Quebrado"
# Podemos também fazer ordenadamente em lista, lembrando sempre da regra de listas e de intervalos (intervalos são valores únicos requisitados também e listas vários valores únicos que tem de ser passados sempre em lista)
pokemon.iloc[[2,4,5]] = "Quebrou", "Tome", "Ui"
#O mesmo se aplica para labels, ou seja, podemos trocar os valores correspondentes a labels por meio da igualdade, pois estamos do mesmo jeito localizando o valor e trazendo outra atribuição (igualdade a ele), ou seja, não estamos apenas localizando mas atribuindo outro valor, o que muda a série
pokemon

## The copy Method
- A **copy** is a duplicate/replica of an object.
- Changes to a copy do not modify the original object.
- A **view** is a different way of looking at the *same* data.
- Changes to a view *do* modify the original object.
- The `copy` method creates a copy of a pandas object.

In [None]:
pokemon_df = pd.read_csv("pokemon.csv", usecols=["Name"])
pokemon_series = pokemon_df.squeeze("columns")
# Devemos sempre diferenciar a cópia de um objeto de uma visualização, pois uma cópia é copiar exatamente uma tabela, por exemplo, já uma visualização é obtermos aquela tabela de outro ponto de vista, ou seja, modificada para uma outra ótica com dados alterados, direcionados, selecionados ou que fazem parte dela, porém, sem ser igual a tabela pois ela não virá completa, só a visualização (que definimos) baseada nela, então ela está ali mas com outra ótica. É um pouco óbvio, mas temos sempre de ter isso em mente para evitar redundância e possuir questões técnicas que podem otimizar e orientar nossa rotina
# Um exemplo de view é uma série, pois ela representa uma visualiização, ou seja, um "zoom" nos dados pertencentes ao datase pai, afinal, é uma squeeze, ou seja, é um modelo diferente e direcionado do conjunto de dados que possuímos antes, em python se dá desta forma, diferente do SQL. Logo, o objeto pai é o dataframe e caso criemos views ou outras apresentações derivadas nele que mudem dados ou então mudem visualização e organização, estamos cirando uma view, pois não é igual (é organizada e dimensionada de outra forma) e é baseada no dataframe, o que a configura como view por não ser exatamente igual e sim um viés dele.
# Caso alteremos uma view, como representa uma fatia ou uma outra representação dentro dos dados, vamos também afetar a totalidade, no caso, o dataframe. Podemos alterar valores da view, mas vamos afetar o conjunto original por serem valores retirados e uma visualização diferente dos dados originais, mas ainda representando eles
pokemon_series.iloc[0] = "Modificada também no DF por ser apenas um zoom nos dados, mas ainda serem os mesmos"
pokemon_df

In [None]:
# Para criarmos uma cópia, uma duplicata como uma série no SQL, ou seja, uma cópia que não afetará os dados originais mas sim os novos, pois não tem mais a ver com a original, assim como uma view em sql, que não tem a ver e se assemelha (sabemos que não é isso) a uma cópia da original mas sem relação operacional
pokemon_copia = pokemon_df.squeeze("columns").copy()
#Podemos inclusive modificar e trazer novos parâmetros antes de fazer a cópia, assim como fizemos para dar o squeeze antes de fazer a cópia, se tornando flexível. É importante fixarmos esses conceitos e diferenças entre view, cópias e dependências para utilizarmos a linguagem e estar a par de funcionalidades e de possibilidades, já que as linguagens são únicas e conceitos como estes mudam um pouco mas em essência são os mesmos
# Vamos principalmente utilizar a cópia para que métodos e funções aplicadas não afetem os dados originais, para criarmos nossa própria série e modificá-la para objetivos diferentes sem que a primeira se altere, como vimos
# Views são partes do objeto que o representam e possuem dependências com ele, pois fazem parte dele e só representam uma parte retirada dele mas que ainda o referencia, cópias são novos objetos baseados nos dados originais que podem ou não ser iguais (sempre baseados) mas vão permitir relação sem dependência por serem "únicos"
pokemon_copia.iloc[2] = "ui"
pokemon_copia
pokemon_df

## Math Methods on Series Objects
- The `count` method returns the number of values in the **Series**. It excludes missing values; the `size` attribute includes missing values.
- The `sum` method adds together the **Series's** values.
- The `product` method multiplies together the **Series's** values.
- The `mean` method calculates the average of the **Series's** values.
- The `std` method calculates the standard deviation of the **Series's** values.
- The `max` method returns the largest value in the **Series**.
- The `min` method returns the smallest value in the **Series**.
- The `median` method returns the median of the **Series** (the value in the middle).
- The `mode` method returns the mode of the **Series** (the most frequent alue).
- The `describe` method returns a summary with various mathematical calculations.

In [None]:
google = pd.Series(pd.read_csv("google_stock_price.csv", usecols=["Price"]).squeeze("columns"))
google


In [None]:
# Podemos utilizar métodos matemáticos nas séries para extrair valores e dados a partir dos dados
# Size vai trazer o número de linhas totais nas condições (mesmo que vazias) e count semelhante SQL vai contar apenas os existentes, que correspondem a valores não nulos caso não especifiquemos nada, trazendo a quantidade de registros preenchidos
# Lembrando que o count vai contar o número de elementos básicos no objeto, ou seja, se for string, pode contar quantos caracteres x tem, em lista, quantos elementos x tem e em séries, quantos valores x tem, sempre com a idea de trabalhar em alguns casos com valor e geral mas em várias funções trabalhar com a ideia de menor valor, ou seja, a menor parte daquele objeto, no caso das séries, o menor (a unidade) é o próprio valor
google.count()
google.sum()
google.product()

#Podemos também personalizar os métodos para se encaixarem em uma lista de valores específicos, a fim de trazer a operação matemática apenas para esta lista
google.iloc[[5, 599, 699, 3]].product()
google.iloc[40:].sum()
google.iloc[40:5000].sum() #Lembrando SEMPRE que o último valor em intervalos não é utilizado pois é considerado o intervalo, então ele entende como estar puxando x quantidade de valores como um único e não puxará o último pois conta do primeiro, trazendo a quantidade, o que desconsidera ele
#Lembremos também que valores que consideram a diferença ou comandos que consideram x valores da lista vão puxar até o limite, ou seja, eles vão puxar todos os valores possíveis da lista pois estamos apenas solicitando a quantidade como no get (pensemos como um limite)
#Atenção SEMPRE para utilizar métodos, atributos e funções, pois cada um exige um tipo de chave, parênteses e delimitadores, então cuidado pois métodos são parênteses, listas são chaves etc.
# Verificar sempre no início do aprendizado para ver o que cada método tem como padrão e o que exige como delimitação



## Broadcasting
- **Broadcasting** describes the process of applying an arithmetic operation to an array (i.e., a **Series**).
- We can combine mathematical operators with a **Series** to apply the mathematical operation to every value.
- There are also methods to accomplish the same results (`add`, `sub`, `mul`, `div`, etc.)

In [None]:
google = pd.Series(pd.read_csv("google_stock_price.csv", usecols=["Price"]).squeeze("columns"))

In [None]:
# A transmissão funciona justamente como o nome, vai transmitir uma operação para cada item da série que foi selecionado para tal, assim como fazemos no excel quando puxamos uma fórmula para outras fórmulas
# Existem operações específicas de broadcasting
google.add(10) # É uma boa prática utilizar os métodos para tal, porém podemos utilizar também fórmulas com o nome da série
google + 10  # Aqui um exemplo utilizando o nome da série que também vai produzir um broadcasting, dessa forma também conseguimos replicar as operações e juntar operações para replicar em todos os valores, ou seja, se inserimos o nome da série na operação, estamos expandindo e fazendo operações com cada e todos os valores (se não especificado), pois considerará ela toda, ou seja, todos os elementos

google.sub(5)
google - 5

#Combinando
google.sub(5).add(400)
google * 10 + 5

## The value_counts Method
- The `value_counts` method returns the number of times each unique value occurs in the **Series**.
- The `normalize` parameter returns the relative frequencies/percentages of the values instead of the counts.

In [None]:
pokemon = pd.Series(pd.read_csv("pokemon.csv", usecols=["Type"]).squeeze("columns"))
pokemon

In [None]:
# Aqui vemos algo semelhante ao count do SQL, considerando o group by, ou seja, vai contar os valores agrupados
# Temos de prestar atenção em quais itens compões a série, que inserimos como index ou que inserimos como valores, ou seja, o que vamos considerar como valores para contagem, parâmetros, colunas etc etc.
pokemon.value_counts()
pokemon.value_counts(ascending = True) # Temos de SEMPRE OBSERVAR OS PARÂMETROS COM SHIFT TAB, desta forma podemos verificar como podemos personalizar o comando e como podemos utilizar eles para direcionar e tornar mais específica nossa pesquisa, além de poupar código e redundâncias, pois verificamos as funcionalidades e questões intrínsecas que podem nos ajudar
pokemon.value_counts(normalize=True) # Caso queiramos por exemplo a porcentagem em decimal do número de vezes que o valor aparece em nossa série
pokemon.value_counts(normalize=True) * 100 # Podemos também utilizar broadcasting nas séries com uso de métodos, ou seja, quaisquer séries podem ser incluídas em reações em cadeias caso utilizadas em operações, de forma que estas operações vão refletir nelas mesmo utilizando outras funções e podem ser operadas deste modo, como para mostrar a porcentagem decimal no valor de porcentagem comum, como estamos habituados, que é o valor * 100, mudando a visualização para vermos os valores de outra forma (um exemplo de utilização para facilitar nossa visualização da série)
    

## The apply Method
- The `apply` method accepts a function. It invokes that function on every `Series` value.

In [6]:
pokemon = pd.read_csv("pokemon.csv", usecols=["Name"]).squeeze("columns")
pokemon

0          Bulbasaur
1            Ivysaur
2           Venusaur
3         Charmander
4         Charmeleon
            ...     
1005    Iron Valiant
1006        Koraidon
1007        Miraidon
1008    Walking Wake
1009     Iron Leaves
Name: Name, Length: 1010, dtype: object

In [None]:
# Assim como operações, podemos expandie funções para cada valor de nossa série, fazendo o broadcasting não apenas com álgebra, mas também com as funções disponibilizadas
# Logo, funções aritméticas e de cálculos algébricos serão repassadas de maneira simples ou utilizando os métodos atribuídos a série, enquanto para utilizarmos funções, sejam criadas ou pertinentes ao Python, vamos aplicar a série (ou intervalo, caso encessitemos), fazendo o mesmo que um broadcasting, mas diferenciando para álgebras e para uso de funções
pokemon.apply(len)

In [None]:
def count_of_a(pokemon):
    return pokemon.count("a")
pokemon.apply(count_of_a)
# Conseguimos aplicar então a função para uma cadeia inteira da série, do mesmo modo, podemos contar quantas letras a existem no total se juntarmos os métodos e funções aprendidos, além de relacionar os diferentes atributos e questões que aprendemos podendo trabalhar e filtrar valores, dados, quantidades e informações das séries para trabalharmos com elas

## The map Method
- The `map` method "maps" or connects each **Series** values to another value.
- We can pass the method a dictionary or a **Series**. Both types connects keys to values.
- The `map` method uses our argument to connect or bridge together the values.

In [7]:
pokemon = pd.read_csv("pokemon.csv", index_col="Name").squeeze("columns") #Lembrando sempre de que quando utilizamos o read, caso não coloquemos a coluna utilizada, ele puxa todas, então por isso nunca colocamos elas quando definimos index nestes exemplos, já que possui apenas duas colunas, ele vai puxar o resto para valores se uma for index, igual puxaria duas se houvesse, mas focamos sempre no contexto e na disponibilidade, então enste caso podemos declarar assim e em outros declaramos as colunas utilizadas e outros atributos se necessário
pokemon

Name
Bulbasaur          Grass, Poison
Ivysaur            Grass, Poison
Venusaur           Grass, Poison
Charmander                  Fire
Charmeleon                  Fire
                      ...       
Iron Valiant     Fairy, Fighting
Koraidon        Fighting, Dragon
Miraidon        Electric, Dragon
Walking Wake       Water, Dragon
Iron Leaves       Grass, Psychic
Name: Type, Length: 1010, dtype: object

In [9]:
# Podemos como o vlookup do excel, filtrar valores das séries para conectar a outros em um outro dataset, como um join (semelhante)
attack_powers = {
    "Grass": 10,
    "Fire": 15,
    "Water": 15,
    "Fairy, Fighting": 20,
    "Grass, Psychic": 50,
    "Grass, Poison": 30
}
attack_powers

{'Grass': 10,
 'Fire': 15,
 'Water': 15,
 'Fairy, Fighting': 20,
 'Grass, Psychic': 50,
 'Grass, Poison': 30}

In [10]:
pokemon.map(attack_powers)

# Observamos que os valores estão em float, isso porque sempre que uma série tiver ao menos um campo nulo, a série será convertida em floating, caso composta por números. Com outros tipos continuaria como string e outros de texto, mas no caso de números, basta ter um e os valores da série são convertidos em float por regra, o que deve ser melhor e deve contornar casos

Name
Bulbasaur       30.0
Ivysaur         30.0
Venusaur        30.0
Charmander      15.0
Charmeleon      15.0
                ... 
Iron Valiant    20.0
Koraidon         NaN
Miraidon         NaN
Walking Wake     NaN
Iron Leaves     50.0
Name: Type, Length: 1010, dtype: float64

In [None]:
# Finalmente o join, neste caso, representando o left join ou próximo, muito mais simples e objetivo de ser utilizado, porém, substituindo os valores invés de juntá-los, ou seja, ele não vai juntar como no sql e sim substituir os correspondentes pelo valor que deu match