# Python para Ciência de Dados - Funções - Parte 2

## Entendendo melhor as funções
Estruturalmente, uma função é composta pelo cabeçalho (que contém a declaração `def`), o corpo da função (onde de fato definimos o que a função faz) e a declaração de retorno (especificada pelo comando `return`), nós também podemos retornar diretamente o resultado da operação no `return`, sem necessitar guardar o resultado em uma variável. 

Essa estrutura nos fornece a **definição da função**. A identação do código, assim como nas estruturas condicionais e de repetição, marcam o escopo da função.

In [127]:
def cubo(num):    #cabecalho
    resp = num*num*num    #corpo da funcao
    return resp    #retorno

cubo(3)    #chamada da funcao

27

#### Exercício
1. Crie uma função que receba um número e retorne o texto `maior que dez!` se o valor for de fato maior que 10 e retorne `nao maior que dez!` se ele nao for maior.

## Extraindo valores
Nós já trabalhamos com um exemplo de dataset antes, agora, com o auxílio de funções, vamos criar uma função que nos retorne uma lista com os valores da coluna selecionada. Antes, vamos realizar o mesmo processo de importar o _pandas_ e o dataset, que dessa vez será sobre alguns aplicativos presentes na Google Play.

In [128]:
import pandas as pd
apps = pd.read_csv('apps-dados.csv')

In [129]:
apps.head()

Unnamed: 0,App Name,Category,Rating,Reviews,Installs,Size,Price,Content Rating,Last Updated,Minimum Version,Latest Version
0,DoorDash - Food Delivery,FOOD_AND_DRINK,4.548562,305034,"5,000,000+",Varies with device,0,Everyone,"March 29, 2019",Varies with device,Varies with device
1,TripAdvisor Hotels Flights Restaurants Attract...,TRAVEL_AND_LOCAL,4.400671,1207922,"100,000,000+",Varies with device,0,Everyone,"March 29, 2019",Varies with device,Varies with device
2,Peapod,SHOPPING,3.656329,1967,"100,000+",1.4M,0,Everyone,"September 20, 2018",5.0 and up,2.2.0
3,foodpanda - Local Food Delivery,FOOD_AND_DRINK,4.107233,389154,"10,000,000+",16M,0,Everyone,"March 22, 2019",4.2 and up,4.18.2
4,My CookBook Pro (Ad Free),FOOD_AND_DRINK,4.647752,2291,"10,000+",Varies with device,$5.99,Everyone,"April 1, 2019",Varies with device,Varies with device


Vamos criar uma função que recebe um índice e nos retorna os elementos 'presentes' nesse índice, ou seja, as informações de determinado aplicativo dado seu índice. Para isso, precisamos iterar sobre os elementos desse índice, ou seja, iterar sobre as colunas, e armazenar cada informação iterada. Sobre o armazenamento dessas informações, utilizaremos uma lista para guardarmos essas informações.
Uma possível solução seria a seguinte:

In [130]:
def info_app(indice):
    infos = []
    for col in apps.iloc[indice]:
        infos.append(col)
#     infos.append( apps.iloc[indice]['Rating'] )
    return infos

In [131]:
app_3 = info_app(3)
app_4 = info_app(4)
print(app_3, app_4)

['foodpanda - Local Food Delivery', 'FOOD_AND_DRINK', 4.107232571, 389154, '10,000,000+', '16M', '0', 'Everyone', 'March 22, 2019', '4.2 and up', '4.18.2'] ['My CookBook Pro (Ad Free)', 'FOOD_AND_DRINK', 4.647752285, 2291, '10,000+', 'Varies with device', '$5.99', 'Everyone', 'April 1, 2019', 'Varies with device', 'Varies with device']


Para resolver o problema, utilizamos o `iloc`, que se baseia na posição de um inteiro para nos retornar as informações relacionadas (linha do dataset). Ou seja, utilizando o `iloc` e dado tal índice, temos acesso às informações mapeadas por esse índice. Mais informações nesse [link](https://medium.com/horadecodar/data-science-tips-02-como-usar-loc-e-iloc-no-pandas-fab58e214d87). 

#### Exercício
2. Crie uma função que, dado o índice desejado, retorna apenas o nome e a quantidade de reviews desse aplicativo.

**_DICA:_** Utilizando o `iloc` e dando o índice, temos acesso às colunas, por exemplo: `dataset.iloc[indice]['nome_coluna']` 

## Exercitando a extração de valores
Nós vimos como criar uma função que, dado o índice, nos é retornada uma sequência de informações sobre o aplicativo correspondente ao índice. Para praticar, vamos criar algo um pouco maior e mais interessante. Vamos verificar quantos aplicativos existem em cada categoria no dataset.

Vamos começar criando uma função genérica que nos retorna todos os itens presentes em uma determinada coluna:

In [132]:
def itens_por_coluna(coluna):
    itens = []
    itens.append(apps.loc[:][coluna])
    return itens

def ocorrencias(itens):
    resp = {}
    for item in itens:
        if item  in itens:
            resp[item] += 1
        else:
            resp[item] = 1
#         print(type(item))
    return resp

In [133]:
categorias = itens_por_coluna('Category')
ocorrencias_por_categorias = ocorrencias(categorias)

TypeError: 'Series' objects are mutable, thus they cannot be hashed