# Portfólio - Adriano Freitas

Este portfólio lista alguns dos projetos mais relevantes de Adriano Freitas. Todos os projetos tem seu códigos publicados no GitHub, basta clicar nos títulos e será redirecionado para o respectivo repositório.

**AVISO - [WIP] WORK IN PROGRESS**

Este portfolio no momento está em construção, portanto nem todos os projetos contam com sua devida descrição, porém todos os links apontam para seus respectivos *sources* no GitHub.

## Contato

- **LinkedIn**: [linkedin.com/in/adrianofreitas](https://www.linkedin.com/in/adrianofreitas)
- **GitHub**: [github.com/adrianogfreitas](https://github.com/adrianogfreitas)
- **Link para esse portfolio** (para o caso de tê-lo recebido por algum outro meio): [bit.ly/adriano-freitas-portfolio](https://bit.ly/adriano-freitas-portfolio)
- **e-mail**: agf.adriano@gmail.com

## Lista de Projetos

1. **[Projetos Estratégicos](#strats)**
    * 1.1 [ML Belt (WIP)](#ml_belt)
2. **[Desafios](#challenges)**
    * 2.1 [Nubank](#nubank-data-challenge)
    * 2.2 [Ambev](#ambev-data-challenge)
3. **[NLP](#nlp)**
    * 3.1 [TV Script Generation](#tv-script-generation)
    * 3.2 [Keyword Extraction](#keyword-extraction)
    * 3.3 [Language Translation](#language-translation)
4. **[Processamento de Imagem](#image)**
    * 4.1 [Face Generation](#face-generation)
    * 4.2 [Classificação de Imagens](#cifar-10-image-classification)
5. **[Churn](#churn)**
    * 5.1 [Churn em Telecom (WIP)](#telco_churn)
6. **[Outros Projetos](#outros)**
    * 6.1 [Bike Sharing](#bike-sharing-neural-network)

<a id="strats"></a>
## Projetos Estratégicos

<a id="ml_belt"></a>
### [ML Belt (WIP)](https://github.com/adrianogfreitas/ml_belt)

Projeto para facilitar tarefas comuns de pré-processamento de datasets. Pode ser instalado via [pip](https://pypi.org/project/ml-belt/) com o comando abaixo:
```bash
pip install ml_belt
```

Sua documentação atualizada pode ser encontrada [aqui](https://ml-belt.readthedocs.io/en/latest/), abaixo segue um exemplo de sua utilização:

```python
from ml_belt.prep import Prep
import pandas as pd

def custom_fn(df):
    '''Do some modifications on df and return it.'''
    return df

# Prep needs a pandas dataframe
prep_df = Prep(pd.read_csv('data.csv')) \
    .drop_nulls(['col1', 'col2']) \
    .bool_to_int(['col3']) \
    .drop_cols(['nosense_col1', 'nosense_col2']) \
    .fill_null_with('mean', ['col_with_nulls', 'another_col_with_nulls']) \
    .fill_null_with(-1, ['col_with_nulls2', 'col_with_nulls3']) \
    .apply_custom(custon_fn) \
    .drop_nulls()

# Now you have a modified df 
# with all steps above
df = prep_df.df
df.to_csv('data_prep.csv')
```

O código acima lê uma base de dados e executa as seguintes transformações em sequência:

- Remove as linhas que contenham *null* nas colunas `col1` e `col2`
- Converte a coluna `col3` de *bool* (`True`, `False`) para *int* (`1`, `0`)
- Remove as colunas `nosense_col1` e `nosense_col2`
- Preenche os valores *null* das colunas `col_with_nulls` e `another_col_with_nulls` com suas respectivas médias
- Preenche os valores *null* das colunas `col_with_nulls2` e `col_with_nulls3` com o valor fixo `-1`
- Aplica a função `custom_fn` no *dataframe*. Funções customizadas podem ser escritas para se encaixarem no pipeline, só precisam receber como parâmetro o *dataframe* e retornar o *dataframe* modificado
- Remove todos os *nulls* do *dataframe*

<a id="challenges"></a>
## Desafios

<a id="nubank-data-challenge"></a>
### [Nubank](https://github.com/adrianogfreitas/nubank_data_challenge)

Data Challenge construído através de uma parceria entre Nubank e Udacity. Uma descrição detalhada do problema pode ser encontrada [aqui](https://github.com/adrianogfreitas/nubank_data_challenge/blob/master/questions.md)

O objetivo final é construir um algoritmo que possibilite tomar uma decisão de crédito, devendo:
- Aprovar ou não um cliente novo
- Atribuir um limite inicial

Para tanto deverão ser construídos 3 modelos, sendo eles:
- Modelo para risco de crédito
- Modelo para propensão de gasto
- Modelo para prevenção à fraude

Como desafio extra, o tempo para entrega do desafio foi de 10 dias corridos.

<a id="ambev-data-challenge"></a>
### [Ambev](https://github.com/adrianogfreitas/ambev-data-challenge)

<a id="nlp"></a>
## NLP

<a id="tv-script-generation"></a>
### [TV Script Generation](https://github.com/adrianogfreitas/tv-script-generation)

<a id="keyword-extraction"></a>
### [Keyword Extraction](https://github.com/adrianogfreitas/keyword-extraction)

<a id="language-translation"></a>
### [Language Translation](https://github.com/adrianogfreitas/language-translation)

<a id="image"></a>
## Processamento de Imagem

<a id="face-generation"></a>
### [Face Generation](https://github.com/adrianogfreitas/face-generation)

<a id="cifar-10-image-classification"></a>
### [Classificação de Imagens](https://github.com/adrianogfreitas/cifar-10-image-classification)

<a id="churn"></a>
## Churn

<a id="telco_churn"></a>
### [Churn em Telecom (WIP)](https://github.com/adrianogfreitas/telco_churn)

<a id="outros"></a>
## Outros Projetos

<a id="bike-sharing-neural-network"></a>
### [Bike Sharing](https://github.com/adrianogfreitas/bike-sharing-neural-network)