# Base de dados

Informações referentes à base de dados de plugins de áudio

## Origem dos dados

Os dados foram obtidos de duas fontes:
* http://guitarpatches.com/patches.php?unit=G3
* XML contendo informações dos plugins de áudio (nome, categoria, parâmetros e valores dos parâmetros)

In [1]:
import pandas as pd

### `pedalboard-info.csv`

Enumera os pedalboards que foram baixados do site http://guitarpatches.com/patches.php?unit=G3: 
* `index`: índice do pedalboard no guitarpatches.com;
* `artist`: nome do artista;
* `date`: data do cadastro do pedalboad;
* `has_audio`: foi disponibilizado um áudio do pedalboard?;
* `has_video`: foi disponibilizado um vídeo do pedalboard?;
* `link`: link do pedalboard;
* `rating`: nota atribuída $\frac{\sum_{r \in Ratings} r}{|Ratings|}$, onde $r \in \mathbb{N}$ tal que $1 \leq r \leq 5$
* `total_downloads`: total de downloads realizados até o momento do scrapping;
* `uploader`: usuário responsável por compartilhar o pedalboard;

Essa lista é gerada pelo scrapping e é utilizada para fazer o download dos pedalboards.

In [2]:
pedalboards_data = pd.read_json('data/pedalboard-info.json').sort_index()
pedalboards_data.index = pedalboards_data['index']

del pedalboards_data['index']
pedalboards_data.to_csv('data/pedalboard-info.csv')

pedalboards_data.head(5)

Unnamed: 0_level_0,artist,date,has_audio,has_video,link,rating,title,total_downloads,uploader
index,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1
10148,Christina Hiro,2017-07-19,False,False,patches.php?mode=show&unit=G3&ID=10148,,Square Bass,46,Christina Hiro
10146,Vince Pastano,2017-07-14,True,False,patches.php?mode=show&unit=G3&ID=10146,5.0,Stupendo live Modena Park arpeggios guitar intro,140,An Stevens
10137,Arctic Monkeys,2017-07-06,True,False,patches.php?mode=show&unit=G3&ID=10137,,Do I Wanna Know,97,Joan
9923,Audioslave,2017-05-19,False,False,patches.php?mode=show&unit=G3&ID=9923,,Like A Stone - Verse,277,fingerdish
9924,Audioslave,2017-05-19,False,False,patches.php?mode=show&unit=G3&ID=9924,,Like A Stone - Chorus,212,fingerdish


### `plugin-category.csv`

Enumera informações sobre o plugin de áudio:

* `id`: índice do plugin de áudio para o equipamento `Zoom G3 version 2.x`;
* `category`: categoria na qual pertence; e,
* `name`: nome do plugin de áudio

In [3]:
plugins_categories = pd.read_csv('data/plugin-category.csv', index_col='id').sort_index()
plugins_categories.head(10)

Unnamed: 0_level_0,name,category
id,Unnamed: 1_level_1,Unnamed: 2_level_1
0,M-Filter,Filter_EQ
1,TheVibe,Modulation
2,Z-Organ,SFX
3,Slicer,Modulation
4,PhaseDly,Delay
5,FilterDly,Delay
6,PitchDly,Delay
7,StereoDly,Delay
8,BitCrush,Modulation
9,Bomber,SFX


### `pedalboard-plugin.csv`

Enumera os 6 plugins de áudio utilizados em um pedalboard.

* `id`: índice do pedalboard (em conformidade com `pedalboard-info.csv`);
* `name`: nome ASCII do pedalboard no equipamento. Tamanho: $10$ caracteres;
* `plugin1`: Plugin de áudio na posição 1
* `plugin2`: Plugin de áudio na posição 2
* `plugin3`: Plugin de áudio na posição 3
* `plugin4`: Plugin de áudio na posição 4
* `plugin5`: Plugin de áudio na posição 5
* `plugin6`: Plugin de áudio na posição 6

### `pedalboard-plugin-bag-of-words.csv`

Professor Amauri pediu para enumerar os plugins de áudio like bag of words.

* `id`: índice do pedalboard (em conformidade com `pedalboard-info.csv`);
* `name`: nome ASCII do pedalboard no equipamento. Tamanho: $10$ caracteres;
* `plugin ... plugin107` : Plugin de áudio na posição 1