## Informações sobre o DataSet

Este dataset tem registros de uma matriz de 8 sensores de gaz MOX, além de temperatura e Humidade. Estes sensoresforam expostos a atividade de dois diferentes estímulos: banana e vinho. As respostas para os estimulos de vinho e banana foram registradas colocando-se os estimuladores próximos aos sensores. A duração de cada estímulo variou entre 7 minutos a duas horas, sendo a media de duração de 42 minutos. Este conjunto de dados contem um conjunto de séries temporais de tres diferentes condições: estímulos por vinho, banana e atividade de backgroud/segundo plano. Existem 36 induções por vinho, 33 de banana e 31 de atividades de background/segundo plano. Uma possível aplicação e a discriminação entre vinho, banana e atividade de background/segundo plano.

Este dataset é composto de dois arquivos HT_sensor_dataset.dat (zipado), onde as séries temporais são armazendadas, além do HT_Sensor_metadata.dat, onde metadados para cada indução são armazenados. Cada indução é unicamqente identificada pelo campo "id" em ambos os arquivos. Por isso, metadados para uma particular indução podem ser facilmente localizados, correspondondo-se as colunas id de cada arquivo.

#### Reference: 
http://archive.ics.uci.edu/ml/datasets/Gas+sensors+for+home+activity+monitoring<br>
https://moisesomena.gitbooks.io/dw-bi/content/sensors-data.html

In [1]:
#!pip install pandas

In [2]:
import pandas as pd

In [3]:
#!pip install psycopg2

In [4]:
import psycopg2 

In [5]:
#!pip install sqlalchemy

In [6]:
from sqlalchemy import create_engine

In [7]:
HT_Sensor_metadata = pd.read_table("HT_Sensor_metadata.dat")
HT_Sensor_metadata.head()

Unnamed: 0,id,date,Unnamed: 2,class,t0,dt
0,0,07-04-15,banana,13.49,1.64,
1,1,07-05-15,wine,19.61,0.54,
2,2,07-06-15,wine,19.99,0.66,
3,3,07-09-15,banana,6.49,0.72,
4,4,07-09-15,wine,20.07,0.53,


In [8]:
#dados_sensores.columns = ['a', 'b', 'c', 'd', 'e','f']
#dados_sensores

In [9]:
HT_Sensor_metadata.rename(columns={'Unnamed: 2': 'class', 'class': 't0','t0': 'dt','dt': 'discarte'}, inplace=True)

In [10]:
colunas=HT_Sensor_metadata.columns[:-1]
lista_colunas = list(colunas)
lista_colunas

['id', 'date', 'class', 't0', 'dt']

In [11]:
hts_metadata_ajust=HT_Sensor_metadata[lista_colunas].set_index('id')

In [12]:
hts_metadata_ajust.head()

Unnamed: 0_level_0,date,class,t0,dt
id,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
0,07-04-15,banana,13.49,1.64
1,07-05-15,wine,19.61,0.54
2,07-06-15,wine,19.99,0.66
3,07-09-15,banana,6.49,0.72
4,07-09-15,wine,20.07,0.53


In [13]:
HT_Sensor_dataset=pd.read_table('HT_Sensor_dataset.dat',sep='\s+')

In [14]:
HT_Sensor_dataset.head()

Unnamed: 0,id,time,R1,R2,R3,R4,R5,R6,R7,R8,Temp.,Humidity
0,0,-0.99975,12.8621,10.3683,10.4383,11.6699,13.4931,13.3423,8.04169,8.73901,26.2257,59.0528
1,0,-0.999472,12.8617,10.3682,10.4375,11.6697,13.4927,13.3412,8.04133,8.73908,26.2308,59.0299
2,0,-0.999194,12.8607,10.3686,10.437,11.6696,13.4924,13.3405,8.04101,8.73915,26.2365,59.0093
3,0,-0.998916,12.8602,10.3686,10.437,11.6697,13.4921,13.3398,8.04086,8.73936,26.2416,58.9905
4,0,-0.998627,12.8595,10.3688,10.4374,11.6699,13.4919,13.339,8.04087,8.73986,26.2462,58.9736


In [15]:
hts_data_ajust=HT_Sensor_dataset.set_index('id')

In [16]:
engine=create_engine('postgresql://postgres:123456@localhost:5432/gas_sensor')

In [17]:
hts_metadata_ajust.to_sql(name='hts_metadata',con=engine,if_exists='replace')

In [18]:
hts_data_ajust.to_sql(name='hts_dataset',con=engine,if_exists='replace')

## Obtendo amostra com junção dos dados

In [21]:
sample_metadata=hts_metadata_ajust.sample(n=30)

In [22]:
sample_data = hts_data_ajust.sample(3000)

In [24]:
meta_join_data = sample_metadata.join(sample_data)

In [26]:
meta_join_data.sample(n=30)

Unnamed: 0_level_0,date,class,t0,dt,time,R1,R2,R3,R4,R5,R6,R7,R8,Temp.,Humidity
id,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1
15,07-22-15,banana,16.54,0.72,-0.253365,12.917,10.0506,10.1782,11.2952,13.7279,12.8846,5.50454,5.94624,28.659,56.5249
14,07-21-15,wine,23.62,0.38,-0.165263,12.6128,10.0706,10.1687,11.3405,13.744,12.6998,5.45642,5.90699,27.2518,63.9586
16,07-22-15,banana,20.6,1.32,2.281376,11.9125,8.18246,8.30438,9.2537,11.2057,11.7714,4.70179,5.03326,27.5269,59.8597
0,07-04-15,banana,13.49,1.64,-0.854448,13.0364,10.6113,10.676,11.9437,13.8398,13.5639,8.07801,8.79689,26.1605,58.718
67,09-08-15,wine,18.15,0.84,-0.975662,12.6431,9.56065,9.75867,10.7681,12.544,17.5007,6.32892,7.05325,28.88,49.9972
39,08-19-15,banana,7.31,1.69,2.606224,12.1818,8.64318,7.15759,9.55524,8.23891,15.998,3.84502,4.87899,25.8343,54.8882
93,09-09-15,background,15.16,0.94,0.172742,12.8036,9.57239,9.66872,10.8275,10.7938,17.161,6.26286,6.71125,26.2802,53.7855
72,08-06-15,background,13.4,0.93,-0.18766,12.2983,9.60544,9.75677,10.8058,10.1011,16.2838,5.49289,5.99301,28.2474,59.8373
77,08-13-15,background,14.25,0.43,-0.483478,12.084,8.78765,8.94364,9.94867,7.92324,15.2652,4.29704,3.95511,28.0402,56.8455
94,09-10-15,background,14.94,0.79,-0.351022,12.6999,9.64457,9.75219,10.8997,12.8837,17.2206,5.66999,6.2476,24.7588,57.0976


#### Select simples