**Instituto de Informática - UFG**

Disciplina: Inteligência Artificial

Prof. Cedric Luiz de Carvalho


Grupo ( D )

---


Aluna(o): Arthur Gomes de Siqueira

---

Aluna(o): Ricardo Ataide de Oliveira Junior

---

#Especificação do problema : Lógica nebulosa

O setor de aluguéis de imóveis movimenta milhões por ano. Com a pandemia do coronavírus, esse setor tem sido forçado a se reinventar, uma vez que o contato direto (presencial) entre os interessados em alugar um imóvel e os corretores tem sido prejudicado. Você foi contratado por uma empresa do setor para projetar e implementar um sistema que faça sugestões para os clientes de imóveis que possam ser do seu interesse. 

Utilizando a base de dados [brazilian_houses_to_rent](https://www.kaggle.com/rubenssjr/brasilian-houses-to-rent), projete e implemente um sistema de recomendação, baseado em lógica nebulosa, que identifique os imóveis mais adequados às necessidades de um determinado cliente.

Nesse projeto, devem ser identificadas as variáveis de entrada nebulosas, as quais devem ter, no mínimo, três faixas valores. Também deve ser definida uma variável de saída que indique a probabilidade do cliente se interessar por um dado imóvel.



## O trabalho

O trabalho deve ser feito em grupos, conforme definido. Cada grupo deverá entregar apenas um produto final para ser avaliado pelo professor. Apesar do trabalho ser feito em grupos, a avaliação de cada aluno será feita individualmente.


**Recomendações:**

   O primeiro passo para resolver um problema é entendê-lo muito bem, considerar o contexto e fazer as abstrações necessárias. A seguir, para não "reinventar a roda" é preciso identificar como a comunidade resolveu o problema em questão, ou problemas parecidos, cuja solução possa ser mapeada para situação em análise. Desta forma, deve ser feito um estudo, o mais amplo possível sobre esse assunto. O próximo passo é o grupo se reunir e instanciar o modelo em estudo para o caso específico do problema a ser resolvido. Em paralelo, uma análise rigorosa deve ser feita na base de dados a fim de prepará-la para seu uso no modelo. Finalmente, com o modelo bem compreendido e instanciado e os dados devidamente preparados, a implementação do modelo pode ser feita.
   
    

## Divisão de papéis:

* **Analista de dados:** deverá ficar responsável por fazer uma "Análise Exploratória de Dados" (AED), analisando a base de dados fornecida e preparando-a para ser usada na solução do problema. Esta análise deve produzir diversos gráficos que pemitam uma visão geral do comportamento dos dados.

* **Engenheiro de conhecimento:** deverá produzir a solução para o problema, utilizando a técnica estudada, o modelo proposto pelo grupo e a base de dados preparada pelo analista de dados.



In [None]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [None]:
import pandas as pd
import numpy as np 
import plotly.express as px

In [None]:
#Iniciando a carga dos dados
df1 = pd.read_csv('/content/drive/MyDrive/Raiz/Faculdade/2021.1/IC/Trabalhos/Atividade 8 - Fuzzy/houses_to_rent.csv')
df2 = pd.read_csv('/content/drive/MyDrive/Raiz/Faculdade/2021.1/IC/Trabalhos/Atividade 8 - Fuzzy/houses_to_rent_v2.csv')


In [None]:
print('=============================================================================')
print('Colunas: ',df1.columns)
print('=============================================================================')
print('Registros: ', len(df1))

Colunas:  Index(['Unnamed: 0', 'city', 'area', 'rooms', 'bathroom', 'parking spaces',
       'floor', 'animal', 'furniture', 'hoa', 'rent amount', 'property tax',
       'fire insurance', 'total'],
      dtype='object')
Registros:  6080


In [None]:
print('=============================================================================')
print('Colunas: ',df2.columns)
print('=============================================================================')
print('Registros: ', len(df2))

Colunas:  Index(['city', 'area', 'rooms', 'bathroom', 'parking spaces', 'floor',
       'animal', 'furniture', 'hoa (R$)', 'rent amount (R$)',
       'property tax (R$)', 'fire insurance (R$)', 'total (R$)'],
      dtype='object')
Registros:  10692


In [None]:
df2.head(5)

Unnamed: 0,city,area,rooms,bathroom,parking spaces,floor,animal,furniture,hoa (R$),rent amount (R$),property tax (R$),fire insurance (R$),total (R$)
0,São Paulo,70,2,1,1,7,acept,furnished,2065,3300,211,42,5618
1,São Paulo,320,4,4,0,20,acept,not furnished,1200,4960,1750,63,7973
2,Porto Alegre,80,1,1,1,6,acept,not furnished,1000,2800,0,41,3841
3,Porto Alegre,51,2,1,0,2,acept,not furnished,270,1112,22,17,1421
4,São Paulo,25,1,1,0,1,not acept,not furnished,0,800,25,11,836


In [None]:
fig = px.scatter(df2,x='total (R$)',y='area', title='Distribuição dos Dados - V1')
fig.show()

In [None]:
#Dados duplicados e outliers
df2[df2['total (R$)']== max(df2['total (R$)'])]
df2 = df2.drop(255)
df2 = df2.drop(6979)


In [None]:
#Valor do seguro muito maior do valor do aluguel 
df2[df2['total (R$)']== max(df2['total (R$)'])]
df2 = df2.drop(6645)


In [None]:
df2[df2['total (R$)']== max(df2['total (R$)'])]


Unnamed: 0,city,area,rooms,bathroom,parking spaces,floor,animal,furniture,hoa (R$),rent amount (R$),property tax (R$),fire insurance (R$),total (R$)
6230,São Paulo,340,5,4,2,7,acept,not furnished,220000,12000,1000,153,233200


In [None]:
fig = px.scatter(df2,x='total (R$)',y='area', title = 'Distribuição dos dados após limpeza inicial')
fig.show()

In [None]:
df2[df2['area']== max(df2['area'])]
df2 = df2.drop(df2[df2.area > 10000].index)

In [None]:
df2 = df2.drop(df2[df2['total (R$)'] > 50000].index)


In [None]:
fig = px.scatter(df2,x='total (R$)',y='area', title = 'Distribuição dos dados Final, com a remoção de todos os outliers')
fig.show()

## Validando os campos numéricos

In [None]:
for item in df2.columns:
    try:
      print('{} :{} '.format(item,np.isnan(df2[item]).unique()))
    except:
      print(item, 'não verificado')
# print('{} :{} '.format(item,np.isnan(df2[item]).unique()))

city não verificado
area :[False] 
rooms :[False] 
bathroom :[False] 
parking spaces :[False] 
floor não verificado
animal não verificado
furniture não verificado
hoa (R$) :[False] 
rent amount (R$) :[False] 
property tax (R$) :[False] 
fire insurance (R$) :[False] 
total (R$) :[False] 


In [None]:
df2.floor.unique()

array(['7', '20', '6', '2', '1', '-', '4', '3', '10', '11', '24', '9',
       '8', '17', '18', '5', '13', '15', '16', '14', '26', '12', '21',
       '19', '22', '27', '23', '35', '25', '46', '28', '29', '301', '51',
       '32'], dtype=object)

### Exportando DF para utilização na solução

In [None]:
df2.to_csv('/content/drive/MyDrive/Raiz/Faculdade/2021.1/IC/Trabalhos/Atividade 8 - Fuzzy/base_final.csv')

###Uma aplicação da lógica fuzzy em sistemas de decisão:
https://www.ime.unicamp.br/~cbsf4/Papers_IVCBSF/CBSF_2016_paper_56.pdf