In [1]:
import pandas as pd
import matplotlib.pyplot as plt
import plotly.express as px

In [26]:
# Importando base de dados
hoteis = pd.read_csv('/content/munnar.csv')

In [14]:
hoteis.head()

Unnamed: 0,Hotel Name,Rating,Rating Description,Reviews,Star Rating,Location,Nearest Landmark,Distance to Landmark,Price,Tax
0,Gokulam Park,4.1,Very Good,1058,4.0,Chithirapuram,city centre,10.2 km,2728,574
1,Sterling Munnar,3.8,Very Good,1088,4.0,Chinnakanal,city centre,19.2 km,4451,969
2,Issacs Residency,4.1,Very Good,322,3.0,Central Munnar,Attukal Waterfalls,950 m,2758,684
3,Tea Valley Resort,4.3,Excellent,1337,4.0,Pallivasal,city centre,4.8 km,2675,756
4,Grand Plaza,4.3,Excellent,1058,4.0,Moolakadai,Attukal Waterfalls,1.9 km,3203,654


In [None]:
hoteis.info()

In [27]:
# Alterando nomes desconfigurados das colunas
hoteis.columns = hoteis.columns.str.strip()

In [None]:
# Arrumando formato dos valores
hoteis['Price'] = hoteis['Price'].str.replace(',', '').astype(float)

In [30]:
# Transformando rúpias em reais
price_real = hoteis['Price'] * 0.05
posicao = 9
hoteis.insert(posicao, 'Price_real', price_real)

In [31]:
hoteis.head()

Unnamed: 0,Hotel Name,Rating,Rating Description,Reviews,Star Rating,Location,Nearest Landmark,Distance to Landmark,Price,Price_real,Tax
0,Gokulam Park,4.1,Very Good,1058,4.0,Chithirapuram,city centre,10.2 km,2728.0,136.4,574
1,Sterling Munnar,3.8,Very Good,1088,4.0,Chinnakanal,city centre,19.2 km,4451.0,222.55,969
2,Issacs Residency,4.1,Very Good,322,3.0,Central Munnar,Attukal Waterfalls,950 m,2758.0,137.9,684
3,Tea Valley Resort,4.3,Excellent,1337,4.0,Pallivasal,city centre,4.8 km,2675.0,133.75,756
4,Grand Plaza,4.3,Excellent,1058,4.0,Moolakadai,Attukal Waterfalls,1.9 km,3203.0,160.15,654


In [None]:
hoteis.describe()

In [46]:
# Criando faixas de valores
faixa1 = hoteis[hoteis["Price_real"] <= 200]
faixa2 = hoteis[(hoteis["Price_real"] > 200) & (hoteis["Price_real"] <= 400)]
faixa3 = hoteis[hoteis["Price_real"] > 400]

# Contagem de produtos em cada faixa de valor
contagem_faixa1 = len(faixa1)
contagem_faixa2 = len(faixa2)
contagem_faixa3 = len(faixa3)

# Preparando os dados para o gráfico
count_df = {'contagens': [contagem_faixa1, contagem_faixa2, contagem_faixa3],
            'faixas': ["Até 200 reais", "Entre 200 e 400 reais", "Acima de 400 reais"]}
count_df = pd.DataFrame(count_df)

# Gráfico de barras
count_plot = px.bar(count_df, x='faixas', y='contagens', title='Distribuição de hotéis por faixas de valor')

count_plot.update_layout(
    title_font_size=30,  # Tamanho do título
    xaxis_title='Valores',  # Título do eixo X
    yaxis_title='Hotéis',  # Título do eixo Y
    xaxis=dict(tickfont=dict(size=14)),  # Tamanho da fonte dos rótulos do eixo X
    yaxis=dict(tickfont=dict(size=14)),   # Tamanho da fonte dos rótulos do eixo Y
    xaxis_showgrid=False,  # Mostrar linhas de grade no eixo X
    yaxis_showgrid=False,   # Mostrar linhas de grade no eixo Y
    plot_bgcolor='rgba(0,0,0,0)'
)

count_plot.update_traces(
    marker_color='#C8F71E',
    hovertemplate='Hotéis: %{y}',
    width=0.4, selector=dict(type='bar'))

count_plot.write_html('count_plot.html')