<a id="ancora3"></a>
## <b> 3. Análise exploratória </b>

A análise exploratória dos dados das API's do Google Maps Reviews e Google Maps Place Results é crucial para <b>compreender as características dos estabelecimentos presentes na plataforma</b>. Através da análise de diversos datasets, é possível obter insights valiosos sobre os horários de operação, informações gerais, opções de serviço ofertados e horários de movimento dos estabelecimentos, permitindo que nosso trabalho tenha um planejamento e organização voltado as informações de maior relevância.

Ao explorar esses dados, é possível <i>identificar tendências, padrões e correlações que podem ser usados para obter uma compreensão mais profunda das necessidades e comportamentos dos clientes em relação aos estabelecimentos e serviços que eles procuram</i>. Isso pode levar a <b>insights valiosos</b> sobre as preferências do público-alvo, concorrência, e até mesmo possíveis oportunidades de negócios e escolhas dos usuários.

Em resumo, a análise exploratória dos dados das API's do Google Maps Reviews e Google Maps Place Results, com bibliotecas de gráficos e mapas, é <b>fundamental para o entendimento geral do problema e identificação dos principais pontos a serem utilizados na modelagem, dashboard e até API</b>.


### Bibliotecas 

In [38]:
import pandas as pd
import plotly.express as px
import folium
import plotly.graph_objs as go
import re
pd.set_option('display.max_columns', 30) # mostrar todas as colunas no terminal

### Importando dataframes

In [39]:
# dataset sobre horários de operação de diversos estabelecimentos
df_op = pd.read_csv('df_operating_hours.csv', sep=',')

In [40]:
df_op.head()

Unnamed: 0,title,place_id,sunday,monday,tuesday,wednesday,thursday,friday,saturday
0,Sagrado Almoço,ChIJU008MZNTzpQRpjpsv33pRQs,Closed,8 am–8 pm,8 am–8 pm,8 am–8 pm,8 am–8 pm,8 am–8 pm,8 am–8 pm
1,2 L's Restaurante E Bar Almoço-Lanches,ChIJU4W1hWVezpQRb7UZOCXHQNk,Closed,11:30 am–2:30 pm,11:30 am–2:30 pm,11:30 am–2:30 pm,11:30 am–2:30 pm,11:30 am–2:30 pm,11:30 am–2:30 pm
2,Brasiliano Restaurante,ChIJhbffCo6KxZQREb1Ryt2u80Y,Closed,11 am–2:30 pm,11 am–2:30 pm,11 am–2:30 pm,11 am–2:30 pm,11 am–2:30 pm,11 am–2:30 pm
3,Sirva-se Almoço,ChIJzfUSXO74zpQRhxWMHFXJ9-8,Closed,11 am–3 pm,11 am–3 pm,11 am–3 pm,11 am–3 pm,11 am–3 pm,Closed
4,Speed Almoço,ChIJR5o7uexWzpQR4NL-w4Fybvg,Closed,11 am–10 pm,11 am–10 pm,11 am–10 pm,11 am–10 pm,11 am–10 pm,11 am–10 pm


In [41]:
# dataset sobre informações gerais de diversos estabelecimentos
df_ov = pd.read_csv('df_overview.csv', sep=',')

In [42]:
df_ov.head()

Unnamed: 0,position,title,place_id,data_id,data_cid,rating,reviews,price,type,address,latitude,longitude,open_state,description,thumbnail
0,1,Sagrado Almoço,ChIJU008MZNTzpQRpjpsv33pRQs,0x94ce5393313c4d53:0xb45e97dbf6c3aa6,812312034101967526,4.6,14.0,,Restaurant,"Estr. do Campo Limpo, 992 - Vila Prel, São Pau...",-23.647919,-46.762998,Open ⋅ Closes 8 pm,,https://lh5.googleusercontent.com/p/AF1QipO1TL...
1,2,2 L's Restaurante E Bar Almoço-Lanches,ChIJU4W1hWVezpQRb7UZOCXHQNk,0x94ce5e6585b58553:0xd940c7253819b56f,15654731267408770415,4.6,17.0,,Restaurant,"Rua Coronel Marques, 399 - Vila Nova Mancheste...",-23.543091,-46.545526,Opens soon ⋅ 11:30 am,,https://streetviewpixels-pa.googleapis.com/v1/...
2,3,Brasiliano Restaurante,ChIJhbffCo6KxZQREb1Ryt2u80Y,0x94c58a8e0adfb785:0x46f3aeddca51bd11,5112622269601004817,4.5,881.0,£,Buffet restaurant,"Av. Prof. Arthur Fonseca, 841 - Jardim Faculda...",-23.515907,-47.463541,Open ⋅ Closes 2:30 pm,,https://lh5.googleusercontent.com/p/AF1QipP11R...
3,4,Sirva-se Almoço,ChIJzfUSXO74zpQRhxWMHFXJ9-8,0x94cef8ee5c12f5cd:0xeff7c9551c8c1587,17291510661700654471,4.5,201.0,,Buffet restaurant,"R. Conselheiro Ribas, 330 - Vila Anastácio, Sã...",-23.514702,-46.720743,Closed ⋅ Opens 11 am Mon,,https://lh5.googleusercontent.com/p/AF1QipOzyq...
4,5,Speed Almoço,ChIJR5o7uexWzpQR4NL-w4Fybvg,0x94ce56ecb93b9a47:0xf86e7281c3fed2e0,17901371470508905184,4.5,26.0,,Restaurant,"Rua Dr. SÍlvio Dante Bertacchi, 253 - Vila Son...",-23.596165,-46.729929,Open ⋅ Closes 10 pm,,https://lh5.googleusercontent.com/p/AF1QipMMLu...


In [43]:
# dataset sobre opções de serviço ofertados de diversos estabelecimentos
df_so = pd.read_csv('df_service_options.csv', sep=',')

In [44]:
df_so.head()

Unnamed: 0,title,place_id,dine_in,takeout,delivery,drive_through
0,Sagrado Almoço,ChIJU008MZNTzpQRpjpsv33pRQs,True,True,False,False
1,2 L's Restaurante E Bar Almoço-Lanches,ChIJU4W1hWVezpQRb7UZOCXHQNk,True,True,True,False
2,Brasiliano Restaurante,ChIJhbffCo6KxZQREb1Ryt2u80Y,True,True,False,False
3,Sirva-se Almoço,ChIJzfUSXO74zpQRhxWMHFXJ9-8,True,True,True,False
4,Speed Almoço,ChIJR5o7uexWzpQR4NL-w4Fybvg,True,True,False,False


In [45]:
# dataset sobre horários de movimento de diversos estabelecimentos
df_hm = pd.read_csv('horarios_movimento.csv', sep=',')

In [46]:
df_hm.head()

Unnamed: 0,sunday,monday,tuesday,wednesday,thursday,friday,saturday,title
0,"{'time': '6\u202fAM', 'busyness_score': 0}","{'time': '6\u202fAM', 'busyness_score': 0}","{'time': '6\u202fAM', 'busyness_score': 0}","{'time': '6\u202fAM', 'busyness_score': 0}","{'time': '6\u202fAM', 'busyness_score': 0}","{'time': '6\u202fAM', 'busyness_score': 0}","{'time': '6\u202fAM', 'busyness_score': 0}",Por um Punhado de Dólares
1,"{'time': '7\u202fAM', 'busyness_score': 0}","{'time': '7\u202fAM', 'busyness_score': 0}","{'time': '7\u202fAM', 'busyness_score': 0}","{'time': '7\u202fAM', 'busyness_score': 0}","{'time': '7\u202fAM', 'busyness_score': 0}","{'time': '7\u202fAM', 'busyness_score': 0}","{'time': '7\u202fAM', 'busyness_score': 0}",Por um Punhado de Dólares
2,"{'time': '8\u202fAM', 'busyness_score': 0}","{'time': '8\u202fAM', 'busyness_score': 0}","{'time': '8\u202fAM', 'busyness_score': 0}","{'time': '8\u202fAM', 'busyness_score': 0}","{'time': '8\u202fAM', 'busyness_score': 0}","{'time': '8\u202fAM', 'busyness_score': 0}","{'time': '8\u202fAM', 'busyness_score': 0}",Por um Punhado de Dólares
3,"{'time': '9\u202fAM', 'busyness_score': 0}","{'time': '9\u202fAM', 'busyness_score': 0}","{'time': '9\u202fAM', 'busyness_score': 0}","{'time': '9\u202fAM', 'busyness_score': 0}","{'time': '9\u202fAM', 'busyness_score': 0}","{'time': '9\u202fAM', 'busyness_score': 0}","{'time': '9\u202fAM', 'busyness_score': 0}",Por um Punhado de Dólares
4,"{'time': '10\u202fAM', 'info': 'Usually not to...","{'time': '10\u202fAM', 'info': 'Usually not to...","{'time': '10\u202fAM', 'info': 'Usually not to...","{'time': '10\u202fAM', 'info': 'Usually not to...","{'time': '10\u202fAM', 'info': 'Usually not to...","{'time': '10\u202fAM', 'info': 'Usually not to...","{'time': '10\u202fAM', 'info': 'Usually not to...",Por um Punhado de Dólares


In [47]:
# dataset sobre estabelecimentos relacionados com informações gerais
df_tp = pd.read_csv('tambem_procuram.csv', sep=',')

In [48]:
df_tp.head()

Unnamed: 0,estabelecimento_referencia,position,title,rating,reviews,type,thumbnail,latitude,longitude
0,Por um Punhado de Dólares,1,YERBA + Por um Punhado de Dólares,4.8,931,"['Coffee shop', 'Bar', 'Book store', 'Pub', 'R...",https://lh5.googleusercontent.com/p/AF1QipO7UG...,-23.534373,-46.652746
1,Por um Punhado de Dólares,2,Urbe Cafe Bar,4.5,5879,"['Coffee store', 'Bar', 'Brunch', 'Coffee shop']",https://lh5.googleusercontent.com/p/AF1QipOGuR...,-23.555976,-46.658378
2,Por um Punhado de Dólares,3,KOF - King of The Fork,4.5,1945,"['Coffee store', 'Breakfast', 'Coffee shop']",https://lh5.googleusercontent.com/p/AF1QipMeeB...,-23.564052,-46.683767
3,Por um Punhado de Dólares,4,Café Girondino,4.5,6548,"['Cafe', 'Breakfast', 'Cafeteria', 'Cocktail b...",https://lh5.googleusercontent.com/p/AF1QipO9py...,-23.544683,-46.634228
4,Por um Punhado de Dólares,5,Barões do Cafe,4.1,122,['Coffee shop'],https://lh5.googleusercontent.com/p/AF1QipMT6j...,-23.55718,-46.663046


### Organizando datasets

In [49]:
# juntando os dataset que contem a coluna "place_id" para termos as informações de estabelecimentos em um único lugar
df_junto = pd.merge(df_op, df_ov, on='place_id', how='outer')
df_estabelecimentos = pd.merge(df_junto, df_so, on='place_id', how='outer')

In [50]:
df_estabelecimentos = df_estabelecimentos.drop(['title_x', 'title_y'], axis=1)
df_estabelecimentos.head()

Unnamed: 0,place_id,sunday,monday,tuesday,wednesday,thursday,friday,saturday,position,data_id,data_cid,rating,reviews,price,type,address,latitude,longitude,open_state,description,thumbnail,title,dine_in,takeout,delivery,drive_through
0,ChIJU008MZNTzpQRpjpsv33pRQs,Closed,8 am–8 pm,8 am–8 pm,8 am–8 pm,8 am–8 pm,8 am–8 pm,8 am–8 pm,1,0x94ce5393313c4d53:0xb45e97dbf6c3aa6,812312034101967526,4.6,14.0,,Restaurant,"Estr. do Campo Limpo, 992 - Vila Prel, São Pau...",-23.647919,-46.762998,Open ⋅ Closes 8 pm,,https://lh5.googleusercontent.com/p/AF1QipO1TL...,Sagrado Almoço,True,True,False,False
1,ChIJU4W1hWVezpQRb7UZOCXHQNk,Closed,11:30 am–2:30 pm,11:30 am–2:30 pm,11:30 am–2:30 pm,11:30 am–2:30 pm,11:30 am–2:30 pm,11:30 am–2:30 pm,2,0x94ce5e6585b58553:0xd940c7253819b56f,15654731267408770415,4.6,17.0,,Restaurant,"Rua Coronel Marques, 399 - Vila Nova Mancheste...",-23.543091,-46.545526,Opens soon ⋅ 11:30 am,,https://streetviewpixels-pa.googleapis.com/v1/...,2 L's Restaurante E Bar Almoço-Lanches,True,True,True,False
2,ChIJhbffCo6KxZQREb1Ryt2u80Y,Closed,11 am–2:30 pm,11 am–2:30 pm,11 am–2:30 pm,11 am–2:30 pm,11 am–2:30 pm,11 am–2:30 pm,3,0x94c58a8e0adfb785:0x46f3aeddca51bd11,5112622269601004817,4.5,881.0,£,Buffet restaurant,"Av. Prof. Arthur Fonseca, 841 - Jardim Faculda...",-23.515907,-47.463541,Open ⋅ Closes 2:30 pm,,https://lh5.googleusercontent.com/p/AF1QipP11R...,Brasiliano Restaurante,True,True,False,False
3,ChIJzfUSXO74zpQRhxWMHFXJ9-8,Closed,11 am–3 pm,11 am–3 pm,11 am–3 pm,11 am–3 pm,11 am–3 pm,Closed,4,0x94cef8ee5c12f5cd:0xeff7c9551c8c1587,17291510661700654471,4.5,201.0,,Buffet restaurant,"R. Conselheiro Ribas, 330 - Vila Anastácio, Sã...",-23.514702,-46.720743,Closed ⋅ Opens 11 am Mon,,https://lh5.googleusercontent.com/p/AF1QipOzyq...,Sirva-se Almoço,True,True,True,False
4,ChIJR5o7uexWzpQR4NL-w4Fybvg,Closed,11 am–10 pm,11 am–10 pm,11 am–10 pm,11 am–10 pm,11 am–10 pm,11 am–10 pm,5,0x94ce56ecb93b9a47:0xf86e7281c3fed2e0,17901371470508905184,4.5,26.0,,Restaurant,"Rua Dr. SÍlvio Dante Bertacchi, 253 - Vila Son...",-23.596165,-46.729929,Open ⋅ Closes 10 pm,,https://lh5.googleusercontent.com/p/AF1QipMMLu...,Speed Almoço,True,True,False,False


In [51]:
# df_estabelecimentos.to_csv('info_estabelecimentos.csv', index=False)

### Analisando dados e informações

#### Dataset informações gerais do estabelecimento 

In [52]:
# Plotar um histograma da coluna 'rating'
fig = go.Figure(
    [go.Histogram(
        x=df_estabelecimentos['rating'],
        nbinsx=10
    )])

fig.update_layout(
    title='Distribuição da Classificação Média dos Locais',
    xaxis_title='Classificação Média',
    yaxis_title='Frequência')

fig.show()

O histograma mostra que a maioria dos locais tem uma classificação média entre 4.3 e 4.7, o que indica que a qualidade dos locais é geralmente bem avaliada pelos clientes. Há também uma pequena quantidade de locais com classificação média abaixo de 3.7, o que indica que temos em nossa base poucos estabelecimentos com problemas de qualidade.

In [53]:
# converte os dias da semana para uma lista
dias_da_semana = ['sunday', 'monday', 'tuesday', 'wednesday', 'thursday', 'friday', 'saturday']

# cria um dicionário para armazenar a soma da quantidade de restaurantes abertos por dia da semana
quantidade_por_dia = {}
for dia in dias_da_semana:
    quantidade_por_dia[dia] = len(df_estabelecimentos[df_estabelecimentos[dia] != 'Closed'])

# cria o gráfico de barras
fig = go.Figure(
    [go.Bar(
        x=dias_da_semana,
        y=list(quantidade_por_dia.values())
    )])

fig.update_layout(
    title='Quantidade de Estabelecimentos Abertos por Dia da Semana',
    xaxis_title='Dia da Semana',
    yaxis_title='Quantidade de Estabelecimentos',
    xaxis_tickangle=--30)

fig.show()

O gráfico de barras mostra a quantidade de estabelecimentos abertos por dia da semana, revelando que quarta-feira, quinta-feira e sexta-feira são os dias em que a maioria dos estabelecimentos estão abertos, enquanto domingo é o dia em que menos estabelecimentos estão abertos, provavelmente para descanso dos funcionários, ou ainda, para reduzir custos com energia elétrica e outros gastos fixos pelo menor movimento em comparação aos outros dias. Isso pode ser útil para ajudar a planejar atividades de alimentação fora de casa e para entender melhor os hábitos dos estabelecimentos.

In [54]:
# Agrupar por categoria e contar a quantidade de ocorrências
frequencia_tipo = df_estabelecimentos.groupby('type').size().reset_index(name='quantidade')

# Ordenar em ordem decrescente pela quantidade
frequencia_tipo = frequencia_tipo.sort_values(by='quantidade', ascending=False)

# Selecionar apenas as 5 categorias com maior frequência
top_10 = frequencia_tipo.iloc[:10]

# Criar o gráfico de barras
fig = px.bar(top_10, x='type', y='quantidade', color='type')

# Configurar o layout do gráfico
fig.update_layout(title='Top 10 Categorias de Restaurantes', xaxis_title='Categoria', yaxis_title='Quantidade')

# Exibir o gráfico
fig.show()

In [55]:
# Selecionar os tipos de estabelecimentos a serem analisados
tipos_selecionados = ['Restaurant', 'Bar', 'Pizza restaurant', 'Snack bar', 'Fast food restaurant']

# Criar um dicionário para armazenar a quantidade de estabelecimentos abertos por dia da semana para cada tipo
dados_por_tipo = {}
for tipo in tipos_selecionados:
    df_tipo = df_estabelecimentos[df_estabelecimentos['type'] == tipo]
    quantidade_por_dia = {}
    for dia in dias_da_semana:
        quantidade_por_dia[dia] = len(df_tipo[df_tipo[dia] != 'Closed'])
    dados_por_tipo[tipo] = quantidade_por_dia

# Criar o gráfico de barras empilhadas
fig = go.Figure()
for tipo in tipos_selecionados:
    fig.add_trace(go.Bar(
        x=dias_da_semana,
        y=list(dados_por_tipo[tipo].values()),
        name=tipo
    ))

fig.update_layout(
    title='Quantidade de Estabelecimentos Abertos por Dia da Semana',
    xaxis_title='Dia da Semana',
    yaxis_title='Quantidade de Estabelecimentos',
    barmode='stack',
    xaxis_tickangle=-30
)

fig.show()

Para analisar melhor a abertura dos estabelecimentos por categoria, vemos nesse primeiro gráfico de barras as top 10 categorias que mais possuem estabelecimentos cadastrados no nosso dataset, entre els restaurantes, bar, pizzaria, snack bar, fast food, hamburgueria, sorveteria, restaurante italiano, buffet e padaria. Levando em conta as 5 top categorias podemos observar que a maioria dos restaurantes abre às quintas-feiras e que os domingos são os dias com menos estabelecimentos abertos. Já para bares, a maior quantidade de estabelecimentos abertos é aos sábados, enquanto as segundas-feiras possuem a menor quantidade. Nas pizzarias, sábados também são o dia com mais estabelecimentos abertos e as segundas-feiras possuem a menor quantidade. Para os snack bars, quintas-feiras têm a maior quantidade de estabelecimentos abertos e as segundas-feiras possuem a menor quantidade. Por fim, fast foods têm a maior quantidade de estabelecimentos abertos às quintas-feiras e a menor quantidade aos domingos.

Esses resultados podem ser explicados por ser comum que as pessoas saiam para jantar ou beber em bares e restaurantes às quintas-feiras, após um dia de trabalho, enquanto nos domingos muitas pessoas preferem ficar em casa com a família. Já aos sábados, pode haver maior procura por estabelecimentos de entretenimento noturno, o que explicaria a maior quantidade de bares e pizzarias abertas neste dia. Em geral, essas informações podem ser úteis para os proprietários desses estabelecimentos, permitindo que eles possam otimizar seus horários de funcionamento para atender melhor à demanda de seus clientes. 

In [56]:
# calcula a frequência de cada serviço
freq_servicos = df_estabelecimentos[['dine_in', 'takeout', 'delivery', 'drive_through']].sum()

# cria o gráfico de pizza com a frequência de cada serviço
fig = go.Figure(
    go.Pie(
        labels=freq_servicos.index.tolist(),
        values=freq_servicos.values.tolist(),
        hole=0.4,
        textposition='inside',
        textinfo='percent+label'
    ))

fig.update_layout(
    title='Disponibilidade de Serviços nos Locais',)

fig.show()

Podemos observar que a maioria dos estabelecimentos disponibilizam o serviço de "dine in" (46,6%), seguido do serviço "takeout" (41,9%). O serviço de "delivery" é oferecido em apenas 10,1% dos locais e o serviço de "drive through" é o menos comum, disponível em somente 1,36% dos estabelecimentos. Essas informações podem ser úteis para entender as preferências dos consumidores e ajudar os empreendedores a decidir quais serviços oferecer em seus estabelecimentos

In [57]:
# selecionar as colunas de interesse
df_servicos = df_estabelecimentos[['type', 'dine_in', 'takeout', 'delivery', 'drive_through']]

# agrupar por tipo de estabelecimento e calcular a frequência de cada serviço
freq_servicos_por_tipo = df_servicos.groupby('type').sum()

# calcular a porcentagem de cada serviço para cada tipo de estabelecimento
porcentagem_servicos_por_tipo = (freq_servicos_por_tipo.div(freq_servicos_por_tipo.sum(axis=1), axis=0) * 100).round(2)

# mostrar a tabela de porcentagem de serviços por tipo de estabelecimento
print(porcentagem_servicos_por_tipo)

                              dine_in  takeout  delivery  drive_through
type                                                                   
Adult entertainment club          NaN      NaN       NaN            NaN
Advertising agency                NaN      NaN       NaN            NaN
African restaurant              50.00    50.00      0.00            0.0
American restaurant             43.48    34.78     13.04            8.7
Andalusian restaurant          100.00     0.00      0.00            0.0
...                               ...      ...       ...            ...
Wine store                      33.33    33.33     33.33            0.0
Wine wholesaler and importer    50.00     0.00     50.00            0.0
Yakisoba Restaurant             50.00    50.00      0.00            0.0
Yakitori restaurant             50.00    50.00      0.00            0.0
Zoo                               NaN      NaN       NaN            NaN

[327 rows x 4 columns]


Agora exploramos mais a porcentagem presença de cada tipo de restaurante em cada segmento, e é notável que dine in e takeout são muito presentes na maioria das categorias, principalmente aquelas que envolvem restaurantes e lojas ao contrário de delivery e drive through que se concentram em segmentos mais de fast food, comida americana e lojas de bebidas 

In [58]:
# Contar valores nulos e não nulos na coluna de descrição
print(df_estabelecimentos['description'].isnull().value_counts())

True     7681
False    2319
Name: description, dtype: int64


A grande maioria dos estabelecimentos (aproximadamente 76,81%) não possui descrição disponível nessa coluna. Já os outros 23,19% possuem algum tipo de descrição cadastrada. É importante considerar que a falta de descrição pode dificultar a busca e seleção de estabelecimentos pelos clientes, além de limitar a informação disponível para análise.

In [59]:
# Contar valores nulos e não nulos na coluna de endereço
print(df_estabelecimentos['address'].isnull().value_counts())

False    9936
True       64
Name: address, dtype: int64


A grande maioria dos estabelecimentos (99,36%) possui informações de endereço preenchidas, enquanto apenas 0,64% dos estabelecimentos (0,64%) não possuem essa informação. Podemos pensar que essa minoria que não possui endereço sejam estabelecimentos online que não possuem nenhum tipo de endereço físico.

In [60]:
df_estabelecimentos = df_estabelecimentos.dropna(subset=['latitude', 'longitude'])

# Criar um mapa com a localização dos locais
mapa = folium.Map(location=[df_estabelecimentos['latitude'].mean(), df_estabelecimentos['longitude'].mean()], zoom_start=12)

for i, row in df_estabelecimentos.iterrows():
    folium.Marker(location=[row['latitude'], row['longitude']]).add_to(mapa)

# Exibir o mapa
mapa

Mapa com todos os estabelecimentos e suas localizações para explorar regiões e estabelecimentos pelo mapa de São Paulo

#### Dataset sobre os horários de movimento

Ajustando dataset para ter somente o valor do busyness_score de cada restaurante com seu nome

In [61]:
# Selecionar as colunas desejadas
colunas_dias_semana = ['sunday', 'monday', 'tuesday', 'wednesday', 'thursday', 'friday', 'saturday']
df_dias_semana = df_hm[colunas_dias_semana]

# Definir a função para extrair o valor do busyness_score
def extrair_score(coluna):
    # Extrair o valor usando regex
    match = re.search("'busyness_score':\s*(\d+)", str(coluna))
    if match:
        return match.group(1)
    else:
        return None

# Aplicar a função a todas as colunas selecionadas
df_dds = df_dias_semana.apply(lambda x: x.apply(extrair_score))

# Concatenar as colunas em um novo dataframe
df_final = pd.concat([df_hm['title'], df_dds], axis=1)

# Exibir o resultado
df_final

Unnamed: 0,title,sunday,monday,tuesday,wednesday,thursday,friday,saturday
0,Por um Punhado de Dólares,0,0,0,0,0,0,0
1,Por um Punhado de Dólares,0,0,0,0,0,0,0
2,Por um Punhado de Dólares,0,0,0,0,0,0,0
3,Por um Punhado de Dólares,0,0,0,0,0,0,0
4,Por um Punhado de Dólares,27,39,29,34,34,31,29
...,...,...,...,...,...,...,...,...
5399,Emporio Akkar,,0,0,0,0,0,0
5400,Emporio Akkar,,0,0,0,0,0,0
5401,Emporio Akkar,,0,0,0,0,0,0
5402,Emporio Akkar,,0,0,0,0,0,0


In [62]:
# Selecionar apenas as linhas com valores acima de zero e não nulos
df_filtrado = df_final.loc[(df_final[colunas_dias_semana].astype(float) > 0).any(axis=1) & df_final[colunas_dias_semana].notnull().all(axis=1)]

# Exibir o resultado
df_filtrado.head()

Unnamed: 0,title,sunday,monday,tuesday,wednesday,thursday,friday,saturday
4,Por um Punhado de Dólares,27,39,29,34,34,31,29
5,Por um Punhado de Dólares,45,51,44,48,51,44,47
6,Por um Punhado de Dólares,64,63,58,60,69,55,65
7,Por um Punhado de Dólares,80,72,70,69,81,63,77
8,Por um Punhado de Dólares,90,78,76,72,81,65,86


#### Dataset sobre relações entre estabelecimentos

In [63]:
df_tp

Unnamed: 0,estabelecimento_referencia,position,title,rating,reviews,type,thumbnail,latitude,longitude
0,Por um Punhado de Dólares,1,YERBA + Por um Punhado de Dólares,4.8,931,"['Coffee shop', 'Bar', 'Book store', 'Pub', 'R...",https://lh5.googleusercontent.com/p/AF1QipO7UG...,-23.534373,-46.652746
1,Por um Punhado de Dólares,2,Urbe Cafe Bar,4.5,5879,"['Coffee store', 'Bar', 'Brunch', 'Coffee shop']",https://lh5.googleusercontent.com/p/AF1QipOGuR...,-23.555976,-46.658378
2,Por um Punhado de Dólares,3,KOF - King of The Fork,4.5,1945,"['Coffee store', 'Breakfast', 'Coffee shop']",https://lh5.googleusercontent.com/p/AF1QipMeeB...,-23.564052,-46.683767
3,Por um Punhado de Dólares,4,Café Girondino,4.5,6548,"['Cafe', 'Breakfast', 'Cafeteria', 'Cocktail b...",https://lh5.googleusercontent.com/p/AF1QipO9py...,-23.544683,-46.634228
4,Por um Punhado de Dólares,5,Barões do Cafe,4.1,122,['Coffee shop'],https://lh5.googleusercontent.com/p/AF1QipMT6j...,-23.557180,-46.663046
...,...,...,...,...,...,...,...,...,...
1834,Emporio Akkar,1,Empório Syrio,4.6,428,"['Gourmet grocery store', 'Market']",https://lh5.googleusercontent.com/p/AF1QipNV1X...,-23.543061,-46.631866
1835,Emporio Akkar,2,Tio Ali Empório Árabe,4.8,33,['Gourmet grocery store'],https://lh5.googleusercontent.com/p/AF1QipMPFT...,-23.541785,-46.629380
1836,Emporio Akkar,3,Maxifour Lebanon Market Center - Empório Árabe,4.4,1155,"['Gourmet grocery store', 'Condiments supplier...",https://lh5.googleusercontent.com/p/AF1QipNz6S...,-23.613913,-46.658768
1837,Emporio Akkar,4,Raful Cozinha Árabe - 25 de Março,4.6,7929,"['Middle Eastern', 'Sfiha restaurant']",https://lh5.googleusercontent.com/p/AF1QipOEhq...,-23.543192,-46.631870


Você pode usar esse dataset, para filtrar restaurante e achar suas similaridades com os outros estabelecimentos.