In [1]:
!pip install googlemaps

Collecting googlemaps
  Downloading googlemaps-4.10.0.tar.gz (33 kB)
  Preparing metadata (setup.py) ... [?25l[?25hdone
Building wheels for collected packages: googlemaps
  Building wheel for googlemaps (setup.py) ... [?25l[?25hdone
  Created wheel for googlemaps: filename=googlemaps-4.10.0-py3-none-any.whl size=40714 sha256=9ff2d8f642bd66050d27630861a78ff5cba271d1da3e8449ee561b2ca3d63025
  Stored in directory: /root/.cache/pip/wheels/4c/6a/a7/bbc6f5c200032025ee655deb5e163ce8594fa05e67d973aad6
Successfully built googlemaps
Installing collected packages: googlemaps
Successfully installed googlemaps-4.10.0


In [2]:
import googlemaps
import pandas as pd
from datetime import datetime
import json
import time
from tqdm import tqdm

### CODIGO PARA OBTENER LA MAYOR CANTIDAD DE RESTAURANTES TOMANDO DIFERENTES PUNTOS DE BOGOTA



In [None]:
import googlemaps
import json
import time
from datetime import datetime
from tqdm import tqdm

API_KEY = "pongan_su_clave"

gmaps = googlemaps.Client(key=API_KEY)

# ==========
# ZONAS
# ==========
ZONES = {
    "zona_t": (4.6653, -74.0542),
    "zona_g": (4.6483, -74.0591),
    "chapinero": (4.6533, -74.0600),
    "parque_93": (4.6761, -74.0489),
    "usaquen": (4.6905, -74.0306),
    "cedritos": (4.7240, -74.0300),
    "santa_barbara": (4.6980, -74.0374)
}

RADIUS = 3000   # 3 km

# ==========
# AUX
# ==========

def detect_keywords(text, keywords):
    text = text.lower()
    return any(k in text for k in keywords)

def get_reviews(place_id, language="es"):
    details = gmaps.place(
        place_id=place_id,
        fields=["reviews"],
        language=language
    )
    reviews = details.get("result", {}).get("reviews", [])
    return [
        {
            "autor": r.get("author_name"),
            "texto": r.get("text"),
            "rating": r.get("rating"),
            "fecha": datetime.fromtimestamp(r.get("time")).strftime("%Y-%m-%d %H:%M:%S"),
            "idioma": r.get("language")
        }
        for r in reviews if r.get("language", "").startswith("es")
    ]

def get_all_places(location, name):
    all_results = []
    places_result = gmaps.places_nearby(location=location, radius=RADIUS, type='restaurant')

    all_results.extend(places_result.get("results", []))

    while "next_page_token" in places_result:
        token = places_result["next_page_token"]
        time.sleep(2)
        places_result = gmaps.places_nearby(page_token=token)
        all_results.extend(places_result.get("results", []))

    print(f" {name}: {len(all_results)} lugares encontrados")
    return all_results

# ==========
# MAIN
# ==========

def build_bogota_json():
    unique_places = {}
    final_data = []

    print("\n Buscando restaurantes en zonas gastronómicas de Bogotá...\n")

    # 1) Buscar por zona
    for zone_name, coords in ZONES.items():

        print(f"\n Zona: {zone_name}")
        places = get_all_places(coords, zone_name)

        for place in tqdm(places, desc=f"Procesando {zone_name}"):
            place_id = place["place_id"]

            # evitar duplicados
            if place_id in unique_places:
                continue

            details = gmaps.place(
                place_id=place_id,
                fields=[
                    'name','formatted_address','formatted_phone_number','website',
                  'opening_hours','reviews','editorial_summary','rating',
                  'user_ratings_total','geometry','url'
                ],
                language='es'
            )

            result = details.get("result", {})
            if not result:
                continue

            reseñas = get_reviews(place_id)
            if not reseñas:
                continue

            combined_text = " ".join([
                result.get("name", ""),
                result.get("editorial_summary", {}).get("overview", ""),
                " ".join([r["texto"] for r in reseñas])
            ]).lower()

            pet_friendly = detect_keywords(combined_text, ["pet friendly","mascota","perros","gato","aceptan mascotas"])
            vegano       = detect_keywords(combined_text, ["vegano","vegetariano","plant based","sin carne"])

            horario = result.get("opening_hours", {}).get("weekday_text", [])
            abierto_ahora = result.get("opening_hours", {}).get("open_now", None)

            doc = {
                "place_id": place_id,
                "nombre": result.get("name"),
                "direccion": result.get("formatted_address"),
                "telefono": result.get("formatted_phone_number"),
                "website": result.get("website"),
                "rating": result.get("rating"),
                "user_ratings_total": result.get("user_ratings_total"),
                "tipos": result.get("types"),
                "ubicacion": result.get("geometry", {}).get("location"),
                "horarios": horario,
                "abierto_ahora": abierto_ahora,
                "reseñas": reseñas,
                "pet_friendly": pet_friendly,
                "vegano": vegano,
                "url_google_maps": result.get("url"),
                "zona": zone_name,
                "fecha_scraping": datetime.now().strftime("%Y-%m-%d %H:%M:%S")
            }

            unique_places[place_id] = True
            final_data.append(doc)

            time.sleep(0.3)

    # Guardar
    with open("restaurantes_bogota_multi_zona.json", "w", encoding="utf-8") as f:
        json.dump(final_data, f, ensure_ascii=False, indent=2)

    print(f"\n JSON generado con {len(final_data)} restaurantes únicos.")
    return final_data


if __name__ == "__main__":
    build_bogota_json()



 Buscando restaurantes en zonas gastronómicas de Bogotá...


 Zona: zona_t
 zona_t: 60 lugares encontrados


Procesando zona_t: 100%|██████████| 60/60 [00:16<00:00,  3.65it/s]



 Zona: zona_g
 zona_g: 60 lugares encontrados


Procesando zona_g: 100%|██████████| 60/60 [00:12<00:00,  4.71it/s]



 Zona: chapinero
 chapinero: 60 lugares encontrados


Procesando chapinero: 100%|██████████| 60/60 [00:06<00:00,  9.69it/s]



 Zona: parque_93
 parque_93: 60 lugares encontrados


Procesando parque_93: 100%|██████████| 60/60 [00:08<00:00,  7.34it/s]



 Zona: usaquen
 usaquen: 60 lugares encontrados


Procesando usaquen: 100%|██████████| 60/60 [00:12<00:00,  4.96it/s]



 Zona: cedritos
 cedritos: 60 lugares encontrados


Procesando cedritos: 100%|██████████| 60/60 [00:18<00:00,  3.28it/s]



 Zona: santa_barbara
 santa_barbara: 60 lugares encontrados


Procesando santa_barbara: 100%|██████████| 60/60 [00:04<00:00, 12.03it/s]


 JSON generado con 254 restaurantes únicos.





### MODIFICACION PARA TENER LA MAYOR CANTIDAD DE OPINIONES POR CADA RESTAURANTE




In [None]:
# ============================================
# EXTRACTOR MASIVO DE RESEÑAS GOOGLE PLACES
# ============================================
import googlemaps
import json
import time
from datetime import datetime
from tqdm import tqdm

# ============================================
# CONFIGURACIÓN
# ============================================
API_KEY = "pongan_su_clave"
gmaps = googlemaps.Client(key=API_KEY)

ZONES = {
    "zona_t": (4.6653, -74.0542),
    "zona_g": (4.6483, -74.0591),
    "chapinero": (4.6533, -74.0600),
    "parque_93": (4.6761, -74.0489),
    "usaquen": (4.6905, -74.0306),
    "cedritos": (4.7240, -74.0300),
    "santa_barbara": (4.6980, -74.0374)
}

RADIUS = 3000  # 3 km

RESTAURANTS = [
    'B.O.G. Hotel', 'Hotel Rosales Plaza Bogotá', 'Hotel Chicó 97',
    'Hotel Vilar America', 'Hotel Jazz Apartments', 'The Click Clack Hotel Bogotá',
    'El Sitio By Moris Rodríguez', 'Crepes & Waffles', 'WOK',
    'La Brasa Roja - World Trade Center', 'El Corral', 'Novillera', 'Buena Mesa',
    'La Terrine Delikatessen', 'Habana', 'Teotihuacán Comida Mexicana',
    'El Recreo de Adán', 'Tramonti Restaurante Pizzería', 'Papa Johns Pizza',
    'Restaurante Girassol Parrilla', 'Restaurante La Herencia', 'El Centenario Bogota',
    'La Gran Terraza', 'Restaurante Chambaku', "Pan Pa' Ya! • Retiro",
    'Trattoria Le Calvane', 'Gostinos Centro Internacional', 'DUNKIN',
    'La Ventana restaurante', 'The Wine Store', 'La Plaza de Andrés - El Retiro',
    'Restaurante Japonés Arigato', 'Manhattan Delicatessen', 'Il Pomeriggio',
    'Lina’s Sandwiches', '14 Inkas', 'MiRÁ COMIDA ARGENTINA', 'Taquería Don Clemente',
    'Magnifique El Nogal', 'Archies', 'Bogotá Beer Company', 'El Chato',
    'Frisby', 'Burger King', 'Andrés Exprés', 'Abasto', 'Osaki', 'La Mar • Cebichería Peruana'
]

# ============================================
# FUNCIÓN PRINCIPAL
# ============================================

def get_reviews_for_restaurant(restaurant_name, zones, radius):
    """
    Busca reseñas del restaurante en varias zonas y retorna lista con texto y fecha.
    """
    all_places = {}

    # Buscar el restaurante en cada zona
    for zone_name, location in zones.items():
        try:
            result = gmaps.places_nearby(
                location=location,
                radius=radius,
                keyword=restaurant_name,
                type='restaurant'
            )
            for p in result.get('results', []):
                all_places[p['place_id']] = p
            time.sleep(0.5)
        except Exception as e:
            print(f" Error buscando en {zone_name} para {restaurant_name}: {e}")

    reviews_list = []

    # Obtener reseñas detalladas por lugar encontrado
    for place_id, place in all_places.items():
        try:
            details = gmaps.place(
                place_id=place_id,
                fields=['reviews'],
                language='es'
            )

            for r in details.get('result', {}).get('reviews', []):
                reviews_list.append({
                    "texto": r.get('text', ''),
                    "fecha": datetime.fromtimestamp(r['time']).strftime('%Y-%m-%d'),
                })
            time.sleep(0.5)
        except Exception as e:
            print(f" Error extrayendo reseñas de {place.get('name', 'lugar')}: {e}")
            continue

    # Eliminar duplicados por texto
    unique_reviews = {r["texto"]: r for r in reviews_list if r["texto"].strip()}
    return list(unique_reviews.values())

# ============================================
# PROCESO MASIVO
# ============================================

all_restaurant_reviews = {}

for rest in tqdm(RESTAURANTS, desc="Extrayendo reseñas por restaurante"):
    reviews = get_reviews_for_restaurant(rest, ZONES, RADIUS)
    all_restaurant_reviews[rest] = reviews
    print(f" {rest}: {len(reviews)} reseñas únicas")

# ============================================
# GUARDAR RESULTADOS
# ============================================

output_file = "reseñas_restaurantes_api.json"
with open(output_file, "w", encoding="utf-8") as f:
    json.dump(all_restaurant_reviews, f, ensure_ascii=False, indent=2)

print(f"\n Archivo guardado en: {output_file}")

# Mostrar resumen
total_reviews = sum(len(v) for v in all_restaurant_reviews.values())
print(f"\n Total de reseñas recopiladas: {total_reviews}")


Extrayendo reseñas por restaurante:   2%|▏         | 1/48 [00:07<05:34,  7.11s/it]

 B.O.G. Hotel: 5 reseñas únicas


Extrayendo reseñas por restaurante:   4%|▍         | 2/48 [00:13<05:11,  6.78s/it]

 Hotel Rosales Plaza Bogotá: 5 reseñas únicas


Extrayendo reseñas por restaurante:   6%|▋         | 3/48 [00:21<05:28,  7.31s/it]

 Hotel Chicó 97: 6 reseñas únicas


Extrayendo reseñas por restaurante:   8%|▊         | 4/48 [00:28<05:10,  7.05s/it]

 Hotel Vilar America: 5 reseñas únicas


Extrayendo reseñas por restaurante:  10%|█         | 5/48 [00:35<04:59,  6.97s/it]

 Hotel Jazz Apartments: 5 reseñas únicas


Extrayendo reseñas por restaurante:  12%|█▎        | 6/48 [00:43<05:08,  7.35s/it]

 The Click Clack Hotel Bogotá: 10 reseñas únicas


Extrayendo reseñas por restaurante:  15%|█▍        | 7/48 [00:49<04:51,  7.11s/it]

 El Sitio By Moris Rodríguez: 5 reseñas únicas


Extrayendo reseñas por restaurante:  17%|█▋        | 8/48 [01:14<08:29, 12.75s/it]

 Crepes & Waffles: 154 reseñas únicas


Extrayendo reseñas por restaurante:  19%|█▉        | 9/48 [01:48<12:41, 19.51s/it]

 WOK: 218 reseñas únicas


Extrayendo reseñas por restaurante:  21%|██        | 10/48 [01:55<09:51, 15.57s/it]

 La Brasa Roja - World Trade Center: 5 reseñas únicas


Extrayendo reseñas por restaurante:  23%|██▎       | 11/48 [02:31<13:22, 21.70s/it]

 El Corral: 245 reseñas únicas


Extrayendo reseñas por restaurante:  25%|██▌       | 12/48 [02:37<10:13, 17.04s/it]

 Novillera: 1 reseñas únicas


Extrayendo reseñas por restaurante:  27%|██▋       | 13/48 [03:06<12:04, 20.69s/it]

 Buena Mesa: 187 reseñas únicas


Extrayendo reseñas por restaurante:  29%|██▉       | 14/48 [03:12<09:14, 16.31s/it]

 La Terrine Delikatessen: 1 reseñas únicas


Extrayendo reseñas por restaurante:  31%|███▏      | 15/48 [03:34<09:46, 17.78s/it]

 Habana: 112 reseñas únicas


Extrayendo reseñas por restaurante:  33%|███▎      | 16/48 [03:41<07:47, 14.60s/it]

 Teotihuacán Comida Mexicana: 1 reseñas únicas


Extrayendo reseñas por restaurante:  35%|███▌      | 17/48 [03:47<06:16, 12.14s/it]

 El Recreo de Adán: 5 reseñas únicas


Extrayendo reseñas por restaurante:  38%|███▊      | 18/48 [03:54<05:13, 10.45s/it]

 Tramonti Restaurante Pizzería: 5 reseñas únicas


Extrayendo reseñas por restaurante:  40%|███▉      | 19/48 [04:09<05:46, 11.94s/it]

 Papa Johns Pizza: 70 reseñas únicas


Extrayendo reseñas por restaurante:  42%|████▏     | 20/48 [04:16<04:49, 10.34s/it]

 Restaurante Girassol Parrilla: 5 reseñas únicas


Extrayendo reseñas por restaurante:  44%|████▍     | 21/48 [04:23<04:11,  9.32s/it]

 Restaurante La Herencia: 10 reseñas únicas


Extrayendo reseñas por restaurante:  46%|████▌     | 22/48 [04:30<03:46,  8.70s/it]

 El Centenario Bogota: 10 reseñas únicas


Extrayendo reseñas por restaurante:  48%|████▊     | 23/48 [04:36<03:19,  7.98s/it]

 La Gran Terraza: 1 reseñas únicas


Extrayendo reseñas por restaurante:  50%|█████     | 24/48 [04:43<03:03,  7.63s/it]

 Restaurante Chambaku: 5 reseñas únicas


Extrayendo reseñas por restaurante:  52%|█████▏    | 25/48 [04:50<02:51,  7.44s/it]

 Pan Pa' Ya! • Retiro: 5 reseñas únicas


Extrayendo reseñas por restaurante:  54%|█████▍    | 26/48 [04:57<02:37,  7.17s/it]

 Trattoria Le Calvane: 4 reseñas únicas


Extrayendo reseñas por restaurante:  56%|█████▋    | 27/48 [05:03<02:27,  7.00s/it]

 Gostinos Centro Internacional: 1 reseñas únicas


Extrayendo reseñas por restaurante:  58%|█████▊    | 28/48 [05:19<03:11,  9.57s/it]

 DUNKIN: 65 reseñas únicas


Extrayendo reseñas por restaurante:  60%|██████    | 29/48 [05:26<02:50,  8.96s/it]

 La Ventana restaurante: 5 reseñas únicas


Extrayendo reseñas por restaurante:  62%|██████▎   | 30/48 [05:33<02:28,  8.26s/it]

 The Wine Store: 5 reseñas únicas


Extrayendo reseñas por restaurante:  65%|██████▍   | 31/48 [05:40<02:12,  7.80s/it]

 La Plaza de Andrés - El Retiro: 5 reseñas únicas


Extrayendo reseñas por restaurante:  67%|██████▋   | 32/48 [05:46<01:58,  7.43s/it]

 Restaurante Japonés Arigato: 5 reseñas únicas


Extrayendo reseñas por restaurante:  69%|██████▉   | 33/48 [05:53<01:48,  7.22s/it]

 Manhattan Delicatessen: 5 reseñas únicas


Extrayendo reseñas por restaurante:  71%|███████   | 34/48 [05:59<01:37,  6.95s/it]

 Il Pomeriggio: 5 reseñas únicas


Extrayendo reseñas por restaurante:  73%|███████▎  | 35/48 [06:06<01:28,  6.79s/it]

 Lina’s Sandwiches: 5 reseñas únicas


Extrayendo reseñas por restaurante:  75%|███████▌  | 36/48 [06:13<01:22,  6.84s/it]

 14 Inkas: 10 reseñas únicas


Extrayendo reseñas por restaurante:  77%|███████▋  | 37/48 [06:19<01:14,  6.74s/it]

 MiRÁ COMIDA ARGENTINA: 2 reseñas únicas


Extrayendo reseñas por restaurante:  79%|███████▉  | 38/48 [06:28<01:12,  7.29s/it]

 Taquería Don Clemente: 15 reseñas únicas


Extrayendo reseñas por restaurante:  81%|████████▏ | 39/48 [06:34<01:03,  7.07s/it]

 Magnifique El Nogal: 5 reseñas únicas


Extrayendo reseñas por restaurante:  83%|████████▎ | 40/48 [06:49<01:13,  9.24s/it]

 Archies: 64 reseñas únicas


Extrayendo reseñas por restaurante:  85%|████████▌ | 41/48 [07:11<01:33, 13.30s/it]

 Bogotá Beer Company: 135 reseñas únicas


Extrayendo reseñas por restaurante:  88%|████████▊ | 42/48 [07:18<01:07, 11.24s/it]

 El Chato: 5 reseñas únicas


Extrayendo reseñas por restaurante:  90%|████████▉ | 43/48 [07:37<01:07, 13.46s/it]

 Frisby: 105 reseñas únicas


Extrayendo reseñas por restaurante:  92%|█████████▏| 44/48 [08:01<01:07, 16.76s/it]

 Burger King: 133 reseñas únicas


Extrayendo reseñas por restaurante:  94%|█████████▍| 45/48 [08:13<00:46, 15.42s/it]

 Andrés Exprés: 50 reseñas únicas


Extrayendo reseñas por restaurante:  96%|█████████▌| 46/48 [08:21<00:26, 13.02s/it]

 Abasto: 10 reseñas únicas


Extrayendo reseñas por restaurante:  98%|█████████▊| 47/48 [08:38<00:14, 14.34s/it]

 Osaki: 95 reseñas únicas


Extrayendo reseñas por restaurante: 100%|██████████| 48/48 [08:45<00:00, 10.94s/it]

 La Mar • Cebichería Peruana: 5 reseñas únicas

 Archivo guardado en: reseñas_restaurantes_api.json

 Total de reseñas recopiladas: 1820



