In [None]:
import requests
import json
import re
from datetime import datetime

# API Key de Google Places
API_KEY = 'AIzaSyDWx13fysNA9bZfNwS1-0fSqbGj9sl2AzQ'

# Lista de negocios con nombre, latitud, longitud y radio de búsqueda
#businesses = [
#    {"name": "Restaurante Guerrero", "location": "34.03664,-118.258789", "radius": 300},
#    {"name": "La Mina Restaurante", "location": "25.868873,-80.33368", "radius": 300},
#    {"name": "Restaurante Los Hernandez", "location": "25.868873,-80.33368", "radius": 300},
#    {"name": "Las Tunas Restaurante", "location": "40.78967,-74.008296", "radius": 300},
#    {"name": "La Cocina Pizza Restaurante", "location": "40.842095,-73.924665", "radius": 300},
#]
businesses = ['ChIJDbBNK0_HwoARYon07I6FqTs', 'ChIJvUUyz5q22YgRp0UyXJEmF6U', 'ChIJ4y1VMZ292YgRzkAvVZyoUDc', 'ChIJ8VvCqh59wokRaRsnd-_nYi8', 'ChIJX7Yb71_1wokRAacWLjJQ0Pg']
# Lista para almacenar los resultados
all_reviews = []

def clean_text(text):
    """
    Elimina emojis y caracteres especiales de un texto.

    Esta función toma un string y utiliza una expresión regular para eliminar
    cualquier carácter que no sea alfanumérico, espacios o puntuación común
    (.,!?), lo cual es útil para limpiar reseñas o comentarios que pueden
    contener emojis u otros símbolos no deseados.

    Args:
        text (str): El texto que se desea limpiar.

    Returns:
        str: El texto limpio, sin emojis ni caracteres especiales.
    """
    return re.sub(r'[^\w\s.,!?]+', '', text)

def extraer_reviews_google_places(api_key, businesses):
    """
    Extrae las reseñas más recientes de negocios desde Google Places API y las guarda en un archivo JSON en GCS.

    Args:
        api_key (str): Clave de la API de Google Places.
        businesses (list): Lista de negocios con nombre, ubicación y radio de búsqueda.
        bucket_name (str): Nombre del bucket en Google Cloud Storage.
        output_file (str): Nombre del archivo JSON donde se guardarán los datos en GCS.
    """
    all_reviews = []

    # Limitar a un máximo de 5 consultas
    for i, place_id in enumerate(businesses):
        if i >= 5:  # Limita el número de consultas a 5
            break
    
        # Realizar la solicitud para obtener detalles del lugar usando el Place ID
        details_url = f"https://maps.googleapis.com/maps/api/place/details/json?place_id={place_id}&key={api_key}"
        details_response = requests.get(details_url)
        details_data = details_response.json()
    
        # Verificar si hay reseñas
        if 'result' in details_data and 'reviews' in details_data['result']:
            reviews = details_data['result']['reviews']
        
        # Realizar la solicitud para obtener detalles del lugar usando el Place ID
      #  details_url = f"https://maps.googleapis.com/maps/api/place/details/json?place_id={place_id}&key={API_KEY}"
       # details_response = requests.get(details_url)
        #details_data = details_response.json()
            
            # Ordenar las reseñas por el campo `time` para obtener la más reciente
            reviews.sort(key=lambda x: x['time'], reverse=True)
            most_recent_review = reviews[0]
            
            # Limpiar el texto de la reseña para eliminar emojis
            cleaned_review_text = clean_text(most_recent_review['text'])
            
            # Convertir el timestamp en una fecha legible (solo fecha, sin hora)
            review_timestamp = most_recent_review['time']  # Timestamp en segundos
            review_date = datetime.utcfromtimestamp(review_timestamp).strftime('%Y-%m-%d')

            # Crear un diccionario con la información relevante del negocio
            business_info = {
            "place_id": place_id,
            "business_name": details_data['result'].get('name', 'Nombre no disponible'),
            "author": most_recent_review['author_name'],
            "review": cleaned_review_text,  # Texto de la reseña ya limpio
            "date": review_date  # Solo la fecha en formato legible
            }

            
            # Agregar el diccionario a la lista de resultados
            all_reviews.append(business_info)
        else:
            print(f"No se encontraron reseñas para el negocio con Place ID '{place_id}'")
    return all_reviews

# Llamar a la función y mostrar la información recopilada
all_reviews = extraer_reviews_google_places(API_KEY, businesses)
print("\nInformación recopilada de los negocios:")
for review in all_reviews:
    print(f"\nNegocio: {review['business_name']}")
    print(f"Place ID: {review['place_id']}")
    print(f"Autor de la reseña: {review['author']}")
    print(f"Reseña: {review['review']}")
    print(f"Fecha de la reseña: {review['date']}")
#prueba

  review_date = datetime.utcfromtimestamp(review_timestamp).strftime('%Y-%m-%d')



Información recopilada de los negocios:

Negocio: Restaurante Guerrero
Place ID: ChIJDbBNK0_HwoARYon07I6FqTs
Autor de la reseña: Ashley Martinez
Reseña: The food is very delicious and the price is very fair! Lots of variety of food, they only receive cash!
Fecha de la reseña: 2024-08-31

Negocio: Mina Bistro
Place ID: ChIJvUUyz5q22YgRp0UyXJEmF6U
Autor de la reseña: Cindy Lyles
Reseña: I just had the best brunch at Mina Bistro! The vibe is super chill and cozy, perfect for catching up with friends. The staff is super friendly and attentive. Seriously, cant get enough of their omelets! Cant wait to go back! 
Fecha de la reseña: 2024-11-02

Negocio: Nando Grill Carne en Vara
Place ID: ChIJ4y1VMZ292YgRzkAvVZyoUDc
Autor de la reseña: Valentina Lemoine
Reseña: Highly recommend coming to this place if you are looking to have a great meal with family and friends. Barbara took such amazing care of our party  she was prompt with her service, anticipating our needs and also helped us order a goo

In [2]:
# Guardar los resultados en un archivo JSON
with open("reviews_data.json", "w", encoding="utf-8") as json_file:
    json.dump(all_reviews, json_file, indent=4, ensure_ascii=False)

print("Datos guardados en reviews_data.json")

Datos guardados en reviews_data.json
