# **Diagrama Simple de Arquitectura**

        Google Maps -> Scraper Python (externo) -> SQLite Database (.db) -> API REST Backend ->  Frontend Web -> Freelancers.
        

# **Decisiones que tomar:**

1. **El scraping funciona fuera o dentro de la web? : Para hacerlo desde la web**

**Scraping fuera de la p√°gina** (script externo / backend) : Un script en Python que scrapea Google Maps, guarda los datos en, y la web solo lee esa base de datos.

**PROS:**

- mas seguro, por que no hay riesgo de exponer credenciales

- mas estable, por que no depende del navegador del usuario

- mejor performance, el scraping corre una sola vez

- arquitectura bien organizada, data -> backend -> frontend

- cumple mejor con los limites (no se satura de peticiones a la API)

**CONTRAS:**

- Requiere un script a parte para poblar la base de datos

- No es en tiempo real, pero sirve para la demo del funcionamiento de la pagina 


**Scraping desde la p√°gina (frontend / navegador)**: JavaScript en el navegador del usuario que intenta scrapear directamente Google Maps.

**PROS:**

- Relativamente mas simple

- No necesita backend

**CONTRAS:** 

- Bloqueos constantes por parte de google

- Google maps bloquea los bots, hace que los resultados se carguen mas lento en caso de no bloquear del todo

- C√≥digo expuesto (mala pr√°ctica), el codigo sera visible al inspecccionar la web

- Cada usuario vuelve a scrapear, dependiendo la cantidad de usuarios, con todas esas peticiones, se puede volver mas lenta la obtencion de resultados esperados

- Riesgo muy alto de que google bloquee la ip 

- No escalable

Al tener tantos contras, no se si es viable del todo y por el poco tiempo que tenemos, creo que la mejor opcion sera que el scraping este fuera de la pagina web

RESPUESTA FINAL: 

- el scraping debe hacerse fuera de la pagina

- la web solo consumira datos que ya fueron procesados (BD real o ficticio?)


-----------------------------------------------------------------------------------------------------------------------------------------------------

2. **Tipo de Base de Datos a utilizar**

Comparaci√≥n r√°pida de opciones reales

| Base de datos	|¬øConviene?	|Motivo|
|:-:|:-:|:-:|
|SQLite|	‚úÖ S√ç |(mejor opci√≥n)	Simple, robusta, cero setup|
|PostgreSQL|	‚ö†Ô∏è Overkill	|Potente, pero innecesaria|
|MySQL|	‚ö†Ô∏è Similar a Postgres|	Requiere servidor|
|MongoDB|	‚ùå No	|No necesit√°s documentos|
|Firebase|	‚ùå No	|Vendor lock-in, mala para scraping|
|CSV / JSON|	‚ùå No|	Sin integridad ni consultas|
|Redis|	‚ùå No|	Cache, no base principal|

**Elegi SQLite porque:**

A nivel t√©cnico SQLite es:

- Relacional

- Embebida

- Basada en archivo

- Extremadamente estable

**Ventajas t√©cnicas clave**

1. **No necesita servidor**

- No hay daemon

- No hay puertos

- No hay configuraci√≥n

2. **Ideal para scraping**

- Muchas lecturas

- Escrituras batch (cuando corre el scraper)

- Soporta √≠ndices, joins, filtros complejos

3. Integraci√≥n perfecta con Python

- sqlite3 viene en la librer√≠a est√°ndar

- Pandas, SQLAlchemy, FastAPI, Flask ‚Üí todos lo soportan

- No necesitmos drivers externos.

4. Atomicidad garantizada

Cuando el scraper corre:

- O guarda todo

- O no guarda nada

No quedan datos corruptos si el proceso falla. 

5. Performance real

- Hasta decenas de miles de registros sin problemas

- Con √≠ndices funciona sorprendentemente r√°pido

Google Chrome, WhatsApp y Android usan SQLite internamente

**¬øPor qu√© NO PostgreSQL o MySQL?**

PostgreSQL (gran base de datos)

- Muy potente
- ‚ùå Necesita servidor 
- ‚ùå Setup largo
- ‚ùå Innecesario para un dataset scrapeado

**¬øPor qu√© NO MongoDB (NoSQL)?**

- ‚ùå Consultas m√°s complejas para filtros simples

RESPUESTA FINAL: 
- Usamos SQLite porque es una base de datos liviana y confiable que se guarda en un solo archivo.

- Nuestro sistema obtiene los datos autom√°ticamente, los guarda de forma segura y la p√°gina web solo los lee, lo que hace que el sistema sea r√°pido, estable y f√°cil de mantener.

-----------------------------------------------------------------------------------------------------------------------------------------------------

3. **Base de Datos real o ficticia**

De momento, estamos optando por una base de datos Real, pero con datos obtenidos autom√°ticamente (no inventados)

**BD** generada por:

- Scraping automatizado

- Datos p√∫blicos

- Proceso reproducible

Los datos existen en el mundo real, Se obtienen autom√°ticamente, Pueden actualizarse, El sistema funciona aunque cambien los datos

**¬øPor que elegimos BD real por encima de una fiticia?**

Los datos son inventados, no cambian, no se puede mostrar el valor real del sistema

**Por qu√© NO conviene una base ficticia**

T√©cnicamente:

- No valida el scraper

- No valida filtros

- No valida rendimiento real

- No demuestra automatizaci√≥n

No podremos demostrar un impacto real, la sensacion del demo sera muy falsa, nos restara credibilidad


**Ventajas concretas de usar una base REAL**

1. Podemos demostrar el pipeline completo

- Datos reales ‚Üí Procesamiento ‚Üí Persistencia ‚Üí Visualizaci√≥n

2. El proyecto es escalable

- Hoy: 500 comercios; 

- Ma√±ana: 5.000, Otra ciudad, Otro pa√≠s

Sin cambiar la arquitectura.

3. Podemos defender el impacto frente al jurado

‚ÄúEstamos mostrando oportunidades reales de negocio para freelancers.‚Äù

4. Riesgo legal / √©tico (muy importante)

- Usar base real NO significa: Mostrar datos privados, Publicar emails personales, Hacer scraping agresivo

‚úî Usar datos p√∫blicos visibles
‚úî Solo con fines educativos / demostrativos
‚úî Sin automatizar contacto

En el pitch aclaramos: ‚ÄúEl proyecto es una prueba de concepto con datos p√∫blicos.‚Äù

5. Estrategia inteligente 

üß† En la pr√°ctica, lo √≥ptimo es:

Base REAL + Dataset reducido (MVP)

- 1 ciudad

- 1 rubro

- 200‚Äì500 negocios

Esto:

- Reduce riesgos

- Acelera desarrollo

- Es suficiente para demostrar valor

6. Explicaci√≥n en lenguaje simple (para no t√©cnicos)

- Usamos datos reales porque queremos mostrar que el sistema funciona en el mundo real, no con ejemplos inventados.

- El sistema se actualiza autom√°ticamente y muestra oportunidades reales para desarrolladores.

7. Frase perfecta para el jurado

- "Elegimos trabajar con datos reales porque el valor del proyecto est√° en detectar oportunidades reales, no simuladas."

-----------------------------------------------------------------------------------------------------------------------------------------------------

# **Diagrama Simple de Arquitectura 2.0**

Scraper Python (externo) -> SQLite Database (.db) ->  Frontend Web -> Freelancers.

- El scraper actualiza

- La web consulta

# **DISCLAIMER LEGAL** (para slide, README o demo)

- Este proyecto es una prueba de concepto desarrollada con fines educativos en el contexto de una hackat√≥n.

- Los datos utilizados provienen exclusivamente de informaci√≥n p√∫blica disponible en Google Maps, sin acceder a informaci√≥n privada ni restringida.

- El sistema no automatiza contacto, no env√≠a mensajes, ni realiza acciones sobre los comercios listados.

- Los datos se utilizan √∫nicamente para an√°lisis y visualizaci√≥n, con el objetivo de identificar oportunidades de mejora digital.

- Este proyecto no est√° afiliado, patrocinado ni avalado por Google.

**Versi√≥n corta (ideal para mostrar en la web)**

- Proyecto demostrativo con datos p√∫blicos.

- No afiliado a Google.

- Sin uso comercial ni automatizaci√≥n de contacto.

-----------------------------------------------------------------------------------------------------------------------------------------------------






4. **Migracion del Proyecto, a Consumo de API oficial de Google Places**

Nuestro proyecto originalmente comenz√≥ utilizando web scraping sobre Google Maps, porque nos permit√≠a validar r√°pidamente la idea y comprobar que exist√≠a una oportunidad real: identificar negocios que no tienen p√°gina web para conectarlos con freelancers.

Sin embargo, a medida que el proyecto madur√≥, tomamos la decisi√≥n consciente de migrar a la API oficial de Google Places. ¬øPor qu√©? Principalmente por tres razones clave: legalidad, estabilidad y escalabilidad.

El web scraping, aunque √∫til en etapas tempranas, presenta riesgos importantes: va en contra de los t√©rminos de servicio de Google, es fr√°gil ante cambios en la plataforma y no escala de forma segura. En cambio, la API oficial nos garantiza acceso a datos confiables, estructurados y actualizados, respetando las pol√≠ticas de uso.

Este cambio refleja una evoluci√≥n del proyecto: pasamos de una prueba de concepto a una soluci√≥n m√°s profesional, sostenible y preparada para crecer, alineada con buenas pr√°cticas de desarrollo y con un uso responsable de los datos

**Configuraci√≥n de la API Key (IMPORTANTE)**

‚ö†Ô∏è La API Key NO est√° incluida en el repositorio por seguridad.

**Paso 1:** Crear la variable de entorno

En tu sistema operativo, crear una variable de entorno llamada:
GOOGLE_API_KEY

Con el valor de tu API Key de Google.

En Windows (PowerShell):

                setx GOOGLE_API_KEY "TU_API_KEY_AQUI"

En Linux / macOS:

                export GOOGLE_API_KEY="TU_API_KEY_AQUI"

Luego de configurarla, cerrar y volver a abrir la terminal.
________________________________________