# Amazon Fine Food Reviews Analysis Project

## 1. Basic Information
* **Project Title:** Amazon Fine Food Reviews Analyzer
* **Repository:** [(https://github.com/Gaboespada123/Proyecto_de_programacion.git)]
* **Group Members:**
    * **[Gabriel Salazar]** (Número: 55652) - GitHub ID: [Gaboespada123]
    * **[Daniel Colavito]** (Número: 55428) - GitHub ID: [DSColavito]
    * **[Guilherme Cardoso]** (Número: 55817) - GitHub ID: [Guilherme-C808]

## 2. Contribution
Esta secção detalha a contribuição individual de cada membro do grupo para o desenvolvimento do projeto.

* **[Gabriel Salazar]:**
    * Responsável pela arquitetura do package (`src`).
    * Implementação do módulo de carregamento e limpeza de dados (`loader.py`).
    * Desenvolvimento do sistema de logs e utilitários de data (`utils.py`).
    * Estruturação do Notebook e documentação final.
    * **Esforço estimado:** X horas.

* **[Daniel Colavito]:**
    * Desenvolvimento dos módulos de análise de negócio (`analysis_users.py`, `analysis_products.py`).
    * Implementação de métricas de utilizador e cálculo de scores ponderados.
    * **Esforço estimado:** (Pendente) horas.

* **[Guilherme Cardoso]:**
    * Desenvolvimento da análise temporal e estatísticas gerais (`analysis_general.py`).
    * Implementação da funcionalidade criativa (análise de frequência de palavras).
    * **Esforço estimado:** (Pendente) horas.

## 3. Background
O objetivo deste projeto é desenvolver um *package* Python modular para analisar o dataset "Amazon Fine Food Reviews" sem depender de bibliotecas externas de processamento de dados como Pandas. A solução foca-se na eficiência de leitura e na modularidade do código, permitindo extrair *insights* sobre o comportamento dos utilizadores e a qualidade dos produtos ao longo do tempo.

## 4. Data Structure
Para a gestão dos dados em memória, optámos por uma **Lista de Dicionários**.

* **Estrutura:** `[ {'Id': '1', 'ProductId': 'B001...', 'Score': 5, ...}, ... ]`
* **Justificação:**
    1.  **Flexibilidade:** O dataset CSV contém tipos de dados heterogéneos (texto, inteiros, timestamps). Um dicionário gere isto de forma nativa.
    2.  **Legibilidade:** Permite aceder aos campos pelo nome (ex: `review['Score']`) em vez de índices numéricos confusos, facilitando o trabalho colaborativo.
    3.  **Compatibilidade:** É a estrutura natural devolvida pelo `csv.DictReader`, otimizando o processo de carregamento.

In [1]:
# Fazemos o import de nosso propio paquete.
import sys
import os

# Garantimos que o Python encontre a pasta src
sys.path.append(os.path.abspath('src'))

from src import loader

# Definimos a rota (usamos o arquivo pequeno para demonstração no notebook)
file_path = 'data/Reviews_small.csv'

# Carregamos os dados
print(f"Carregando dados de: {file_path}...")
data = loader.load_data(file_path)

if data:
    print(f"\n Total de reviews carregadas: {len(data)}")
    print("Mostra da primeira review(Estrutura de dados):")
    print(data[0])
else:
    print(" Erro ao carregar os dados.")

Carregando dados de: data/Reviews_small.csv...
Cargando datos...
Se cargaron 183 reviews correctamente.

 Total de reviews carregadas: 183
Mostra da primeira review(Estrutura de dados):
{'Id': '1', 'ProductId': 'B001E4KFG0', 'UserId': 'A3SGXH7AUHU8GW', 'ProfileName': 'delmartian', 'HelpfulnessNumerator': 1, 'HelpfulnessDenominator': 1, 'Score': 5, 'Time': 1303862400, 'Summary': 'Good Quality Dog Food', 'Text;;;;': 'I have bought several of the Vitality canned dog food products and have found them all to be of good quality. The product looks more like a stew than a processed meat and it smells better. My Labrador is finicky and she appreciates this product better than  most.;;;;'}


## 10. Declaração de Integridade

Eu, **Gabriel Alexander Solano de la Sala Salazar**, estudante com o número de estudante **55652** do 1º Ciclo em Inteligência Artificial e Ciência de Dados da Universidade da Beira Interior, declaro ter desenvolvido o presente trabalho e elaborado o presente texto em total consonância com o Código de Integridade da Universidade da Beira Interior.

Mais concretamente afirmo não ter incorrido em qualquer das variedades de Fraude Académica, e que aqui declaro conhecer, que em particular atendi à exigida referenciação de frases, extratos, imagens e outras formas de trabalho intelectual, e assumindo assim na integra as responsabilidades da autoria.

**Universidade da Beira Interior, Covilhã**
26/11/2025

### Declaração do uso de IA Generativa
**Ferramentas usadas:** Gemini (Google).
**Contribuições:** A ferramenta foi utilizada para auxiliar na estruturação inicial do projeto, clarificação sobre boas práticas de organização de repositórios GitHub e depuração de erros de sintaxe no código Python. A lógica dos algoritmos de análise e a implementação final foram validadas e adaptadas por todos os membros do grupo.