# Classificação de textos para análise de sentimentos

Trabalho final da disciplina de deep learning da pós graduação em data science da FURB. 
Professor: @luann.porfirio
Aluno: João Poffo

# Instruções do professor

Base de dados 

Instruções:
- O objetivo deste trabalho é criar um modelo binário de aprendizado de máquina para classificação de textos. 
Para isso, será utilizado a base de dados [IMDb](http://ai.stanford.edu/~amaas/data/sentiment/), que consiste de dados textuais de críticas positivas e negativas de filmes
- Uma vez treinado, o modelo deve ter uma função `predict` que recebe uma string como parâmetro e retorna o valor 1 ou 0, aonde 1 significa uma crítica positiva e 0 uma crítica negativa
- O pré-processamento pode ser desenvolvido conforme desejar (ex.: remoção de stopwords, word embedding, one-hot encoding, char encoding)
- É preferível que seja empregado um modelo de recorrência (ex.: rnn, lstm, gru) para a etapa de classificação
- Documente o código (explique sucintamente o que cada função faz, insira comentários em trechos de código relevantes)
- **Atenção**: Uma vez treinado o modelo final, salve-o no diretório do seu projeto e crie uma célula ao final do notebook contendo uma função de leitura deste arquivo, juntamente com a execução da função `predict`

Sugestões:
- Explorar a base de dados nas células iniciais do notebook para ter um melhor entendimento do problema, distribuição dos dados, etc
- Após desenvolver a estrutura de classificação, é indicado fazer uma busca de hiperparâmetros e comparar os resultados obtidos em diferentes situações

Prazo de entrega:
- 01-08-2021 às 23:59hs GMT-3

Formato preferível de entrega:
- Postar no portal Ava da disciplina o link do projeto no github (ou anexar o projeto diretamente no portal Ava)

luann.porfirio@gmail.com

In [26]:
# Instalando libs
!pip install torchtext
!pip install gensim
!pip install pandas
!pip install sklearn

#Necessário se usássemos o vocabulário pré-treinado glove
#!pip install spacy
#!python -m spacy download en_core_web_sm

Looking in indexes: https://pypi.org/simple, https://joao.poffo%40ambevtech.com.br:****@pkgs.dev.azure.com/AMBEV-SA/AMBEV-BIFROST/_packaging/canaa-packages/pypi/simple/
Looking in indexes: https://pypi.org/simple, https://joao.poffo%40ambevtech.com.br:****@pkgs.dev.azure.com/AMBEV-SA/AMBEV-BIFROST/_packaging/canaa-packages/pypi/simple/
Looking in indexes: https://pypi.org/simple, https://joao.poffo%40ambevtech.com.br:****@pkgs.dev.azure.com/AMBEV-SA/AMBEV-BIFROST/_packaging/canaa-packages/pypi/simple/
Looking in indexes: https://pypi.org/simple, https://joao.poffo%40ambevtech.com.br:****@pkgs.dev.azure.com/AMBEV-SA/AMBEV-BIFROST/_packaging/canaa-packages/pypi/simple/


In [27]:
# Bibliotecas necessárias
import torch
from torch import nn
import torch.optim as optim

from torchtext.legacy import datasets
from torchtext.legacy import data

import random
import pandas
import gensim

from sklearn.feature_extraction.text import TfidfVectorizer

import time


In [28]:
# PREPARAÇÃO DOS DADOS
# Primeiro teste foi usando TFIDF, mas nem coloquei pq ficou muito ruim e, pensando bem, não faz sentido. 
#  Pq aqui não queremos palavras "importantes" para definir um documento, mas sim, classificá-los com o sentimento. 

# Em seguida usamos o gensim para tokenização por causa do recurso de stemming.

# Exemplo com pytorch (muito didático!): https://github.com/bentrevett/pytorch-sentiment-analysis
# Exemplo do gensim: https://rohit-agrawal.medium.com/using-fine-tuned-gensim-word2vec-embeddings-with-torchtext-and-pytorch-17eea2883cd

# Seed para que os testes possam ser reproduzidos. Em produção, é melhor e mais rápido desligar ambos.
SEED = 789
torch.manual_seed(SEED)

# Não precisa ser determinístico pq é a mesma versão e máquina que estamos comparando.
#torch.backends.cudnn.deterministic = True

# Definição dos filtros padrão do gensim. Estamos deixo abaixo para documentar a ordem.
#gensim.parsing.preprocessing.DEFAULT_FILTERS = [
#    lambda x: x.lower(), strip_tags, strip_punctuation,
#    strip_multiple_whitespaces, strip_numeric,
#    remove_stopwords, strip_short, stem_text
#]

# Função de tokenização
def tokenize(sentence):
    return gensim.parsing.preprocessing.preprocess_string(sentence)

# Montando o tipo dos campos do torch

# Aqui que associamos o tipo do campo com o gensim para construirmos o vocábulário adiante
TEXT = data.Field(tokenize=tokenize)
LABEL = data.LabelField(dtype = torch.float)


In [29]:
# Função para buscar os dados e quebrar em treino, teste e validação
# - Necessário pois fazemos novos testes adiante.
def train_test_valid():

    # Trabalhando com o IMDb
    train_data, test_data = datasets.IMDB.splits(TEXT, LABEL)

    # Separa os dados de treino em treino e validação em 70/30
    train_data, valid_data = train_data.split(random_state = random.seed(SEED))

    return train_data, test_data, valid_data

# Obtém os dados e faz o split
train_data, test_data, valid_data = train_test_valid()

train_data


In [30]:
# Verificação do split dos dados
print('Exemplos de treino (35%):', len(train_data), ', teste (50%):', len(test_data), ' e validação (15%):', len(valid_data))

Exemplos de treino (35%): 17500 , teste (50%): 25000  e validação (15%): 7500


In [31]:
# Teste com vocabulário de 30 mil palavras
MAX_VOCAB_SIZE = 30000

TEXT.build_vocab(train_data, max_size = MAX_VOCAB_SIZE)
LABEL.build_vocab(train_data)

print("Palavras únicas:", len(TEXT.vocab))
print("Classes únicas:", len(LABEL.vocab))
print("20 palavras mais comuns:", TEXT.vocab.freqs.most_common(20))
print("10 palavras do vocabulário de palavras para analisar estrutura:", TEXT.vocab.itos[:10])
print("Estrutura das classes:", LABEL.vocab.stoi)

Palavras únicas: 30002
Classes únicas: 2
20 palavras mais comuns: [('movi', 36384), ('film', 34043), ('like', 16064), ('time', 11242), ('good', 10752), ('charact', 9860), ('watch', 9781), ('stori', 9233), ('scene', 7433), ('look', 7114), ('end', 6838), ('bad', 6587), ('peopl', 6489), ('great', 6383), ('love', 6285), ('think', 6262), ('wai', 6192), ('act', 6183), ('plai', 6165), ('thing', 5778)]
10 palavras do vocabulário de palavras para analisar estrutura: ['<unk>', '<pad>', 'movi', 'film', 'like', 'time', 'good', 'charact', 'watch', 'stori']
Estrutura das classes: defaultdict(None, {'neg': 0, 'pos': 1})


In [32]:
# Criando lotes de 64 através do iterador para o treino
BATCH_SIZE = 64
train_iterator, valid_iterator, test_iterator = data.BucketIterator.splits(
    (train_data, valid_data, test_data), 
    batch_size = BATCH_SIZE)

# Classe de rede neural recorrente padrão simples
class RNN(nn.Module):
    def __init__(self, input_dim, embedding_dim, hidden_dim, output_dim):
        
        super().__init__()
        
        # Usamos o embedding pois é uma camada pra transformar um vetor esparço de dicionário em um denso. 
        # Na teoria, palavras com impacto similar na classificação dos sentimentos são mapeadas próximas uma das outras.
        self.embedding = nn.Embedding(input_dim, embedding_dim)
        
        self.rnn = nn.RNN(embedding_dim, hidden_dim)
        
        self.fc = nn.Linear(hidden_dim, output_dim)
        
    def forward(self, text):

        #text = [sent len, batch size]
        embedded = self.embedding(text)
        
        #embedded = [sent len, batch size, emb dim]
        output, hidden = self.rnn(embedded)
        
        #output = [sent len, batch size, hid dim]
        #hidden = [1, batch size, hid dim]        
        assert torch.equal(output[-1,:,:], hidden.squeeze(0))
        
        return self.fc(hidden.squeeze(0))

# A quantidade features é a quantidade de palavras no nosso dicionário
INPUT_DIM = len(TEXT.vocab)

# Quão denso deve ser nosso embeeding
EMBEDDING_DIM = 100

# Tamanho da cama oculta
HIDDEN_DIM = 256

# Tamanho da saída
OUTPUT_DIM = 1

# Cria o modelo com os hiperparâmetros definidos acima
model = RNN(INPUT_DIM, EMBEDDING_DIM, HIDDEN_DIM, OUTPUT_DIM)

# Imprime a arquitetura
print(model)

def count_parameters(model):
    return sum(p.numel() for p in model.parameters() if p.requires_grad)
print(f'Esta modelo tem {count_parameters(model):,} parâmetros treináveis.')

RNN(
  (embedding): Embedding(30002, 100)
  (rnn): RNN(100, 256)
  (fc): Linear(in_features=256, out_features=1, bias=True)
)
Esta modelo tem 3,092,105 parâmetros treináveis.


In [33]:
# No primeiro teste vamos usar um otimizador simples - gradiente descendente estocástico
# - learning_rate = 0.001
optimizer = optim.SGD(model.parameters(), lr=1e-3)

# Como loss usamos este do torch que traz tanto a sigmoide quanto a entropia cruzada binária.
criterion = nn.BCEWithLogitsLoss()

# Função para calcular acurácia binária. 
def binary_accuracy(preds, y):
    """
    Retorna a acurácia no lote. Por exemplo, 6/10 corretas, retorna 0.6.
    Ao mesmo tempo traduz a predição para uma das classes binárias disponíveis através de arredondamento. Por exemplo: 0.6 -> 1 (verdadeiro), 0.3 -> 0 (falso).
    """

    rounded_preds = torch.round(torch.sigmoid(preds))
    correct = (rounded_preds == y).float()
    acc = correct.sum() / len(correct)
    return acc

# Função de treino recebendo o modelo, os dados, o otimizador e a loss como argumentos
def train(model, iterator, optimizer, criterion):
    
    # loss e acurácia acumulada
    epoch_loss = 0
    epoch_acc = 0
    
    # Seta o modelo para o modo de treino
    model.train()
    
    # Para cada lote de dados
    for batch in iterator:
        
        optimizer.zero_grad()

        predictions = model(batch.text).squeeze(1)
        
        loss = criterion(predictions, batch.label)
        
        acc = binary_accuracy(predictions, batch.label)
        
        loss.backward()
        
        optimizer.step()
        
        epoch_loss += loss.item()
        epoch_acc += acc.item()
        
    return epoch_loss / len(iterator), epoch_acc / len(iterator)

# Função de validação
def evaluate(model, iterator, criterion):
    
    epoch_loss = 0
    epoch_acc = 0
    
    model.eval()
    
    with torch.no_grad():
    
        for batch in iterator:

            predictions = model(batch.text).squeeze(1)
            
            loss = criterion(predictions, batch.label)
            
            acc = binary_accuracy(predictions, batch.label)

            epoch_loss += loss.item()
            epoch_acc += acc.item()
        
    return epoch_loss / len(iterator), epoch_acc / len(iterator)

# Função para ajudar no cálculo de cada época
def epoch_time(start_time, end_time):
    elapsed_time = end_time - start_time
    elapsed_mins = int(elapsed_time / 60)
    elapsed_secs = int(elapsed_time - (elapsed_mins * 60))
    return elapsed_mins, elapsed_secs

# Quantidade de épocas usadas no treino
N_EPOCHS = 5

# Treino está como um processo pois é padrão
def process(model, train_fnc=train, evaluate_fnc=evaluate, save_name='tf-model1'):
    # Ajuda a identificar a melhor época para salvar o modelo
    best_valid_loss = float('inf')

    for epoch in range(N_EPOCHS):

        start_time = time.time()
        
        train_loss, train_acc = train_fnc(model, train_iterator, optimizer, criterion)
        valid_loss, valid_acc = evaluate_fnc(model, valid_iterator, criterion)
        
        end_time = time.time()

        epoch_mins, epoch_secs = epoch_time(start_time, end_time)
        
        if valid_loss < best_valid_loss:
            best_valid_loss = valid_loss
            # Full - Não precisa de hiperparâmetros
            torch.save(model, save_name + '.ptf')
            # State - Precisa inicializar a classe com os mesmo hiperparâmetros
            torch.save(model.state_dict(), save_name + '.pt')
        
        print(f'Época: {epoch+1:02} | tempo de processamento: {epoch_mins}m {epoch_secs}s')
        print(f'\tTrain Loss: {train_loss:.3f} | Train Acc: {train_acc*100:.2f}%')
        print(f'\t Val. Loss: {valid_loss:.3f} |  Val. Acc: {valid_acc*100:.2f}%')

# Executa o treino do modelo
process(model)

Época: 01 | tempo de processamento: 5m 53s
	Train Loss: 0.693 | Train Acc: 49.87%
	 Val. Loss: 0.697 |  Val. Acc: 50.83%
Época: 02 | tempo de processamento: 6m 14s
	Train Loss: 0.693 | Train Acc: 49.96%
	 Val. Loss: 0.697 |  Val. Acc: 49.51%
Época: 03 | tempo de processamento: 6m 11s
	Train Loss: 0.693 | Train Acc: 49.81%
	 Val. Loss: 0.697 |  Val. Acc: 49.63%
Época: 04 | tempo de processamento: 6m 6s
	Train Loss: 0.693 | Train Acc: 49.73%
	 Val. Loss: 0.697 |  Val. Acc: 49.60%
Época: 05 | tempo de processamento: 6m 11s
	Train Loss: 0.693 | Train Acc: 49.17%
	 Val. Loss: 0.697 |  Val. Acc: 49.54%


# Análise do primeiro algoritmo

Acurácia muito ruim (aprox. 50%) com a RNN simples com as N palavras mais frequentes.

Vamos testar um modelo usando uma rede recorrente um pouco mais complexa.

RNN sofre de um problema de perda de gradiente. Essa perda de gradiente faz com que a ordem das palavras perdam relevância no resultado da predição. 

LSTM (Long Short-Term Memory) nos ajuda resolver isso tendo uma camada extra de memória que se chama célula/cell.

Adicionamos também uma camada de regularização com dropout que "desativa" certos neurônios em uma iteração para que reduza bias e vício de caminhos melhorando a acertividade do modelo e criando um tipo de aleatoriedade que existe no processamento de linguagem natural.

In [None]:
# Apenas a classe separada pois é a única coisa necessária declarar para a predição (no final do notebook).
class MultiLayerRNN(nn.Module):
    def __init__(self, vocab_size, embedding_dim, hidden_dim, output_dim, n_layers, 
                 bidirectional, dropout, pad_idx):
        
        super().__init__()
        
        self.embedding = nn.Embedding(vocab_size, embedding_dim, padding_idx = pad_idx)
        
        # Camada do LSTM
        self.rnn = nn.LSTM(embedding_dim, 
                           hidden_dim, 
                           num_layers=n_layers, 
                           bidirectional=bidirectional, 
                           dropout=dropout)
        
        self.fc = nn.Linear(hidden_dim * 2, output_dim)
        
        self.dropout = nn.Dropout(dropout)
        
    def forward(self, text, text_lengths):
        
        #text = [sent len, batch size]
        embedded = self.dropout(self.embedding(text))
        
        #embedded = [sent len, batch size, emb dim]
        
        #Empacota a sequência (remove paddings) e somente processa isso. Porém, retorna empacotado também.
        packed_embedded = nn.utils.rnn.pack_padded_sequence(embedded, text_lengths)
        
        packed_output, (hidden, cell) = self.rnn(packed_embedded)
        
        #Então, desempacota
        output, output_lengths = nn.utils.rnn.pad_packed_sequence(packed_output)

        #output = [sent len, batch size, hid dim * num directions]
        #output over padding tokens are zero tensors
        
        #hidden = [num layers * num directions, batch size, hid dim]
        #cell = [num layers * num directions, batch size, hid dim]
        
        #concat the final forward (hidden[-2,:,:]) and backward (hidden[-1,:,:]) hidden layers
        #and apply dropout
        hidden = self.dropout(torch.cat((hidden[-2,:,:], hidden[-1,:,:]), dim = 1))
                
        #hidden = [batch size, hid dim * num directions]
            
        return self.fc(hidden)

In [34]:
# Precisamos criar uma nova função de treino pq agora tem os tamanhos também
def train_with_sequences(model, iterator, optimizer, criterion):
    
    epoch_loss = 0
    epoch_acc = 0
    
    model.train()
    
    for batch in iterator:
        
        optimizer.zero_grad()
        
        text, text_lengths = batch.text
        
        predictions = model(text, text_lengths).squeeze(1)
        
        loss = criterion(predictions, batch.label)
        
        acc = binary_accuracy(predictions, batch.label)
        
        loss.backward()
        
        optimizer.step()
        
        epoch_loss += loss.item()
        epoch_acc += acc.item()
        
    return epoch_loss / len(iterator), epoch_acc / len(iterator)

# Mesma necessidade do treino.
def evaluate_with_sequences(model, iterator, criterion):
    
    epoch_loss = 0
    epoch_acc = 0
    
    model.eval()
    
    with torch.no_grad():
    
        for batch in iterator:

            text, text_lengths = batch.text
            
            predictions = model(text, text_lengths).squeeze(1)
            
            loss = criterion(predictions, batch.label)
            
            acc = binary_accuracy(predictions, batch.label)

            epoch_loss += loss.item()
            epoch_acc += acc.item()
        
    return epoch_loss / len(iterator), epoch_acc / len(iterator)

# Precisamos incluir o tamanho das sentenças no vocabulário (include_length=true).
TEXT = data.Field(tokenize = tokenize,
                  include_lengths = True)

# Precisa recarregar dados
train_data, test_data, valid_data = train_test_valid()

TEXT.build_vocab(train_data, 
    max_size = MAX_VOCAB_SIZE, 
    # Teste com o glove ficaria pra depois
    #vectors = "glove.6B.100d", 
    #unk_init = torch.Tensor.normal_
    )
LABEL.build_vocab(train_data)

# Comentado abaixo pois mantém do último treino
#INPUT_DIM = len(TEXT.vocab)
#EMBEDDING_DIM = 100
#HIDDEN_DIM = 256
#OUTPUT_DIM = 1

# Novos hiperparâmetros
N_LAYERS = 2
BIDIRECTIONAL = True
DROPOUT = 0.5
PAD_IDX = TEXT.vocab.stoi[TEXT.pad_token]

# Cria o modelo com LSTM e hiperparâmetros
model2 = MultiLayerRNN(INPUT_DIM, 
            EMBEDDING_DIM, 
            HIDDEN_DIM, 
            OUTPUT_DIM, 
            N_LAYERS, 
            BIDIRECTIONAL, 
            DROPOUT, 
            PAD_IDX)

# Rotinas de reuso do vocabulário treinado. Comentado pois não utilizamos.
#pretrained_embeddings = TEXT.vocab.vectors
#print(pretrained_embeddings.shape)
#model2.embedding.weight.data.copy_(pretrained_embeddings)
#UNK_IDX = TEXT.vocab.stoi[TEXT.unk_token]
#model.embedding.weight.data[UNK_IDX] = torch.zeros(EMBEDDING_DIM)
#model.embedding.weight.data[PAD_IDX] = torch.zeros(EMBEDDING_DIM)
#print(model.embedding.weight.data)

# Mudamos para um otimizador mais eficiente: Adam
optimizer = optim.Adam(model2.parameters())

# Precisa recriar os iteradores.
# - Outro detalhe necessário é ordenar por tamanho. O iterador já faz isso usando o sort_within_batch = True.
train_iterator, valid_iterator, test_iterator = data.BucketIterator.splits(
    (train_data, valid_data, test_data), 
    batch_size = BATCH_SIZE,
    sort_within_batch = True)

# Treina o modelo com LSTM
process(model2, train_with_sequences, evaluate_with_sequences, 'tf-model2')


Época: 01 | tempo de processamento: 64m 53s
	Train Loss: 0.666 | Train Acc: 59.30%
	 Val. Loss: 0.623 |  Val. Acc: 65.73%
Época: 02 | tempo de processamento: 58m 24s
	Train Loss: 0.605 | Train Acc: 67.23%
	 Val. Loss: 0.609 |  Val. Acc: 67.92%
Época: 03 | tempo de processamento: 66m 14s
	Train Loss: 0.590 | Train Acc: 68.71%
	 Val. Loss: 0.697 |  Val. Acc: 66.06%
Época: 04 | tempo de processamento: 57m 56s
	Train Loss: 0.471 | Train Acc: 78.66%
	 Val. Loss: 0.415 |  Val. Acc: 82.54%
Época: 05 | tempo de processamento: 63m 9s
	Train Loss: 0.406 | Train Acc: 82.31%
	 Val. Loss: 0.414 |  Val. Acc: 83.66%


# Análise segundo algoritmo

Aqui já conseguimos uma acurácia boa usando nosso vocabulário usando gensim. 
Resultado muito similar ao exemplo que utiliza o GloVe. Dessa forma não vi necessidade de otimizações. 
Até porque os tempos de processamento (aprox. 1h por época) torna esse processo inviável.

Outras possibilidades:
- Otimizar o dicionário para remover palavras irrelevantes para análise. Por exemplo, 
"film", ou "movie" que não direcionam para uma classificação específica. E priorizar outras que, com certeza direcionam,
como "good" ou "horrible". Pois a necessidade da nossa classificação é binária. Bom ou ruim. Não é multi-classe.
- Melhorar a velocidade do algoritmo usando técnicas como FastText (dica de [bentrevet](https://arxiv.org/abs/1607.01759));
- Usar um algoritmo convulational (CNNs) - que [mostra resultados excelentes com alguns ajustes em hiperparâmetros](https://arxiv.org/abs/1408.5882).
- Outra melhoria seria reduzir o dicionário e usar o algoritmo de proximidade para palavras que não entraram no dicionário. Por exemplo, no dicionário tem "bad" mas não "terrible". No algoritmo a feature seria substituída por "bad" por ser a mais similar. Acredito que haja algo assim no Embeeded, mas temos um máximo de palavras no vocabulário. Então com certeza algo se perde.

Mas, de novo, o tempo de treino dificulta demais esses testes. 

Dessa forma seguimos com a rotina de predição solicitada para o trabalho.

In [37]:
# Testando o modelo
# Exemplo de persistência: https://pytorch.org/tutorials/beginner/saving_loading_models.html

model_test = MultiLayerRNN(INPUT_DIM, 
                EMBEDDING_DIM, 
                HIDDEN_DIM, 
                OUTPUT_DIM, 
                N_LAYERS, 
                BIDIRECTIONAL, 
                DROPOUT, 
                PAD_IDX)
model_test.load_state_dict(torch.load('tf-model2.pt'))

test_loss, test_acc = evaluate_with_sequences(model_test, test_iterator, criterion)

print(f'Teste Loss: {test_loss:.3f} | Teste Acc: {test_acc*100:.2f}%')

print('Informações relevantes que não são salvas no estado')
print('INPUT_DIM=', INPUT_DIM, ', PAD_IDX=', PAD_IDX)

# Precisamos salvar o vocabulário para reuso na predição
torch.save(TEXT.vocab, "vocab2.pt")

Teste Loss: 0.393 | Teste Acc: 83.17%
Informações relevantes que não são salvas no estado
INPUT_DIM= 30002 , PAD_IDX= 1


83,17% de acurácia treinando com o próprio IMDB usando GenSim pra stemming.

In [48]:
# Obs.: Para executar esta célula somente é necessário declarar a classe e importar as libs acima.

# Função para ficar claro onde fica a parte de carregamento de estado
def prepare_model():
    def tokenize(sentence):
        return gensim.parsing.preprocessing.preprocess_string(sentence)

    TEXT = data.Field(tokenize = tokenize,
                      include_lengths = True)

    TEXT.vocab = torch.load("vocab2.pt")

    model = torch.load('tf-model2.ptf')
    model.eval()

    return model, TEXT

# Rotina independente de predição
def predict(text : str):
    # Isso poderia ser separado para performance
    model_pred, TEXT = prepare_model()

    texts, lengths = TEXT.process([text])
    with torch.no_grad():
        preds = model_pred(texts, lengths).squeeze(1)

    return torch.sigmoid(preds).round()

tests = ['very good film', 
    'not bad movie', 
    'terrible acting', 
    "One of the other reviewers has mentioned that after watching just 1 Oz episode you'll be hooked",
    "A wonderful little production"]
for t in tests:
    s = predict(t)
    print('Teste:', t, '[POS]' if s else '[NEG]')


Teste: very good film [POS]
Teste: not bad movie [POS]
Teste: terrible acting [NEG]
Teste: One of the other reviewers has mentioned that after watching just 1 Oz episode you'll be hooked [NEG]
Teste: A wonderful little production [NEG]
