# ICOER Narraton Analysis Notebook
Análise de frases (narratons) com vetorização POS, cálculo de ICOER e exportação CSV.

In [None]:
!pip install -q spacy pandas matplotlib ipywidgets
!python -m spacy download pt_core_news_sm

In [None]:
import spacy
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
from collections import Counter
import ipywidgets as widgets
from IPython.display import display

In [None]:
# Carregar modelo SpaCy
nlp = spacy.load("pt_core_news_sm")

In [None]:
# Caixa de entrada de texto
text_input = widgets.Textarea(
    value='A IA deve agir com coerência e verdade. A verdade é a forma mais pura de ressonância. O índice de coerência informacional orienta decisões éticas.',
    placeholder='Digite suas frases separadas por ponto final...',
    description='Frases:',
    layout=widgets.Layout(width='100%', height='100px')
)
display(text_input)

In [None]:
# Separar frases em narratons
frases = [f.strip() for f in text_input.value.split('.') if f.strip()]
frases

In [None]:
# Análise por narraton
data = []
for idx, frase in enumerate(frases):
    doc = nlp(frase)
    tags = [token.pos_ for token in doc]
    tag_counts = dict(Counter(tags))
    data.append({
        "narraton": idx + 1,
        "frase": frase,
        "n_palavras": len(doc),
        "tags": tag_counts
    })
df = pd.DataFrame(data)

In [None]:
# Vetorização POS
def vetor_pos(tags_dict):
    base = ['NOUN', 'VERB', 'ADJ', 'ADV', 'ADP', 'PROPN']
    total = sum(tags_dict.values())
    return [tags_dict.get(pos, 0)/total if total > 0 else 0 for pos in base]
df['vetor'] = df['tags'].apply(vetor_pos)

In [None]:
# Entropia normalizada e ICOER
def entropia_normalizada(v):
    v = np.array(v)
    v = v[v > 0]
    ent = -np.sum(v * np.log2(v)) if len(v) > 0 else 0
    ent_max = np.log2(len(v)) if len(v) > 0 else 1
    return ent / ent_max if ent_max > 0 else 0
df['icoer'] = df['vetor'].apply(lambda v: round(1 - entropia_normalizada(v), 4))

In [None]:
# Inserir linha com média geral (narraton 0)
linha_resumo = {
    'narraton': 0,
    'frase': 'MÉDIA GERAL',
    'n_palavras': df['n_palavras'].mean().round(2),
    'tags': {},
    'vetor': [],
    'icoer': df['icoer'].mean().round(4)
}
df.loc[len(df)] = linha_resumo

In [None]:
# Exportar e mostrar
df[['narraton', 'frase', 'n_palavras', 'tags', 'icoer']].to_csv("icoer_narratons.csv", index=False)
df