In [1]:
# Bibliotecas que serão utilizadas neste notebook
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import MultinomialNB
from sklearn.metrics import accuracy_score
from sklearn.metrics import accuracy_score, classification_report
import os

In [2]:
# Variáveis Globais
diretorio = r'C:\Users\natan\OneDrive\Documentos\ProjetosPROG\Jupyter\WritingML\Escritas EF-EM'
diretorio_IA = r'C:\Users\natan\OneDrive\Documentos\ProjetosPROG\Jupyter\WritingML\Modelos de Linguagem Amplo'

In [3]:
# Função para ler textos e retornar as features e rótulos
def ler_textos(diretorio, rotulo):
    arquivos = os.listdir(diretorio)
    vectorizer = CountVectorizer()
    textos = []

    for arquivo in arquivos:
        if arquivo.endswith('.txt'):
            with open(os.path.join(diretorio, arquivo), 'r') as f:
                conteudo = f.read()
                textos.append((conteudo, rotulo))

    return textos

# Ler textos feitos por humanos
textos_humano = ler_textos(diretorio, 'humano')

# Ler textos feitos pela IA
textos_IA = ler_textos(diretorio_IA, 'IA')

# Juntar os textos e rótulos
textos_total = textos_humano + textos_IA
X_total = [texto[0] for texto in textos_total]
y_total = [texto[1] for texto in textos_total]

# Dividir o conjunto de dados em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X_total, y_total, test_size=0.2, random_state=42)

# Criar um vetorizador e transformar os textos em vetores
vectorizer = CountVectorizer()
X_train_vectorized = vectorizer.fit_transform(X_train)
X_test_vectorized = vectorizer.transform(X_test)

# Criar o modelo Naive Bayes
model = MultinomialNB()

# Treinar o modelo
model.fit(X_train_vectorized, y_train)

# Fazer previsões no conjunto de teste
y_pred = model.predict(X_test_vectorized)

# Avaliar a precisão do modelo
accuracy = accuracy_score(y_test, y_pred)
print(f'Acurácia do modelo: {accuracy:.2f}')

# Imprimir o relatório de classificação
print('\nRelatório de Classificação:\n', classification_report(y_test, y_pred))


Acurácia do modelo: 1.00

Relatório de Classificação:
               precision    recall  f1-score   support

          IA       1.00      1.00      1.00         2
      humano       1.00      1.00      1.00         1

    accuracy                           1.00         3
   macro avg       1.00      1.00      1.00         3
weighted avg       1.00      1.00      1.00         3



In [7]:
# TESTE 1 - TEXTO HUMANO

# Suponha que este é o seu novo texto
novo_texto1 = """
A construção dos feudos, muros que delimitavam uma determinada área no período da Idade Média, segregou milhares de pessoas e impossibilitou o acesso a bens que somente a nobreza podia usufruir. Semelhante a essa época, no contexto brasileiro contemporâneo, o cinema é um dos inúmeros meios de democratizar a cultura, mas ainda é "feudalizado", já que grande parte da população continua alheia a esse serviço . Então, tanto a concentração das salas de teledramaturgia em regiões mais desenvolvidas economicamente, quanto os exorbitantes preços dos ingressos e alimentos, vendidos com exclusividade pela empresa proprietária, mutilam a cidadania e consagram importantes simbologias de poder.
Nessa perspectiva, a cultura é imprescindível para a identidade de um povo e, indubitavelmente, o cinema é uma fundamental ferramenta de inclusão e de propagação de valores sociais. Entretanto, de acordo com o geógrafo Milton Santos, no texto "Cidadanias Mutiladas", a democracia, extremamente necessária para a fundamentação cultural do indivíduo, só é efetiva quando atinge a totalidade do corpo social, ou seja, na medida em que os direitos são universais e desfrutados por todos os cidadãos. Dessa maneira, a concentração das salas de cinemas em áreas com alto desenvolvimento econômico e o alheamento de milhares de pessoas a esse serviço provam que não há democratização do acesso à cultura cinematográfica no Brasil, marginalizando grande parcela da sociedade desprovida de recursos financeiros.
Outrossim, os preços abusivos de ingressos, a divisão das salas em categorias de conforto e a proibição de entrada de bebidas e alimentos, que não sejam vendidos no estabelecimento, dividem, ainda mais, a sociedade. Isso pode ser explicado pelo teórico Pierre Bourdieu, o qual afirma que todas as minúcias de um indivíduo constituem simbologias que são constantemente analisadas pelo corpo social, isto é, o poder de compra, as características pessoais e o acesso a bens e serviços refletem quem é o homem para outrem. Dessa forma, o alto custo praticado pelas redes cinematográficas violenta simbolicamente aqueles que não conseguem contemplar as grandes telas e aumenta a desigualdade.
Portanto, cabe à iniciativa privada, em parceria com os estados e municípios, promover a interiorização das salas de teledramaturgia, por meio da construção de novos empreendimentos em áreas distantes dos pólos econômicos e da redução dos custos para o consumidor de baixa renda, incentivando, então, a cultura mais democrática. Além disso, é responsabilidade da Ancine, Agência Nacional de Cinema, estabelecer um canal de comunicação mais efetivo com o telespectador, por intermédio de aplicativos e das redes sociais interativas, para que denúncias e reclamações sobre preços abusivos possam ser realizadas. Como efeito social, a democratização do cinema no Brasil será uma realidade, destruindo, assim, barreiras e "feudos" sociais.
"""

# Transforma o novo texto em um vetor usando o mesmo vetorizador
novo_texto_vectorized = vectorizer.transform([novo_texto1])

# Usa o modelo para fazer uma previsão
predicao = model.predict(novo_texto_vectorized)

# Printa na tela a previsão
if predicao[0] == 'humano':
    print("Com base na adaptação do modelo de ML, esse texto se encaixa nos dados de textos escritos por humanos.")
else:
    print("Com base na adaptação do modelo de ML, esse texto se encaixa nos dados de textos escritos por uma máquina.")


Com base na adaptação do modelo de ML, esse texto se encaixa nos dados de textos escritos por humanos.


In [8]:
# TESTE 2 - TEXTO MÁQUINA

# Suponha que este é o seu novo texto
novo_texto2 = """
A democratização do acesso ao cinema no Brasil é um desafio que envolve diversos aspectos socioculturais. A arte, em suas diferentes manifestações, desempenha um papel fundamental nesse processo, influenciando a forma como as pessoas enxergam e consomem o cinema. Nesta redação, exploraremos como a arte, em suas diversas formas, contribui para tornar o cinema mais acessível à população brasileira.
A música é uma linguagem universal que transcende barreiras culturais e sociais. No contexto da democratização do acesso ao cinema, a trilha sonora desempenha um papel crucial. Compositores brasileiros têm enriquecido a experiência cinematográfica, criando músicas que refletem a diversidade do país. A música popular brasileira, por exemplo, tem sido incorporada em trilhas sonoras de filmes, conectando o público a elementos familiares e criando uma identidade cultural única. Essa integração da música com o cinema não apenas enriquece a produção cinematográfica nacional, mas também atrai públicos diversos, contribuindo para a democratização do acesso.
A democratização do acesso ao cinema no Brasil também está intimamente ligada à arte visual. O desenvolvimento de técnicas visuais inovadoras, inspiradas em movimentos artísticos locais, tem o potencial de atrair um público mais amplo. Diretores e cineastas brasileiros têm explorado a riqueza da cultura visual do país em suas produções, incorporando elementos de pintura, fotografia e design. Ao fazer isso, não apenas enriquecem esteticamente o cinema, mas também aproximam a sétima arte de diferentes estratos sociais, tornando-a mais acessível e relevante para a população.
Em síntese, a democratização do acesso ao cinema no Brasil é um processo complexo que demanda a integração de diversas expressões artísticas. A música e a arte visual desempenham papéis cruciais nesse cenário, conectando o cinema à diversidade cultural do país. Ao incorporar elementos locais, os cineastas não apenas enriquecem suas produções, mas também tornam o cinema mais acessível a diferentes públicos, contribuindo para a construção de uma identidade cinematográfica nacional.
"""

# Transforma o novo texto em um vetor usando o mesmo vetorizador
novo_texto_vectorized = vectorizer.transform([novo_texto2])

# Usa o modelo para fazer uma previsão
predicao = model.predict(novo_texto_vectorized)

# Printa na tela a previsão
if predicao[0] == 'humano':
    print("Com base na adaptação do modelo de ML, esse texto se encaixa nos dados de textos escritos por humanos.")
else:
    print("Com base na adaptação do modelo de ML, esse texto se encaixa nos dados de textos escritos por uma máquina.")


Com base na adaptação do modelo de ML, esse texto se encaixa nos dados de textos escritos por uma máquina.
