In [8]:
! pip install captum --no-deps

import torch
import torch.nn.functional as F
from transformers import AutoTokenizer, AutoModelForSequenceClassification
from captum.attr import LayerIntegratedGradients, visualization as viz
import pandas as pd



In [9]:
checkpoint = '/kaggle/input/datasets/dmytriypan/distilbert-classifier-checkpoints/output/distilbert/distilbert-base-multilingual-cased_llm_trace_classification/checkpoint-6430'

device = 'cuda' if torch.cuda.is_available() else 'cpu'

model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
model.to(device)
model.eval()

tokenizer = AutoTokenizer.from_pretrained(checkpoint)

In [10]:
def forward_func(input_ids, attention_mask):
    outputs = model(input_ids=input_ids, attention_mask=attention_mask)
    probs = F.softmax(outputs.logits, dim=-1)
    return probs[:, 0]  # вероятность класса 0 (AI)

In [11]:
lig = LayerIntegratedGradients(forward_func, model.distilbert.embeddings)

In [12]:
def interpret_text(text, lig=lig):
    inputs = tokenizer(text, max_length=256, truncation=True, return_tensors='pt')
    input_ids = inputs['input_ids'].to(device)
    attention_mask = inputs['attention_mask'].to(device)

    attributions, delta = lig.attribute(
        inputs=input_ids,
        additional_forward_args=(attention_mask,),
        return_convergence_delta=True
    )

    attributions = attributions.sum(dim=-1).squeeze(0).detach().cpu()
    tokens = tokenizer.convert_ids_to_tokens(input_ids.squeeze(0))
    attributions = attributions / torch.norm(attributions)

    vis_data = viz.VisualizationDataRecord(
        attributions,
        torch.max(F.softmax(model(input_ids, attention_mask).logits, dim=-1)),
        torch.argmax(model(input_ids, attention_mask).logits),
        torch.argmax(model(input_ids, attention_mask).logits),
        text,
        attributions.sum(),
        tokens,
        delta
    )

    # Создаем DataFrame для токенов и их важности
    df_tokens = pd.DataFrame({'token': tokens, 'attribution': attributions.numpy()})
    return vis_data, df_tokens

In [13]:
def interpret_texts_batch(texts):
    visualizations = []
    dfs = []
    for text in texts:
        vis_data, df_tokens = interpret_text(text)
        visualizations.append(vis_data)
        dfs.append(df_tokens)
    return visualizations, dfs

In [23]:
import pandas as pd

splits = {'train': 'train.jsonl', 'validation': 'valid.jsonl', 'test': 'test.jsonl'}
df = pd.read_json("hf://datasets/iitolstykh/LLMTrace_classification/" + splits["test"], lines=True)

In [32]:
df_ai_ru = df.loc[(df['lang'] == 'ru') & (df['label']=='ai')].sample(20, random_state=42)
df_ai_eng = df.loc[(df['lang'] == 'eng') & (df['label']=='ai')].sample(20, random_state=42)

df_ai = pd.concat([df_ai_ru, df_ai_eng], axis = 0)
df_ai

Unnamed: 0,lang,label,model,data_type,prompt_type,topic_id,text,prompt
2568,ru,ai,yandex/YandexGPT-5-Lite-8B-instruct,article,delete,6c18c0b121a08440f2d8b514efa7f42d,**Отчёт о дегустации**\n\n**Интерьер**\n\nИнте...,Сожми этот длинный обзор до лаконичной статьи ...
36978,ru,ai,gpt-3.5,question,create,a84a2c4323c197fdcf8fe4e23566216e,Выплата страховой части государственной пенсии...,Какие особенности выплаты страховой части госу...
4915,ru,ai,gpt-4-1106-preview,poetry,update,2530a741c86d6bd36643d66460b97327,"И вот взошло сияющее Солнце, свет его раскинул...",Перепиши текст в стиле Булгакова. Можешь модиф...
18613,ru,ai,google/gemma-2-27b-it,article,delete,25ee17d72ac475e4f95c90df3dfcaf02,6 октября в рамках IT-фестиваля BitByte пройдё...,"Урежь этот объёмный текст до 60–100 слов, сохр..."
44708,ru,ai,google/gemma-2-27b-it,short_form,update,7079930e14ea14bc3aef5a1769da3bcb,Сердце партии «Великое Отечество» переполнено ...,"Переформулируй этот пост, применив более образ..."
30793,ru,ai,gpt-4,question,create,8e530fa5555d39bdd6249330de565ea2,Какие ключевые элементы на этой картинке? Изоб...,What are the key elements in this picture? T...
30490,ru,ai,gpt-4-0125-preview,question,update,ad2a4a42fac84acd261f34881fb267ee,В стопах Felis catus (домашних кошек) присутст...,Перепиши текст в научном стиле. Можешь модифиц...
23229,ru,ai,WizardLM-2-7B,poetry,create,ab01d1eeb1c1311503b24f987d3673a7,"Закат пылает алым светом, И облака как будто б...",Продолжи текст стихотворения в жанре лирика (п...
46175,ru,ai,o3-2025-04-16,factual,delete,5fdd2216acb2c881b3899bf958853e4b,"Во время одной весенней прогулки автор, затяну...",Убери из этого литературного произведения всё ...
49881,ru,ai,CohereForAI/c4ai-command-r-08-2024,article,update,d6456fa343f615b5c0367af8402a97d7,Взлом сайта в ночное время стал настоящим шоко...,"Отредактируй язык этой статьи, используя более..."


In [36]:
texts_AI = df_ai['text'].to_list()

visualizations, dfs = interpret_texts_batch(texts_AI)

# Показываем визуализацию всех текстов
viz.visualize_text(visualizations)

# Выводим DataFrame для первого текста
print(dfs[0])

True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,0 (1.00),"**Отчёт о дегустации** **Интерьер** Интерьер ресторана вызывает нарекания. Панели, шпонированные дубом, выглядят как ламинированные. Стеклянные ступеньки и ступеньки в туалете вызывают опасения из-за возможного скольжения. **Обслуживание** Официантка милая, но иногда робко шепчет названия блюд. Обслуживание в целом неплохое, например, сигарная пепельница была принесена без просьбы. **Еда** 1. Тёплое карпаччо с лисичками не произвело впечатления. 2. Моцарелла со сметанным соусом и чипсом из пармезана — просто выкладка готовых продуктов, скучно. 3. Фарината с мармеладом из порея, лепестками артишока и чем-то ещё — три куска блина с тушёным пореем, на двух кусках — по одному листику артишока, на третьем — корпускул горгондзолы, сверху ветчина. 4. Утиная грудка с кусочками апельсиновой корки и тыквы и с соусом из голубого сыра. Грудка как грудка, тыква с апельсином хороша, соус к месту, но расслоившийся. 5. Густой суп с чем-то и тёплое лечо — узнаваемый вкус, в лечо мягкие и приятные кусочки говядины и холодная фрикаделька. 6. Сосичча на картофельной котлетке — колбаска, в значительной степени состоящая из кроличьей печёнки. Суховата. 7. Баранья корейка с соусом из кизила. Баранина сочли жилистой, соус из кизила превосходен. 8. Сорбет из груши с граппой — выраженный вкус груши, ни намёка на лишнюю сладость, приятная спума из граппы. 9. Кофе хорош: тяжеленький, с тёмной плотной кремой, особенно подойдёт для капучино. Шефу хорошо удаются простые вещи, возможно, стоит сосредоточиться на них, не углубляясь в странные эксперименты.",2.74,"[CLS] * * От ##чёт о де ##гу ##ста ##ции * * * * Ин ##тер ##ьер * * Ин ##тер ##ьер р ##есто ##рана вы ##зывает нар ##ека ##ния . Па ##не ##ли , шп ##они ##рован ##ные ду ##бом , вы ##гляд ##ят как ла ##мин ##ирован ##ные . С ##те ##кл ##ян ##ные ст ##упе ##нь ##ки и ст ##упе ##нь ##ки в ту ##але ##те вы ##зы ##вают о ##пас ##ения из - за возможно ##го с ##кол ##ь ##жения . * * Об ##слу ##жив ##ание * * О ##фи ##ци ##ант ##ка ми ##лая , но иногда р ##об ##ко ш ##еп ##чет названия б ##лю ##д . Об ##слу ##жив ##ание в целом не ##п ##ло ##хо ##е , например , си ##гар ##ная п ##еп ##ель ##ница была при ##несе ##на без про ##сь ##бы . * * Е ##да * * 1 . Т ##ё ##п ##ло ##е кар ##па ##ч ##чо с ли ##си ##чка ##ми не про ##из ##вело в ##пе ##чат ##ления . 2 . М ##оца ##рел ##ла со смета ##нным со ##ус ##ом и чи ##п ##сом из пар ##ме ##зана [UNK] просто вы ##клад ##ка го ##товых продукт ##ов , с ##ку ##чно . 3 . Ф ##арин ##ата с ма ##рм ##ела ##дом из пор ##ея , ле ##пе ##стка ##ми ар ##ти ##шо ##ка и чем - то ещё [UNK] три к ##уска б ##лина с ту ##шён ##ым пор ##ее ##м , на двух к ##уска ##х [SEP]"
,,,,
0.0,0 (1.00),"Выплата страховой части государственной пенсии зависит от количества отработанных лет и размера заработной платы. Особенности выплаты заключаются в том, что она производится ежемесячно на банковский счет или карточку пенсионера, начисления и перерасчеты проводятся в соответствии с законодательством. Для повышения страховой части государственной пенсии можно использовать следующие способы: 1. Накопление пенсионных накоплений в ПФР (пенсионный фонд РФ) – переведение дополнительных страховых взносов на индивидуальный пенсионный счет. 2. Отработка дополнительных лет – каждый год отработки дает дополнительный процент к размеру пенсии. 3. Использование льготных условий – некоторые группы граждан имеют право на досрочное выход на пенсию или на повышение размера пенсии. 4. Участие в накопительных пенсионных программах, которые предлагают частные компании. 5. Подтверждение стажа и зарплаты – если у вас есть возможность подтвердить стаж и зарплату, то размер пенсии будет выше. В целом, чтобы повысить страховую часть государственной пенсии нужно участвовать в сбережении денег на пенсию и систематически работать. Каждый дополнительный вклад или стаж - это шаг к большей пенсии.",3.71,"[CLS] Вып ##лата стр ##ах ##овой части государственной пен ##сии зависит от количества от ##ра ##бо ##тан ##ных лет и размер ##а за ##ра ##бо ##тной п ##латы . О ##со ##бен ##ности вы ##п ##латы за ##кл ##ю ##чают ##ся в том , что она про ##из ##водится е ##же ##ме ##ся ##чно на банк ##овский с ##чет или карт ##о ##чку пен ##си ##оне ##ра , на ##числения и пер ##ера ##с ##чет ##ы про ##водятся в соответствии с закон ##ода ##тель ##ством . Для пов ##ыш ##ения стр ##ах ##овой части государственной пен ##сии можно использовать следующие с ##пособ ##ы : 1 . На ##коп ##ление пен ##си ##онных на ##коп ##лений в П ##Ф ##Р ( пен ##си ##он ##ный фонд РФ ) [UNK] пер ##еве ##дение доп ##ол ##ните ##льных стр ##ах ##овых в ##зно ##сов на ин ##ди ##вид ##уа ##льный пен ##си ##он ##ный с ##чет . 2 . От ##работка доп ##ол ##ните ##льных лет [UNK] каждый год от ##работки да ##ет доп ##ол ##ните ##льный про ##цент к размер ##у пен ##сии . 3 . И ##с ##поль ##зован ##ие л ##ь ##го ##тных условий [UNK] некоторые группы граждан имеют право на до ##с ##ро ##чное выход на пен ##сию или на пов ##ыш ##ение размер ##а пен ##сии . 4 . У ##час ##тие в на ##коп ##ительных пен ##си ##онных программа ##х , которые пред ##лага ##ют част ##ные компании . 5 . Под ##тве ##рж ##дение ст ##аж ##а и за ##р ##п [SEP]"
,,,,
0.0,0 (1.00),"И вот взошло сияющее Солнце, свет его раскинулся по полям, словно золотистая роса утренняя. В чинах пышных, великолепных пробудился в своем улье пчелиный народ. Забренчали крылышками они, как оркестр дивный, где каждый музыкант и певец есть одновременно. Припев звучит, словно призыв душевный: ""О, Солнышко великолепное, восстань, Запей нам ты свою мелодию светлую, Что каждому дарует жизни смысл!"" И вновь, Солнце лениво, алая кровь зари поплыла по небесной дали, распахнула веки на свет вековечный пчелиная семья в улье своем. И повторяется магия светила каждое утро, а в улике звучит бесконечный гул, возносящийся в небо, растекаясь по всему миру, даря счастье и жизнь всем тварям, что жаждут тепла его и света.",1.58,"[CLS] И во ##т в ##зо ##шло си ##я ##ющее Сол ##нце , свет его р ##ас ##кин ##ул ##ся по поля ##м , слов ##но з ##оло ##ти ##ста ##я рос ##а у ##тр ##ення ##я . В чин ##ах п ##ыш ##ных , вели ##кол ##еп ##ных про ##бу ##дил ##ся в своем ул ##ье п ##чели ##ный народ . За ##бр ##ен ##чали к ##ры ##лы ##шка ##ми они , как оркестр ди ##вный , где каждый музыка ##нт и певец есть одновременно . При ##пе ##в зв ##учи ##т , слов ##но приз ##ы ##в ду ##шев ##ный : "" О , Сол ##ны ##шко вели ##кол ##еп ##ное , во ##сс ##тан ##ь , За ##пе ##й нам ты свою м ##ело ##дию свет ##лу ##ю , Что каждом ##у дар ##ует жизни см ##ыс ##л ! "" И вновь , Сол ##нце ле ##нив ##о , ала ##я к ##ров ##ь за ##ри поп ##лы ##ла по не ##бе ##сной дали , р ##ас ##пах ##нула век ##и на свет веков ##еч ##ный п ##чели ##ная семья в ул ##ье своем . И пов ##тор ##яется ма ##гия свет ##ила ка ##ж ##до ##е у ##тро , а в ул ##ике зв ##учи ##т б ##ес ##кон ##еч ##ный г ##ул , во ##зно ##ся ##щий ##ся в небо , р ##аст ##ека ##ясь по всему миру , дар ##я с ##час ##ть ##е и жизнь всем т ##вар ##ям , что жа ##ж ##дут те ##п ##ла его [SEP]"
,,,,
0.0,0 (1.00),"6 октября в рамках IT-фестиваля BitByte пройдёт бесплатная HPC-конференция, посвящённая высоконагруженным системам. В программе выступления специалистов Badoo, ITmozg, Фотострана и Mail.Ru Group, которые поделятся опытом оптимизации приложений, баз данных и архитектуры проектов с миллионами пользователей. Мероприятие пройдёт в Москве, в клубе Нагатино: количество мест ограничено (250 в зале, 400 в лаундж-зоне с трансляцией). Регистрация открыта: выберите пункт «участие в HPC-секции».",0.9,"[CLS] 6 октября в рамках IT - фестиваля Bit ##B ##yte про ##йд ##ёт б ##ес ##п ##латна ##я HP ##C - кон ##ференция , по ##с ##вя ##щён ##ная вы ##сок ##она ##гр ##у ##жен ##ным система ##м . В программе выступления специалистов Bad ##oo , IT ##mo ##z ##g , Ф ##ото ##стра ##на и Mail . R ##u Group , которые под ##еля ##тся опыт ##ом о ##п ##тим ##изации при ##ложен ##ий , ба ##з данных и архитектуры проектов с милли ##она ##ми пол ##ь ##зова ##телей . М ##еро ##пр ##ият ##ие про ##йд ##ёт в Москве , в клубе На ##гат ##ино : количество мест о ##гра ##ни ##чено ( 250 в зал ##е , 400 в ла ##ун ##дж - зоне с т ##ран ##сл ##я ##цией ) . Рег ##ист ##рация открыта : вы ##бер ##ите пункт « участие в HP ##C - се ##кции » . [SEP]"
,,,,
0.0,0 (1.00),"Сердце партии «Великое Отечество» переполнено горьким разочарованием. Несмотря на титанические усилия наших активистов и добровольцев, которые собрали более 300 тысяч голосов поддержки, нам не удалось преодолеть бюрократические преграды и пройти на выборы в Госдуму. Мы с гордостью можем сказать, что более 200 тысяч подписей были представлены в Центральную избирательную комиссию. Однако, к сожалению, значительная часть из них была признана недействительными по формальным причинам, таким как пропущенная дата рождения сборщика или неполное указание региона. Мы уверены, что эти формальные недочеты не умаляют искренней поддержки, которую мы получили от сотен тысяч граждан. К сожалению, установленный срок сдачи подписей оказался слишком коротким, чтобы тщательно проверить и обработать такой объем голосов. Мы не можем не заметить, что «большие» партии, возможно, опасаются конкуренции и создают препятствия для новых политических сил. Несмотря на это, «Великое Отечество» не сдается. Мы верим в наши идеи и продолжим бороться за них. В ближайшее время мы запустим онлайн-платформу, где будут размещены наши законопроекты, чтобы депутаты, разделяющие наши ценности, могли внести их в Госдуму. В начале сентября мы созовем съезд партии, чтобы подвести итоги кампании по сбору подписей и определить дальнейшие шаги. Мы будем продолжать служить народу и бороться за его интересы.",2.18,"[CLS] Се ##рдце партии « В ##ели ##кое От ##ече ##ство » пер ##еп ##ол ##нено гор ##ьким раз ##о ##чар ##ование ##м . Несмотря на ти ##тани ##ческие у ##сили ##я наших акт ##иви ##стов и добро ##вол ##ь ##цев , которые со ##брали более 300 тысяч голосов поддержки , нам не удалось пре ##од ##оле ##ть бюро ##к ##рати ##ческие пре ##град ##ы и про ##йти на вы ##боры в Г ##ос ##дум ##у . Мы с гор ##до ##стью може ##м с ##каз ##ать , что более 200 тысяч под ##пис ##ей были представлены в Центр ##альну ##ю из ##бира ##тельную ко ##ми ##сси ##ю . Однако , к со ##жал ##ению , значи ##тельная часть из них была признан ##а не ##дей ##ств ##итель ##ными по форма ##льным причинам , таким как про ##пу ##щен ##ная дата рождения с ##бор ##щика или не ##по ##лно ##е ук ##азан ##ие региона . Мы у ##вер ##ены , что эти форма ##льные не ##до ##чет ##ы не ум ##аля ##ют и ##ск ##рен ##ней поддержки , которую мы получили от со ##тен тысяч граждан . К со ##жал ##ению , установлен ##ный срок с ##да ##чи под ##пис ##ей оказался слишком кор ##от ##ким , чтобы т ##ща ##тельно про ##вер ##ить и об ##ра ##бо ##тать такой об ##ъ ##ем голосов . Мы не може ##м не за ##метить , что « большие » партии , возможно , о ##пас ##аются кон ##ку ##ренц ##ии и со ##зда ##ют пре ##п ##ят [SEP]"
,,,,


      token  attribution
0     [CLS]     0.513396
1         *     0.114037
2         *     0.073765
3        От     0.018969
4     ##чёт     0.034211
..      ...          ...
251    двух    -0.042207
252       к    -0.060843
253  ##уска    -0.106350
254     ##х    -0.047427
255   [SEP]     0.507466

[256 rows x 2 columns]
