In [None]:
#!wget --continue http://www.lrc.ic.unicamp.br/~ferraroni/datasets/adrenaline/conversations.zip
#!unzip conversations.zip >> log.out

In [None]:
!pip install --quiet "scikit-learn" "datasets" "scipy" "torchmetrics>=0.3" "transformers==4.9.0" "torch>=1.9" "pytorch-lightning>=1.3" "huggingface-hub==0.0.12"

In [1]:
import os
import tqdm
import glob
import pandas as pd

In [2]:
import torch
from torch.utils.data import Dataset, DataLoader
from sklearn.model_selection import train_test_split

In [3]:
from transformers import GPT2Tokenizer, GPT2LMHeadModel
from transformers import Trainer, TrainingArguments
from datasets import load_dataset, load_metric

In [4]:
tokenizer = GPT2Tokenizer.from_pretrained("pierreguillou/gpt2-small-portuguese")
model = GPT2LMHeadModel.from_pretrained("pierreguillou/gpt2-small-portuguese")

In [5]:
from datasets import ClassLabel
import random
from IPython.display import display, HTML

def show_random_elements(dataset, num_examples=10):
    assert num_examples <= len(dataset), "Can't pick more elements than there are in the dataset."
    picks = []
    for _ in range(num_examples):
        pick = random.randint(0, len(dataset)-1)
        while pick in picks:
            pick = random.randint(0, len(dataset)-1)
        picks.append(pick)
    
    df = pd.DataFrame(dataset[picks])
    for column, typ in dataset.features.items():
        if isinstance(typ, ClassLabel):
            df[column] = df[column].transform(lambda i: typ.names[i])
    display(HTML(df.to_html()))

In [None]:
files = glob.glob("clear_threads/*_*.tsv")

frames = []
counter = 1

for file in tqdm.notebook.tqdm(files):
    counter += 1
    df = pd.read_csv(file, delimiter='\t', quoting=3, header=None, names=["timestamp", "id", "text"])
    df.drop(columns=['timestamp'], inplace=True)
    df['reply'] = df['text'].shift(-1)
    df = df.iloc[:-1]
    os.remove(file)
    frames.append(df)
    if counter % 1000 == 0:
        out = pd.concat(frames, axis=0, ignore_index=True)
        out.dropna(axis=0, inplace=True)
        frames = []
        out.to_parquet(file.replace('.tsv', '.parquet'))
        del out

In [7]:
train_files, validation_files = train_test_split(glob.glob("clear_threads/11*.parquet"), test_size=0.1)

In [8]:
datasets = load_dataset("parquet", data_files={"train": train_files, "validation": validation_files})
datasets = datasets.filter(lambda x: x['text'] is not None and x['reply'] is not None)

Using custom data configuration default-62766e55e41dd593


Downloading and preparing dataset parquet/default (download: Unknown size, generated: Unknown size, post-processed: Unknown size, total: Unknown size) to /home/jader/.cache/huggingface/datasets/parquet/default-62766e55e41dd593/0.0.0/03dda9603b6ba3760d9d286684a3d7d8ec00448c154f765795485acd3229ecba...


0 tables [00:00, ? tables/s]

0 tables [00:00, ? tables/s]

Dataset parquet downloaded and prepared to /home/jader/.cache/huggingface/datasets/parquet/default-62766e55e41dd593/0.0.0/03dda9603b6ba3760d9d286684a3d7d8ec00448c154f765795485acd3229ecba. Subsequent calls will reuse this data.


  0%|          | 0/166 [00:00<?, ?ba/s]

  0%|          | 0/4 [00:00<?, ?ba/s]

In [9]:
show_random_elements(datasets["train"])

Unnamed: 0,id,text,reply
0,/members/hoguga.154856/,Opa.. Segue meus testes: <url> [email protected] </url> /1100 <url> img405.imageshack.us <image> </url> <url> [email protected] </url> Stock <url> img405.imageshack.us <image> </url> <url> img41.imageshack.us <image> </url> <url> img694.imageshack.us <image> </url> Claramente o teste da area 01 força a gpu e o restante testa o processador... <emoji> :D </emoji> abraçoss :yes:,"Do teste 2 ao 4 sua HD 5850 está com gargalo por causa da CPU, podia render mais, porém nada que deva atrapalhar, a não ser pelo fps mínimo que não tem como avaliar por esse bench. Falou, bom divertimento :yes:"
1,/members/rntbarbosa.2499868/,"O ping ficou melhor, ou continua alto? Após o reparo na TAR, a linha voltou a suportar 15mb? O ruido tá alto e o modem entrou em modo adaptativo, 25mb deve alinhar em ~27.xxx Kbps. Já corrigiram o problema? Tô a um mês tentando a substituição meu td5130v1 que uso a uns 4 anos, e agora começou a travar aleatoriamente, a oi mandou 3x um técnico na minha casa, mas ele não tinha modem novo no carro, até fiz uma reclamação na anatel sobre isso, deixei bem claro que o modem precisava ser trocado e que isso era responsabilidade da OI pois, no contrato o modem é cedido em regime de comodato ( <url> www.oi.com.br <link> </url> ), e o que a OI fez?? Abriu outro reparo, e mandou mais um técnico sem modem. Só me resta reclamar no consumidor.gov. Notou se o wifi do pace é mais forte que o do tech? Não achei firmware genérico desse modem, acho que tem como extrair ele do modem por telnet. Se vc poder, extrai ele e posta aqui. Quanto tá seu snr e att? O segundo modem também veio sem firmware personalizado para a OI/fon? No sac não temos como solicitar essa mudança, só o técnico do fixo pode fazer essa troca, se tiver viabilidade, e se ele quiser, pq tem uns que não gostam de fazer esse procedimento, ou seja, depende vontade/pressa do técnico. O snr se manteve o mesmo nos dois, obrigado por postar esse comparativo. Descobriu se é a placa wifi do note que não tá suportando mais do que 2.2mb/s? Atualizou o driver da placa wifi?","Sim, ambos vieram sem FON, pelo que o técnico disse, eles são diferentes pois eram pra ser os modens de teste aqui na região, mas colocaram pra mim pois não tinham outros."
2,/members/rexbauru.222900/,"olhei aqui e o watmam mostra temp máxima 90ºC temp alvo 75ºC , não tentei baixar a voltagem não.","Então realmente o perfil da fan na Sapphire é bem modesto, porque deixar a placa passar 4°C do target é dose... Falouws <emoji> :cool: </emoji>"
3,/members/lu4414.2714338/,"Não há problema nenhum nisso, isso tem a ver com a região. Locais ex-telesp que receberam a rede primeiro (na época do fusionado) tem um over maior e nas regiões novas eles controlam melhor direto na OLT. Isso de expansão tem a ver com concorrência. A meta da Vivo é (e de qualquer outra hehehe) é lucrar e a estrutura de rede deles se alinha com esse objetivo. Não compreendo o porque cabear só 1/3 de um prédio (será que eles não confiavam que a demanda seria maior?), não sei se é falha de planejamento ou se o plano é esse e tudo bem para eles não atender todos.... O que sei que deve crescer com o tempo - e talvez ajude nisso - é a pressão por boas opções de internet na hora de comprar/alugar um espaço, já passou da hora de construtoras e teles se conversarem melhor!","entendi. Porem algo de errado não está certo. hoje minha conexão está muito instável, com dificuldade de carregar algumas paginas que acesso para trabalho e com uma limitação de velocidade bem abaixo da contratada. nos testes que fiz hoje, a velocidade máxima alcançada foi de 220/120mb (meu plano é 300/150) por cabo de rede e com somente meu computador ativo na rede. reiniciei o modem, e não obtive nenhuma melhora de velocidade ou nos carregamentos de pagina. mudei meu cabo de rede para o modem da Claro/NET, e minha navegação ficou normal. o estranho é que mesmo com a velocidade dando 220mb, eu não conseguia abrir algumas paginas de forma correta, aonde fica carregando e demorando para carregar as paginas. não sei se a causa é porque a rede de fibra é nova e precisa de algum ajuste externo, ou é problema na instalação/modem."
4,/members/fgmirra.158941/,"Estou fazendo uns testes com uma XFX RX480 gtr black edition, porém não é minha, é emprestada <emoji> :bua: </emoji> , porém o proprietário está pensando em pegar uma GTX 1070/1080, talvez consiga deixa-la por aqui. <emoji> :notsure: </emoji> O driver que estou usando é Crimson Edition 16.11.2 Hotfix não WHQL, deve ser por isso que aparece como não aprovado no 3dmark. Se puder, faça os testes com as mesmas configurações do _EagleMan_ nos mesmo jogos, pode postar de outros games também, é só mostrar a configuração usada para termos um parâmetro, no momento estou com poucos games aqui. <emoji> :joia: </emoji> No shadow of mordor rodei o benchmark do game para ter uma ideia dos fps. Vou colocar um teste que fiz do gameplay gravado pelo fraps abaixo e como ficou os dados da placa pelo GPUZ, já adianto que usou bem mais que 6gb de vram em 1080p <emoji> ;) </emoji> Difícil dizer, acho que se puder partir para uma GTX 1070 seria uma escolha melhor. <emoji> :hmm2: </emoji> O cpu da uma segura mesmo, normal, vi que o ROTR é bem mais exigente em relação a cpu do que o Tomb Raider 2013, mas essa melhora nos fps mínimos foi muito bem vinda usando o win10. <emoji> :joia: </emoji> Mesmo no win8.1 que tenho aqui, não chega estragar a experiencia no game. Outra coisa que deve complicar é a ram, 8gb está sendo pouco nessa leva de games que estão saindo. Como esperou esse tempo todo é melhor esperar os Zen/Sky/Kabylake mesmo e já parte para 32gb de ram <emoji> :mesa: </emoji> pensando nos ports porcos e longividade da plataforma. É o que pretendo fazer para o ano que vem <emoji> :bat: </emoji> Testes gravado pelo FRAPS do gameplay resolução 1920x1080 quality ultra ShadowOfMordor Frames: 13600 - Time: 180468ms - Avg: 75.360 - Min: 50 - Max: 100 Apesar dos FPS estarem ótimos a placa varia o uso da GPU, e os core clock/memory clock no talo. <image> resolução 2880x1620 quality ultra ShadowOfMordor Frames: 23438 - Time: 423891ms - Avg: 55.293 - Min: 42 - Max: 65 Agora aumentando a resolução <emoji> :olho: </emoji> <image> vlw <emoji> :) </emoji>","Amigo legal esse em, deixar na sua mão uma vga novinha e atual <emoji> :lindo: </emoji> , aqui na cidade só tenho um amigo que joga no pc só que ele tem uma 750 ti 2gb, e só joga Dota 2 rsrsrrs Tenho postados fotos do gpu-z com o resultado de consumo dos jogos, vou continuar postando aqui, deve interessar aos amigos <emoji> :) </emoji> olhei no ebay e sites chineses (dx, ali, gear) isso foi a uns 45~60dias, na epoca tinha (e parece que ainda tem, não pesquisei) no ml por 100R$, tive sorte e na epoca tinha uma mulher vendendo por 70R$ paguei mais 12R$ de frete, veio em uma caixa como com garantia e tudo, eu acho que vc não deve contar com um possível receptor Bluetooth não, o receptor wiriless funciona muito bem, não tem porque lançar outro produto, lembrando que quando lançou esse receptor ele não era nada barato la no pais de origem eua. kkkk nem vi que escrevi gatinhos. a M$ seria muito bondosa se oferecesse suporte a receptores Bluetooth de terceiros, um receptor desse e baratíssimo, o meu que comprei 2014 paguei 25R$, ta certo que não deve ser o modelo novo 4, mas receptor bluetooth normalmente é bem barato, ai a M$ perderia dinheiro pois não venderia mais nenhum receptor wirilless que ela mesma ""criou"" cade as fotos jovem??? posta umas duas ai <emoji> :joia: </emoji>"
5,/members/juniorcsar.2564514/,"Muito estranho sua CX 430 não estar segurando a RX 470. Também tenho essa fonte, a minha RX 470 é a da Sapphire e quando tô jogando o clock sempre fica cravado em 1260MHz e nunca deu problema aqui.","Por causa disso que suspeito que seja problema com o exemplar dele, seja fonte ou VGA. RAM eu também não descarto, mas apresentar reset aleatório só pelo fato de ter trocado a VGA? Bastante improvável. Foi como eu disse: em termos de trabalhar na melhor eficiência energética possível, essa fonte não seria a ideal, em virtude do PC dele estar consumindo em torno de 365W, enquanto que o sweet spot dessa fonte giraria em torno dos 215W; porém, no que diz respeito à ter potência para suprir a demanda do PC como um todo, ela sem dúvida possui. O que me admira é que ele saiu de uma 260X, que nem de longe é econômica (TDP de 115W e eu acho que ela consome até mais do que isso), para outra que consome razoavelmente bem, porém não tanto à mais quanto a 260X anterior (TDP de 120W, podendo naturalmente superar esse valor mediante overclock ou aquecimento demasiado da GPU). Se for problema com a fonte, é algum defeito que surgiu com o passar do tempo (poeira agindo, umidade também, maresia, essas coisas), mas ainda acho difícil de ser. Como você mesmo suspeita, existe uma possibilidade de ser realmente superaquecimento, pois a 470, por ser open air e ter maiores dimensões, produz um volume maior de ar quente que é dissipado pela parte superior da VGA, e esse ar deve realmente estar sendo absorvido pela fan do cooler da CPU, devido à posição da sua instalação. A questão é que o <url> forum.adrenaline.com.br @flamenguistak </url> alega que o PC reiniciou, ou seja, esse comportamento não é sintoma de superaquecimento da CPU, pois se fosse, o PC desligaria ao invés de reiniciar. Cable management praticamente não tem impacto na temperatura dos componentes do PC: <mediaembed> youtube </mediaembed> Reduzir o clock reduz o aquecimento, é verdade, mas ele usou o MSI Afterburner para fazer uma curva custom da fan, então a temperatura iria cair de qualquer jeito. Portanto, diante das informações que temos disponíveis, desconfio que o problema seja relacionado ou à fonte (considerando a manifestação de um defeito qualquer que a impossibilitou a mesma de atingir a demanda exigida, ou então algo relacionado à idade dela, uma vez que as fontes perdem capacidade de fornecer a potência rotulada em função do envelhecimento dos componentes internos, mas não sei até que ponto isso afetou negativamente essa fonte, que já tem seus 3 anos de vida) ou à própria VGA (que talvez esteja instável para trabalhar com o clock de fábrica com o vcore/power limit stock; até o momento, são as únicas coisas que consigo pensar, até porque são 02:00 aqui e eu tô quase desmaiando em cima do teclado <emoji> :haha: </emoji> ). Pra finalizar alguns benchmarks feitos em cima da minha 750 TI SC da EVGA: <spoiler> Spoiler: EVGA GTX 750 TI SC 2GB Benchmarks Valley Benchmark - Extreme HD: <image> Tomb Raider 2013 - Max Settings, SSAA 2X: <image> Rise of The Tomb Raider - Max Settings, SMAA: <image> </spoiler> Dos que tenho com benchmark embutido, só faltou o Hitman Absolution, mas já o pus pra baixar <emoji> :joia: </emoji> Vamos ver como a RX se sai rodando esses jogos quando ela chegar amanhã... <emoji> :isso: </emoji> <emoji> :mr: </emoji> <emoji> :magico: </emoji> <emoji> :gaming: </emoji> Pouco ganho, mas pelo menos teve e é o que importa. Mas como que está o gameplay? Zoado feito BF ou mais parecido com o DX11? <emoji> :hmm2: </emoji> EDIT: EXTRA, EXTRA!! A Mamute abaixou o preço da 1050 TI! <spoiler> Spoiler <image> Antes era... <image> Nossa, que super redução de quase R$ 20 no preço à vista foi essa, meu Deus?! Tá barato demais!! #SQN! <emoji> :pff: </emoji> <emoji> :bwahaha: </emoji> </spoiler> Falouws <emoji> :cool: </emoji>"
6,/members/sugien.2639854/,"ASHUAHSIAH, é a GTR normal, a de 1288Mhz. Em stock, ela fica em 1.05v já. Com 1.0v ela funciona tranquilo, mas qualquer coisa abaixo disso no wattman não parece ser aplicado .-. Por enquanto só testei com Dirt 3 e com o kombustor. To baixando TW3 pra testar mais esse undervolt Tu fez undervolt no wattman, ou usou outro programa, tipo o afterburner? Como ficou a sua configuração das fans?","Como padrão já fica 1,05V?! <emoji> :putz: </emoji> <emoji> :medo: </emoji> Então tá explicado porque os chips com ASIC alto não conseguem clocks maiores: limitação no aumento do vcore/PL na BIOS, que só vai até +100mV e 50%... Pra superar isso, só fazendo biosmod mesmo. Com 1V funciona tranquilo? Bom demais! <emoji> :megusta: </emoji> Aqui não deve chegar nem a pau a ficar estável assim <emoji> :feelbad: </emoji> Depois faz um log de um gameplay de um jogo relativamente pesado usando o GPU-Z, que monto o gráfico e posto aqui <emoji> :joia: </emoji> Não dá pra reduzir pra menos que isso no Wattman? Acabei de simular 995mV e foi, ele aceitou a mudança, mas não testei na prática por motivos óbvios. Tenta fazer com o Afterburner pra ver se surte algum efeito <emoji> :joia: </emoji> Fiz o meu processo usando o Wattman mesmo, pois é o único que consegue alterar todos os estados da placa, diferente do Afterburner, que só mexe no Estado 7. As fans eu deixei em auto mesmo, do jeito que veio configurado na BIOS. A placa chega em 70°C, mas a fan gira a, no máximo, 47%; a redução foi muito boa (de 80, com vcore stock, para 47%) e poderia ainda ser maior se eu afrouxasse um pouco o target da temperatura. Mas a 660 TI e a 7950 tem consumo bem parecido, então por isso não deve ter causado tanto impacto; no caso da 7970 GHz, existe um aumento em relação à 7950 perceptível, porém foi como você mesmo disse: o consumo final depende das horas de jogatina por mês. No caso da 290 x 480, a diferença pode não ter se mostrado expressiva pelo fato de tu ter feito overclock nela, o que aumenta consideravelmente seu consumo, fazendo com que o mesmo fique próximo do que a 290 consumia. É, eu gostei dessa correção que a AMD fez, mas bem que ela poderia também ter mantido perfis dinâmicos pra GDDR5 também, ao invés de ficar nessa onda de 300-2000MHz; se ao menos ela deixasse a gente mexer o clock da memória pra cada P State, mas nem isso ela deixa <emoji> :bua: </emoji> E tipo, aumentar de 150 pra 300 MHz o clock da GPU em relação à minha 270X? Pra que tudo isso se o chip já processa bem 2D com 150MHz? <emoji> :chan: </emoji> Falouws <emoji> :cool: </emoji>"
7,/members/l.2408574/,"Se essa oscilação é no MGSV a resposta é muito simples, pelo fato do jogo ser travado a 60fps a 480 entra em pequenos períodos de idle rodando o game, simplesmente porque não precisa usar todo o desempenho para manter 60fps e o jogo não deixa ir além disso. Vai acontecer em qualquer game que ela aguente mais de 60fps e esteja travado em 60, isso inclusive ajuda a economizar energia <emoji> :coolface: </emoji> , como meu monitor é 144Hz isso aqui só acontece no MGSV mesmo <emoji> :mr: </emoji> .","Ninguém tinha relatado coil whine nas GTR, então achei que não fosse acontecer comigo. Ledo engano... Eu até perguntei antes aqui, no dia que teve 3 caras que receberam RX no tópico: AS PLACAS ESTÃO GERANDO COIL WHINE?? Mas, infelizmente, ninguém respondeu... <emoji> :bua: </emoji> De qualquer forma, para evitar o estresse de ter que devolver e tal, até porque provavelmente a Pichau não aceitaria a placa de volta só por causa disso, vou deixar como tá mesmo e ir levando até onde der <emoji> :feelbad: </emoji> Tá ficando cego (ou velho) que nem o <url> forum.adrenaline.com.br @rexBauru </url> ? <emoji> :haha: </emoji> <emoji> :haha3: </emoji> Eu disse que testei o jogo no MGSV, porém não olhei o gráfico dele porque vi que rodou liso feito bunda de bebê, ao contrário do RoTR. Esse sim eu observei o gráfico e colei o mesmo no meu post anterior, e ele apresentou estas oscilações que não eram para ocorrer ao meu ver, já que não travei o Vsync. Eu já suspeitava disso, tendo em vista que o controle do One S é compatível com o Xone original, que não tem Bluetooth. Só resta saber agora quem é que usa a saída P2 do controle pro fone, se é o Bluetooth ou se o receiver WiFi também dá conta de transmitir áudio por ali... Eu ainda acho que comigo será maior, depois que eu fechar todo o case. É por conta disso que meu foco é fazer undervolting agressivo, pra deixar o consumo e as temperaturas em níveis que considero aceitáveis. Só pra zoar, rodei o bench do RoTR com o Power Limit setado em 50% (depois que vi, no Wattman você precisa ativar o controle de temperatura se quiser mexer no PL): <image> A GPU deu um pico pra 1266, mas durante o teste, acho que nem ultrapassou os 800 MHz. O consumo ficou tão baixo que eu achei que estava usando minha 750 TI <emoji> :bwahaha: </emoji> Claro, no final das contas, ainda precisamos levar em consideração o consumo das memórias, do AUX e do cooler, mas mesmo diante desse ""péssimo cenário"", olha o resultado que tive na performance: <image> E o resultado que tive com a 750 TI, sob as mesmas condições (qualidade máxima, SMAA): <image> Fazendo mais que o dobro de performance média, consumindo um pouco acima dos 75W <emoji> :lol2: </emoji> Antes que me esqueça, segue abaixo as imagens tiradas do GPU-Z, incluindo o ASIC da minha Polaris 10: <image> <image> <image> Queria acima dos 80%, mas infelizmente não se pode ter tudo né? <emoji> :feelbad: </emoji> PS: <url> forum.adrenaline.com.br @rexBauru </url> , tentei por 1400 MHz aqui, mas não rolou... Assim que começo a rodar o bench do RoTR, o jogo trava e eu preciso reiniciar o PC. Nem mesmo colocar o PL em 50% surtiu efeito; pelo visto terei que aumentar o vcore pra poder compensar <emoji> :feelbad: </emoji> Falouws <emoji> :cool: </emoji>"
8,/members/_eagleman_.150712/,"Não é bem R$ 900, mas de qualquer modo é uma placa que nasceu morta por causa disso (ao menos na Mamute, que não é nenhum sinônimo de preço baixo, mas pelo menos tem um atendimento decente no pós-vendas). Segundo a última atualização que recebi, sim: Última(s) atualização(ões): 09/11/2016 09:29 - CEE NATAL - Natal/RN - Objeto saiu para entrega ao destinatário Pelo visto passar no postinho pra tomar remédio e vacina surtiu algum efeito positivo na rapidez da entrega (apesar que eu achava que ainda poderia ter chegado antes, mas isso já deve ser influência de fim de ano) <emoji> :D </emoji> Tem gente que ainda está pra receber essa semana, segundo relatos do tópico do For Sale. Portanto, você não deve ser a última, pelo menos não ainda. De qualquer modo, lembre da sua faculdade e das provas, você precisa se concentrar nelas que é o mais importante agora <emoji> :true: </emoji> A diferença no TDP nem sempre se traduz em consumo elétrico, no caso, achar que a 470 vai consumir um pouco mais que a 260X, pois não irá: <spoiler> Spoiler: Consumo elétrico R7 260X <image> <image> <image> </spoiler> Lembrando que essa HIS roda com os mesmos clocks do modelo de referência, portanto deveria apresentar mesmo consumo. Agora, no caso da 470: <spoiler> Spoiler: Consumo elétrico RX 470 <image> <image> <image> </spoiler> Mesmo no consumo típico ingame, o consumo aumentou quase 40W, comparando os modelos com clocks de referência, o que já pode ser considerado razoável (e completamente justificável, tendo em vista as diferenças significativas existentes entre os chips e na forma como ele trabalha no que diz respeito à gestão elétrica). Porém, são quase 40W a mais pra entregar um ônibus espacial de performance adicional, então tá valendo <emoji> :joia: </emoji> O TDP nesse caso serve mais pra traduzir que o chip tão pequeno quanto aquele Bonaire é capaz de dissipar quase a mesma quantidade de calor que o Polaris 10 e que, portanto, precisa de um cooler razoável pra deixar a temperatura num nível decente. Olha a diferença entre o modelo de referência e o da HIS, que é dual fan: <image> <image> Isso apenas mostra que qualquer chip pode esquentar muito, basta usar um cooler porcaria <emoji> :true: </emoji> O problema é que existe algo que está impedindo a placa de trabalhar com seu boost padrão e esse alguém pode ser a fonte (que, até o momento, foi capaz de segurar outras configurações, inclusive com a 480, então talvez seja defeito nela), pode ser a VGA (que pode ter vindo zoada de fábrica, ao ponto de não aguentar os clocks padrão, vai saber...), ou pode ser as opções de energia na placa-mãe contra proteção de surtos elétricos. Eu não tenho como precisar, pois eu uso uma plataforma de quase 7 anos de vida, então estou bem desatualizado das novidades inseridas nas plataformas atuais <emoji> :feelbad: </emoji> <mediaembed> youtube </mediaembed> Não são mesmo: basta ver que a Kabum recentemente subiu os preços dos seus produtos para nos preparar para sua Black FRAUDE... <emoji> :kidding: </emoji> <emoji> :facepalm: </emoji> Falouws <emoji> :cool: </emoji>","Então, estou respirando na faculdade já e desejo do fundo do coração que ela chegue até sexta, porque amanhã fico oficialmente de férias. Agora eu queria que minha placa fosse para Saúde também, porque veio direto para cá em Salvador e nada de chegar, enquanto a sua foi para São Paulo e Recife e já chegou. De Porto Alegre e ainda não chegou? É, Trump eleito pode significar aumento do dólar rapinho, mas acho que dá para esperar até o dia 11. Agora para quem ainda não comprou a placa, fica a dica de se puder comprar logo, porque vai que aumente."
9,/members/wellyngtonbb.2315752/,"Boa noite galera, adiquiri um kit phenom x4 960t, 2x4GB ddr3 1600Mhz. Destravei os 2 núcleos dele pela bios, mas, depois que reiniciei, ela trava na bios e não sai de lah, ou fica carregando em um nome "" Loading Operating System"" ... Alguém já passou por isso ao destravar o Phenom x4 960t? Obrigado a todos por lerem.",Possibilidades: 1 - Algum núcleo destravado ( ou os dois ) está com defeito e não é utilizável. 2 - Você aumentou o vcore do processador ? o 960t usa por padrão 1.325v. Experimente 1.375/1.4v que é o vcore dos X6 3 - A bios permite desativar ou escolher quais núcleos estão ativos ? experimente desabilitar o core 4 ou 5 se for possível


In [25]:
def tokenize_function(examples):
    result = tokenizer(examples["text"] + examples["reply"],
                       padding="max_length", truncation=True, max_length=64)
    result["labels"] = result["input_ids"].copy()
    return result

In [26]:
tokenized_datasets = datasets.map(
    tokenize_function,
    num_proc=8,
    batched=True,
    batch_size=128,
    remove_columns=["id", "text", "reply"])

# Train transformerslib

In [27]:
training_args = TrainingArguments(
    "test-clm",
    evaluation_strategy="epoch",
    learning_rate=2e-5,
    weight_decay=0.01,
    warmup_steps=2000,
    num_train_epochs=20,
    save_strategy="epoch"
)

PyTorch: setting up devices
The default value for the training argument `--report_to` will change in v5 (from all installed integrations to none). In v5, you will need to use `--report_to all` to get the same behavior as now. You should start updating your code and make this info disappear :-).


In [28]:
trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=tokenized_datasets["train"].shuffle(seed=42).select(range(50000)),
    eval_dataset=tokenized_datasets["validation"].shuffle(seed=42).select(range(1000)),
)

In [29]:
trainer.train()

***** Running training *****
  Num examples = 50000
  Num Epochs = 20
  Instantaneous batch size per device = 8
  Total train batch size (w. parallel, distributed & accumulation) = 8
  Gradient Accumulation steps = 1
  Total optimization steps = 125000


Epoch,Training Loss,Validation Loss
1,0.7386,3.050401
2,0.694,2.933991
3,0.63,2.865727
4,0.5916,2.845868
5,0.5587,2.820881
6,0.5352,2.820131
7,0.5231,2.840756
8,0.4651,2.801399
9,0.4347,2.833448
10,0.4446,2.883101


Saving model checkpoint to test-clm/checkpoint-500
Configuration saved in test-clm/checkpoint-500/config.json
Model weights saved in test-clm/checkpoint-500/pytorch_model.bin
Saving model checkpoint to test-clm/checkpoint-1000
Configuration saved in test-clm/checkpoint-1000/config.json
Model weights saved in test-clm/checkpoint-1000/pytorch_model.bin
Saving model checkpoint to test-clm/checkpoint-1500
Configuration saved in test-clm/checkpoint-1500/config.json
Model weights saved in test-clm/checkpoint-1500/pytorch_model.bin
Saving model checkpoint to test-clm/checkpoint-2000
Configuration saved in test-clm/checkpoint-2000/config.json
Model weights saved in test-clm/checkpoint-2000/pytorch_model.bin
Saving model checkpoint to test-clm/checkpoint-2500
Configuration saved in test-clm/checkpoint-2500/config.json
Model weights saved in test-clm/checkpoint-2500/pytorch_model.bin
Saving model checkpoint to test-clm/checkpoint-3000
Configuration saved in test-clm/checkpoint-3000/config.json
M

Model weights saved in test-clm/checkpoint-22500/pytorch_model.bin
Saving model checkpoint to test-clm/checkpoint-23000
Configuration saved in test-clm/checkpoint-23000/config.json
Model weights saved in test-clm/checkpoint-23000/pytorch_model.bin
Saving model checkpoint to test-clm/checkpoint-23500
Configuration saved in test-clm/checkpoint-23500/config.json
Model weights saved in test-clm/checkpoint-23500/pytorch_model.bin
Saving model checkpoint to test-clm/checkpoint-24000
Configuration saved in test-clm/checkpoint-24000/config.json
Model weights saved in test-clm/checkpoint-24000/pytorch_model.bin
Saving model checkpoint to test-clm/checkpoint-24500
Configuration saved in test-clm/checkpoint-24500/config.json
Model weights saved in test-clm/checkpoint-24500/pytorch_model.bin
Saving model checkpoint to test-clm/checkpoint-25000
Configuration saved in test-clm/checkpoint-25000/config.json
Model weights saved in test-clm/checkpoint-25000/pytorch_model.bin
***** Running Evaluation ***

Model weights saved in test-clm/checkpoint-44500/pytorch_model.bin
Saving model checkpoint to test-clm/checkpoint-45000
Configuration saved in test-clm/checkpoint-45000/config.json
Model weights saved in test-clm/checkpoint-45000/pytorch_model.bin
Saving model checkpoint to test-clm/checkpoint-45500
Configuration saved in test-clm/checkpoint-45500/config.json
Model weights saved in test-clm/checkpoint-45500/pytorch_model.bin
Saving model checkpoint to test-clm/checkpoint-46000
Configuration saved in test-clm/checkpoint-46000/config.json
Model weights saved in test-clm/checkpoint-46000/pytorch_model.bin
Saving model checkpoint to test-clm/checkpoint-46500
Configuration saved in test-clm/checkpoint-46500/config.json
Model weights saved in test-clm/checkpoint-46500/pytorch_model.bin
Saving model checkpoint to test-clm/checkpoint-47000
Configuration saved in test-clm/checkpoint-47000/config.json
Model weights saved in test-clm/checkpoint-47000/pytorch_model.bin
Saving model checkpoint to t

Saving model checkpoint to test-clm/checkpoint-67000
Configuration saved in test-clm/checkpoint-67000/config.json
Model weights saved in test-clm/checkpoint-67000/pytorch_model.bin
Saving model checkpoint to test-clm/checkpoint-67500
Configuration saved in test-clm/checkpoint-67500/config.json
Model weights saved in test-clm/checkpoint-67500/pytorch_model.bin
Saving model checkpoint to test-clm/checkpoint-68000
Configuration saved in test-clm/checkpoint-68000/config.json
Model weights saved in test-clm/checkpoint-68000/pytorch_model.bin
Saving model checkpoint to test-clm/checkpoint-68500
Configuration saved in test-clm/checkpoint-68500/config.json
Model weights saved in test-clm/checkpoint-68500/pytorch_model.bin
***** Running Evaluation *****
  Num examples = 1000
  Batch size = 8
Saving model checkpoint to test-clm/checkpoint-69000
Configuration saved in test-clm/checkpoint-69000/config.json
Model weights saved in test-clm/checkpoint-69000/pytorch_model.bin
Saving model checkpoint t

KeyboardInterrupt: 

In [30]:
import math
eval_results = trainer.evaluate()
print(f"Perplexity: {math.exp(eval_results['eval_loss']):.2f}")

***** Running Evaluation *****
  Num examples = 1000
  Batch size = 8


Perplexity: 17.70


# Train pytorch

In [None]:
tokenized_datasets.set_format("torch")

In [None]:
train_dataloader = DataLoader(tokenized_datasets["train"].shuffle(seed=42).select(range(10000)), batch_size=8)
eval_dataloader = DataLoader(tokenized_datasets["validation"].shuffle(seed=42).select(range(1000)), batch_size=8)

In [None]:
from transformers import AdamW

optimizer = AdamW(model.parameters(), lr=5e-5)

In [None]:
from transformers import get_linear_schedule_with_warmup

num_epochs = 3
num_training_steps = num_epochs * len(train_dataloader)
lr_scheduler = get_linear_schedule_with_warmup(
    optimizer=optimizer,
    num_warmup_steps=2000,
    num_training_steps=num_training_steps
)

In [None]:
device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
model.to(device);

In [None]:
progress_bar = tqdm.notebook.tqdm(range(num_training_steps))

model.train()
for epoch in range(num_epochs):
    for batch in train_dataloader:
        batch = {k: v.to(device) for k, v in batch.items()}
        outputs = model(**batch)
        loss = outputs.loss
        loss.backward()

        optimizer.step()
        lr_scheduler.step()
        optimizer.zero_grad()
        progress_bar.update(1)

In [None]:
metric = load_metric("accuracy")

model.eval()

for batch in eval_dataloader:
    batch = {k: v.to(device) for k, v in batch.items()}
    with torch.no_grad():
        outputs = model(**batch)
    logits = outputs.logits
    pred = torch.argmax(logits, dim=-1)
    print(tokenizer.decode(pred[0].tolist()))
    print(tokenizer.decode(batch["labels"][0]))
    metric.compute(predictions=pred, references=batch["labels"])

metric.compute()