In [1]:
import nltk
nltk.download('rslp')
nltk.download('stopwords')
import re
import codecs
import unicodedata
from unicodedata import normalize

[nltk_data] Downloading package rslp to C:\Users\Uciolli
[nltk_data]     Betelli\AppData\Roaming\nltk_data...
[nltk_data]   Package rslp is already up-to-date!
[nltk_data] Downloading package stopwords to C:\Users\Uciolli
[nltk_data]     Betelli\AppData\Roaming\nltk_data...
[nltk_data]   Package stopwords is already up-to-date!


In [2]:
class NLP_Kit(object):
	#construtor da classe
	def __init__(self, stopwordsFile = None):
		'''Caso voce queira passar um arquivo de stopwords proprio,
		utilize-o durante a construcao do objeto NLP_kit com seu caminho
		absoluto'''
		self.stemmer = nltk.stem.RSLPStemmer()
		self.sent_tokenizer = None
		self.stopwords = None
		self.stopwordsFile = stopwordsFile

	def normaliza(self, texto):
		'''Retira acentos do texto e o retorna
		'''
		try:
			return unicodedata.normalize('NFKD', texto).encode('ASCII', 'ignore')
		except:
			return unicodedata.normalize('NFKD', texto.decode('UTF-8')).encode('ASCII', 'ignore')
		raise Exception('Erro no formato da string. Utilize unicode utf-8')

	def separa_frases(texto):
		'''
		Recebe um texto. Retorna lista com as frases contidas no texto que possuem mais
		de 1 caracter
		'''
		#adiciona espacos entre pontuacoes, para facilitar o trabalho do sent_tokenizer.
		texto = re.sub('([.,!?()])', r' \1 ', texto)
		texto = re.sub('\s{2,}', ' ', texto)

		if self.sent_tokenizer is None:
			self.sent_tokenizer = nltk.data.load('tokenizers/punkt/portuguese.pickle')
		sentencas =  self.sent_tokenizer.tokenize(texto)
		sentencas = [sentenca for sentenca in sentencas if len(sentenca) > 1]
		return sentencas

	def tokenize(self, frase):
		'''Recebe uma frase. Retorna lista de tokens (palavras) da frase
		que sao separadas por espaco ou virgula, travessao etc
		Retorna em Unicode e minusculo
		'''
		frase = frase.lower()
		if not isinstance(frase, str):
			frase = frase.decode('utf-8')
		return re.findall(r'\w+', frase,flags = re.UNICODE)

	def stemiza(palavra):
		'''Recebe uma palavra. Retorna seu stem
		'''
		return nltk.stemmer.stem(palavra)

	def remove_stop_words(self, texto):
		'''Retorna lista de palavras sem stopwords 
		'''
		if self.stopwords is None:
			if self.stopwordsFile is not None:
				stopwords = [word for word in codecs.open(stopwordsFile, 'r', 'utf-8')]
			else:
				stopwords = nltk.corpus.stopwords.words('portuguese')

			stopwords = [str( self.normaliza(item), "utf-8" ) for item in stopwords]

			palavras = self.tokenize(texto)
			
			#print type(stopwords[1])
			palavras_importantes = [palavra for palavra in palavras if palavra.lower() not in stopwords]
		return palavras_importantes

	def palavras_mais_frequentes(self, texto):
		'''retorna lista de tuplas <palavra, frequencia>
		'''
		palavras = self.remove_stop_words(texto)

		fd = nltk.FreqDist(palavras)
		frequencias = []
		for palavra in fd:
			frequencias.append( (palavra, fd[palavra]) )
		return frequencias

	def palavras_mais_frequentes2(self, texto): #com stopwords
		'''retorna lista de tuplas <palavra, frequencia>
		'''
		palavras = texto.split()

		fd = nltk.FreqDist(palavras)
		frequencias = []
		for palavra in fd:
			frequencias.append( (palavra, fd[palavra]) )
		return frequencias

	def remove_palavra_stop_words(self, texto):#retorna frase
		'''Retorna palavras sem stopwords 
		'''
		if self.stopwords is None:
			if self.stopwordsFile is not None:
				stopwords = [word for word in codecs.open(stopwordsFile, 'r', 'utf-8')]
			else:
				stopwords = nltk.corpus.stopwords.words('portuguese')

			stopwords = [str( self.normaliza(item), "utf-8" ) for item in stopwords]
			#print(stopwords)    #mostra quais sao os stopwords retirados
			palavras = texto.split(' ')

			frase_sem_sw= ''
			
			for palavra in palavras:
				if palavra not in stopwords:
					frase_sem_sw += palavra+' '
		return frase_sem_sw

	def remove_pontuacao(self, texto):#retorna frase
		string_normalizada = re.sub(':|;|\[|\]|\(|\)|,|\.|!|\?|\{|\}|\*|\"|-', ' ', texto.replace('\n',' '))	#retira pontuacao
		string_normalizada = string_normalizada.replace('//',' ')
		string_normalizada = string_normalizada.replace('\'','')
		return string_normalizada

In [3]:
texto = "Teste De verificação :) de um Tweet teste!"
frases = NLP_Kit()
#string_normalizada = frases.remove_pontuacao(texto)
#print(string_normalizada)
#string_normalizada = frases.normaliza(string_normalizada)   #retira acentos
#string_normalizada = str( string_normalizada, "utf-8" )
#print(string_normalizada)
#string_normalizada = frases.remove_palavra_stop_words(string_normalizada.lower())
#print(string_normalizada)
#string_normalizada = re.sub(' +', ' ', string_normalizada) #remove espacos em branco multiplos
#print(string_normalizada)
#string_normalizada = ((unicodedata.normalize('NFKD', string_normalizada)).encode('ASCII', 'ignore').lower())
#print(string_normalizada)
#string_normalizada = frases.palavras_mais_frequentes(string_normalizada)
#print(string_normalizada)

In [4]:
import csv
with open('tweets_ofensivos_sem_repeticao.csv', encoding="utf8") as f:
    reader = csv.reader(f)
    lista = list(reader)

In [5]:
lista_processada = []
for row in lista:
    texto_processando = frases.remove_pontuacao(row[0])
    texto_processando = frases.normaliza(texto_processando)
    texto_processando = str( texto_processando, "utf-8" )
    texto_processando = frases.remove_palavra_stop_words(texto_processando.lower())
    texto_processando = re.sub(' +', ' ', texto_processando)
    lista_processada.append(texto_processando)
    print(texto_processando)

text 
rt @mariama59879065 tvi ficava melhor prolongado rs durante 1 mes porque publico agarrado concorr... 
= mang trong minh dong mau lac hong phai cu goi la quen thuoc voi kieu nay https t co/ostdcs3pvw 
tomamo cu 
n entendo oq passa cabeca dessas pessoas namoral pq alem d levar hate pra leva tb pro proprio fav vao tomar cu chatice 
vai tomar cu professor filho puta 
rt @thulinh_2k2 nua ang ngu ma bi thang trai ut cu vao lon khi k hay https t co/vjiihbwbab 
caralho aleluia vai tomar cu everton 
rt @nhinhi7777 nhoc trai thang hoc spkt tim zalo qanh ay thay ga cho gay bu thu ngai k dam ga 2 3 ngay cuoi cung cung qa con cu... 
mucalol rico aq dando dinheiro pra filho puta burro chat vai tomar cu mucalol 
rt @wtfjunkook comprei armario pra guardar coisas album entra pouco vai tomar cu https t co/41ikwbhi9z 
tiraram dia pra irritar vai tomar cu 
aja cu pra tomar parcero 
 vai tomar cu faz motivos pra estar fodida ideias hj dia https t co/uj3mfkh1ke 
@comidasestadios @santosfc @brunoovazz 

fico doida maluca doidinha https t co/itfzkvgj9c 
@favortgiri @natielevadia negocio su1cidio mt doido 
@padree7bot doido acho q curte tobo gigante batendo 
gente quw role doido 
@centralreality comeco bbb amava scooby ver antijogo deu pouco raiva amar scooby ta doido queria ser assim 
mano ontem tava cheio ta doido 
@thiagokrause2 amigo doido florida ta mirando disney revogou decretos q davam poderes empresa sobre areas onde funcionam pq posicionou pressionada contra lei palanque vai custar caro tax payers parecem preocupados menos n 
pqp acredito vi gente acusando plagio causa data lancamento kkkkkkkkkk juro cara rindo desse povo doido mds 
ainda barracao doido pra chegar casa 
@cabralxsp doido 
@viviane61560441 @lmpicon obvio pra atacar pessoa q fez absolutamente nada contra fav pra mim nenhum sentido atacou pessoas ligadas mae filho vai pagar pato vc colocando carater pa cheque justificativa defesa triste 
todo dia lembro paguei 120 reais nessa blusa feia flanela pq mae disse bonita

simplesmente bebo porem sensacao acordar tarde ressaca escrota fudida 
@corinthiana ai fica gente idiota esperando alguem dar cara pra falar nome grupo pode causa campanha escrota dessas 
@analubex gente escrota perdem nocao pq anonimo pergunta q respondo maioria respondo deboche tbm pq gnt q merece saber oq passa vida gnt sinto mto perguntas q fizeram pra vc 
saudadezinhaaa escrota 
@xrayvelten @babadofamososrj vtnc fake escrota crlho 
@therealganjagrl fuzil kkkkk escrota demais 
querendo n querendo q escrota cm causa porra inseguranca 
odio gigante macho escroto nojento 
rt @haroldonalata confesso fiquei constrangida coragem assistir video homem escroto pai 
@03302000l caras escroto pior ainda anda pai crianca kkkkkkk 
@beaaacomentah ahhh va... pessoa sofro depressao sei doenca justifica falta carater nenhuma hipotese parem passar pano pra macho escroto amor 
snrz ta escroto bglh pcr https t co/gvl43a218p 
@leandro_dtm @cronicasccp bando escroto intolerantes cagam boca pregam vivemo 

@suarezstela @eltiempo existe una seccion en los medios informativos llama internacional incluso justicia mujer tenga un poco empatia vieja estupida 
rt @jesus_pinero @darvinsonrojas esto parece poco etico sometes estos chamos al escarnio publico porque evidentemente tienen argu... 
rt @liligcancun los medios y los poderes detras los conservadores buscaron demeritar toda accion enfocada sanar y remendar el tejid... 
acho vai provar desse hate trian sabe jogar cai jogo apelativa faca diss alto nivel fas querem parece quer ver nicki lama quinto album fracasso geral esperando nm5 https t co/kg7qdmm3a4 
pessoa saiu cmg vez ta chamando namorado falando amo cai q emocao toda hein 
@saudeprefsp teste pra maluco pessoa quiser saber disso ai cai 
@sigagazetabr cai ex mamateiro 
@abrahamweint quer ser politico aguenta tranco cai 
@4mydopix entra fia cai tira sujeira cara 
@feh__amaro brasil produz pior cafe todos tomarmos quantidade rato fragmentos insetos exportar qualidade chega ser monstruosa

nojento https t co/vfa4c7yyxx https t co/4djtrw8gy0 
@o_fisicoteorico @pachexeca nojento mostra desejo disso ta mim nojento 
goool porraaaaaaaa vtnc everton time nojento 
sobre tirar foto nojento mendigo falou ata #bbb22 https t co/xokaft8igq 
enfia convite rabo nojento crlho https t co/kpoxpnwfip 
rt @somosaopaulinos rogerio ceni falou sobre expulsao quarto arbitro fez put sacanagem sabe vai acontecer ... 
trabalhar durante 3 dias semana vai ser doido 
impossivel ser ano 2023 certo to bem curioso pra saber itinerario sedenta pra trabalhar otr ii + gemeos + blue crescida vai querer ser flexivel https t co/4iqopxflnm 
q odio dessa loira oxigenada caralho vai trabalhar p comprar coisa pagar outrossssss 
@drpaulofaria22 desespero vai trabalhar produzir algo grandes marcas interessam dar patrocinio abandone profissao 
@jornaleira_ @lvbcxx gente vai ter trabalhar 
bebek vai voltar trabalhar to feliz triste porque consegui desapegar ozan ainda precisa trabalhar pra sustentar atlas ada leite 

@pardalrobson @cnnbrasil movimentacao bancaria criminoso feita longe orgaos controle laranjas doleiros ouviu falar 
@sandrikaoliver @rioparina denunciado bloqueado @twitterbrasil pode criminoso 
@umhenriqueqlqr boa manda bem deixa ver tf criminoso 
rt @miguel_100001 arthur machado preso ser suposto lider esquema criminoso lavagem dinheiro evasao divis... 
caras to rachando bico ta pensando tamo concordando verdade lascar 
@tiuxand3 @dkii07 mentira vei vai lascar 
estudar lascar pra sabe algum dia ser alguma coisa kkkkk 
rt @aleksilva cena enganou batalha crepusculo achei iam lascar beijao hora ia ajo... 
amanha vou lascar todo 
@arthurweint bota pra lascar arthur retorno aguentam 
rt @chavstns bounce on my #cock bra full vids on https t co/hna7khelv1 #chav #scally #scallylad #kiffeur #pornaddict #sneakersex #ge... 
rt @chavstns take it deep bra full vids on https t co/hna7khelv1 #gooner #cronicbator #goontard #goontwitter #feet #chav #scally #... 
vai tarde pinguco https t co/ffcd1irkm

faltam 8 meses 8 dias 5 horas 23 minutos fim governo pustula https t co/d7pquoamqe 
 danxuenilan krim pink ada 5 item dalam set nie selesaikan masalah kulit pustula kulit jerawat jerawat litium kulit gelap gunakan banyak jenis krim tidak bertambah baik pori besar kulit kasar warna kulit kusam dan tidak https t co/vnywoqxa8u 
rt @sugarfetheels pustula borde leyen presenta oficialmente el n@z| certificado digital k0|d sin el ya podras viajar dentro europ... 
@fredcosentino deus ceu rolou marketing pt tiro pe 
rt @rapmais megan thee stallion conta detalhes incidente tory lanez onde baleada pe realmente medo nunca ti... 
@katekcete kkkkkkk pra vc samba pe pra mim paola arrasou olha beija flor coracao tiro chapeu paola 
resumindo disse bem aqui coloquei mane cancelado la pra ve causava confusao agora favorito tiro pe https t co/etyvqcjnjd 
megan thee stallion conta detalhes incidente tory lanez onde baleada pe realmente medo nunca levado tiro antes https t co/mplhnk9pw2 https t co/mmten0xxj

rt @happybdayjully falsiane anonimo 
@osintbrazil ucrania propaganda falsa impressao estar vendendo guerra importante q batalha si jeito burro fazer moral subir tal ato dar impressao ocidente q visao ucraniana guerra verdadeira 
@lucasedy7 pra dar moral 
@nayracami_mald @jlia_braun vou estar tribunal p dar apoio moral 
rt @carlosparrabuc fico gutierrez reunido con alirio villamizar la cabeza condenada del clan villamizar con autoridad moral fi... 
las fans giselle racist intentando dar clases moral xddd #aespaflop #aespadisband #aespansfw #giselleracist #gisellenword #karinaproblematic 
rt @chiqui_avalos grabacion fidel dijo el le pone la casa vehiculo y le pasa la plata mensualmente pero escribania con acuerd... 
rt @casaalml quase 30k ajudem dando moral rt porfavoooor 
rt @malpasoycia la espana abandonamos @queabandonamos sigue recorriendo lugares y dando voz los pueblos proxima presentacion en c... 
muita sindrome exclusividade vejo dando moral pra varias caio hora 
@adrinastmd @kps

@jfbgt tiens pioche https t co/yemwi737zb 
@johansk14 rachetes ubi avec des licences usees jusqua la moelle les problemes internes je ne sais pas si ca serait la bonne pioche 
@faellcorreia22 kkkkk poxa cara vc foda sabe qnt adoro vc carinho enorme cmg muda nada ontem aniversario vc presente vida todos dias adoro amigo 
rt @eutrouxaofc usuario sabe lidar pessoas ficam estranhas nada 
rt @psicopatona usuaria sabe lidar pessoas ficam estranhas nada 
prima discutindo sobre tom homem aranha grt sabe nada 
general sabe nada estatistica pqp brasil https t co/dftthgemjd 
rt @biabionica abstencao alturas novamente franca povo sempre sabe qualquer lugar mundo eleicao nada a... 
desanimou tal forma sei explicar deus sabe todas coisas nada acontece permissao 
@mariama59879065 @scathingcommen1 porque contacto exterior familia sabe nada mensagem ontem irma marco passou informacoes irma bruna disse portugal proposta deve ter existido pensativa ontem noite aproximou bernardo 
@andreporci opa mulecada

mulheres risonhas dica eh namorem sagitariano vcs vao ficar cinco minuto palhacada pra vcs dar risadinhas 
@liacavalona palhacada 
toda hora q abro reels receita camarao grande palhacada 
@luiza1244507 aproveita q pode sair mulher pq posso ai choro raiva pq vc fica palhacada 
ninguem fala linda delicia gostosa dms tals tudo palhacada agr https t co/n4azvveynw 
@leonardoarajom8 fez bem quero ir pro direito porque palhacada la menos ainda existe certo rigor algumas areas problemas pesquisa tecnicos 
palhaco crlh 
qndo chega domingo lembro tanto tio ctz vim aq jeito todo palhaco 
desde 7 manha corno vizinho fazendo obra palhaco 
vou agr lutar palhaca sweetheart omori pq sujeitas coisas 
pessoa acha palhaca pode 
devo ter cara palhaca pode 
rt @bluendzain partir hoje acredito harry fotos rosto amostra achando palhac... 
virei palhaca agora 
@chanpirocao posso saber oq vc quis dizer cm gif palhaca 
@andreporci boneca ventriloquo fala sozinha ainda precisa ajuda assessores 
@tabataamaralsp b

apos 354 pessoas falarem barriguda ontem amanha inicia projeto cia espero amigos colaborem 
@ikaique_ protagonista insuportavel amg bem barriguda 
joao lucas acaba olhar pra mim falar tia ta barriguda 
@allanypaula to barriguda barriguda 
@malualvesspfc japa surra mt 
rt @magamarcela1 espancaram ontem roma neta poeta russo joseph brodsky ganhador nobel literatura 1987 durante surra ... 
gente entendi deus isadora querendo surra https t co/mw5q2hsq61 
@franlorranaa surra carao 
@davi_kis surra maria shein 
groundbass ok menumas ok set novo vegas ok aurea vortex meio dark okzaco neelix ok cid ok biscist ok wade ok illusionize ok victor lou ok festa bem mista surra todo momento 
@seered_br @kto_brasil hoje dia devolver surra 
gabriela merece surra 
rt @fidelcanoco duque y sus ministros diariamente y todos los medios comunicacion intervienen descarada y peligrosamente en polit... 
rt @nt24co #atentos | manera descarada y sin ningun tipo justificacion el ministerio hacienda aprobo medio bil

sim vadia viciado guri chapeu palha quer ser rei piratas 
rt @eexibir prazer ver esposinha timida vadia ser fudida frente https t co/lik9rijd1q 
@yassmiimmm @rebecatito15 falsa porra some vadia 
@fogliato_ terapeuta vadia soq to ferias 
rt @atvmcz boa vei acho fetiche pq fico vadio comer carinha shortinho assim afastar meter pica se... 
jejum cao vadio tarde carninha po https t co/yi4ue5pylu 
vadio ia ser normal igual todo mundo 
rt @sabinanogueira1 pessoa par1t4ido nanico 1 senador 1 deputado 3 anos 8 msses entrou 107 recursos stf ... 
ainda bem deixo time fuder emocional ser aposta animo corinthians acabou faz tempo estressar time ai vadio burrice 
@redfolk calado vadio 
@hazelfolz vadio 
@tocomleonardo @folha ser vadio vereador 
@terrabrasilnot vadio 
@silvionavarro stf quer fazer graca chapeu alheio dinheiro povo entao quer devolver devolva dinheiro pois tn ira devolver pertence 
bandidos querem @stf_oficial devolva dinheiro roubaram lava jato recuperou sonho dia gilmar lewan cia e

@pierluigipugli1 grazie pier pero non credo che andro conoscerla 
arrumei toda garouta usar roupas femininas deixa desconfortavel credo 
@patricktuita @ssarahandrade arthur ti conhece doente ta recebendo quanto pra passar vergonha 
@pijuta_pijusta @crisayonara q mensagem doente reflete conselho 
feijoada ficou delicia deus abencoe pra fechar ainda joguei farofinha cima pra mim to doente retomei fome 
sinto otima pq mto bom ter chuva ta casa ne pego chuva todo dia causa dessa porra to doente agr https t co/nlhfk7fmse 
to doente dnovokkkkkkkkkkkkk tomanocu 
odeio ficar doente boy 
@tedlvsso amiga menor condicao ta acontecendo nessa proporcao to ficando doente historia 
rt @zimermanricardo hoje shopping porto alegre cerca 20% pessoas mascaras absurdo irresponsabilidade sanitar... 
@winixcrf @fluxogg deixa ser doente mlk primeiro salva contato direito vsfd 
secou boquinha neh https t co/hrrish8ipf 
@heldersalomao secou boquinha https t co/dhuoxbxsup 
@guilherme_amado boquinha secou coitado

@summeroberts_ fala besteira 
rt @todalindaeuu talvez besteira emocionar to @gabimartins sendo exemplo pra muitos desistem conta... 
@f_besteira mano https t co/7lhbgsahun 
assistir vingadores comendo besteira pai mto bomm 
rt @npto obvio heleno sabe falando besteira objetivo pressionar xp divulgue pesquisas desfavorave... 
@davelikesarave @xo_coco_ox thanks bigsexydavethepredator@myspace 
@vampoguri its complicated ummm basically theres this girl named coco who wants to be witch until she accidentally hurts her mom w magic she goes and becomes student under this dude named qifrey and its basically abt him and oruggio parenting bunch of magic kids 
@iykimo @vechelly @stephie_coco @annadaop actually we all on @stephie_coco tl 
rt @myllapfs galera mto ruim provem vale pena gosto nescau aguado outro sabao coco ngm aguentou 1 garfo... 
dios mio necesito tanto un arroz coco con mojarra patacon y ensalada 
@genesis_senshi @gharliera1 i have made moving picture now which has taken long time i

@ferraridepre sim pior acordei triste hj seguimos 7 pontos prejuizo indigesto ok to p vida dr odio tirou sainz poderiamos ter pontos nesse combo desgraca hj 
rt @tntsportsbr achou viria vitoria facil galo achou errado coxa visitante indigesto independencia ta galo at... 
@jlespert indigesto 
cego inferno fogo queima perdido abismo encontrei escoria mim vomito restos tumor indigesto meio acido pulsa dejetos nessa pilha trapos delirio dores entrei sonho fetido acordei amores 
@uolnoticias comecou diarreia verbal 
rt @zenda_simoes @tabataamaralsp cala boca inutil fique feliz q vc pode vomitar exterior diarreia verbal contra presidente e... 
@oiiuiz @fabioporchat parasita @fabioporchat faz parte grupo idiotas curtem vida mansa sempre jornalistas transmitir diarreia verbal soltam 
@tabataamaralsp cala boca inutil fique feliz q vc pode vomitar exterior diarreia verbal contra presidente eleito democraticamente acontece nada democracia votar contra medidas q melhore vida povo tb democracia vc 

@americafcnatal @canindepereira possivel atletas america sensibilizem clube america pode jogar serie d sair desse buraco campo esburacado condicoes jogo correndo risco atleta contundir serio jogando chiqueiro desse 
ruim vergonha falta memoria gosto tabua chiqueiro boca dor corpo mal estar resume hj 
rt @criscardozo @alessandroloio2 @victorif2022 sempre vista cara ta sozinho lutando pra limpar chiqueiro sujo quase... 
@romulomappa @agazetaes acho pq vc ficou reprovado certame amore fica pagando advogadinho ainda hahahaha advogado musico bom eleitor triste agora ta explicado porque vc comportamento online ai lastima 
 advogadinho shit 
cursar direito pular cabeca ninho cobra vestido camundongo qualquer pagina direito entra pra ver alguma noticia inteirar sobre assunto ta cheio advogadinho furreco falando bosta 
@roxmo advogadinho cezare batisti piada 
@mrciaga90848144 deram muita moral alguem limitado todos sentidos...vergonha alheia desse advogadinho 
@kenmiies pq fachin andava jatinho

@wtf_facciola gordinho merda valentao net ameacei cara errado comedia crl vc acha consegue informacoes outros ne bosta 
rt @silvana16371172 @mitags @sheilaalvaren11 barroso bosta 
vc merda pendura camisa bosta 
brinca ai fns bosta 
@thaispsic vai embora logo bosta 
@danieldpa93 @vitaocrf81 @futebol_info sim empurrao lance falta kkkkkkk cala boca merda 
@fns rola pra vc merda 
vai fuder vai merda enfia jorrao cu logo vai embora 
@goivbada ta meio merda ta indo 
tentando manter merda relacao saudavel filha puta faz fode otario 
rt @requiaooficial assisti video daniel silveira falando supremo muita merda recebeu graca merda presidente ass... 
@foxttsumu vou enfiar merda garganta engolir filho puta vem ca 
@jantnio4 @nacaomarvei ia responder globo edita causa geracao mimizenta kkk 
@ocriticador2022 @matinvest1 epoca ninguem sequer pensava nisso pretos daria nada comentario respeito apenas reflete cabeca mimizenta tempos atuais 
@_fabianoestrela geracao mimizenta irritante demais 
@arcebisp

@psantoscunha @tbtiagobeiro1 @ruiferreiradas7 pretensa equivalencia zelesnky putin absolutamente desonesta 
@miriamleitao emergencia democratica mandar prender vc crimes praticados passado vc alem desonesta ser sujo abominavel 
@philliphonorato duas deficit cognitivo enxergar obvias evidencias desonesta intelectualmente negar q conhece 
@newmarconibran1 @ecantanhede adianta corja desonesta 
@senadorhumberto sim @senadorhumberto conhecemos estoria tao desonesta infantil alguma honestidade passar perto explica porque investigaste consorcio nordeste nenhum estado municipio 
@zeh_lemos @ladyrasta caro julguei ninguem fio completo ai disponho conversar desde respeitosamente pessoa acha pode argumentar chamando outra desonesta entao resta block 
rt @rosmello_news to dizendo sairam casa venceram arthur perdedor vai ganhar dinheiro aind... 
to dizendo sairam casa venceram arthur perdedor vai ganhar dinheiro ainda forma desonesta monte robos comprados vergonhoso #bbb22 https t co/b8tdod4r8k 
@h

@infobaeamerica cinico personaje cuando ellos estan escudandose con los civiles tira fascistas neobazis yankees 
yo le diria #bukele admiro su habilidad en manipular la opinion le preguntaria si lo piensa detenidamente es un genio hacerlo ademas le diria impresiona lo hace porque es cinico inescrupuloso y despotico y prefiere jugar al azar #elsalvador #politicasv https t co/wtcwpbovt3 
@tiaggo_pires cinico hahahahahahahahah 
to triste pra crl pprt deus livre mudar frente outros ser cinica toxica ficar desmentindo outros nada pprt mascara vai cair 
@panaclo hace mucho veia con tanta intensidad el sindrome neron en la cinica clase gobernante el pais sumido en la tragedia y golpeado la carestia y ellos bailando y canturreando 
rt @cacgchacard67 @gustavobolivar pero clase pregunta cinica es movimientos politicos llevan decadas denigrando la... 
preguica gente cinica 
@rafakalimann_ vixi amiga @brunamarquezine faz todo mundo pensa diferente canceladora mor importa familia filhos concorda me

rt @zeroorm zidane libro bruno kepa y van beek yo creo aun le lo suficiente las gracias ese calvo endemoniado acierta... 
endemoniado https t co/awsbutwmhp 
gente ainda fez almoco baiao feijao verde cuxa costelinha porco salada afff mereco tanto 
@keqingzitas pode ser porco vai tomar banho 
@guidomarchello quel porco laziale 
dai ma vaffanculo ridotto speciale fino ai 24 anni ma zio porco di potra che ne ho 25 https t co/qbny0nhkps 
@etvernvlglw @ateezofficial porco dioowowowowoow 
alguns g entram dms saber diferenca ser easygoing ser porco nojento and it really shows 
porco https t co/ziituy8wyx 
rt @eleonoraesse1 porco il demonio #genoacagliari 
ed improvvisamente parte un porco dio#genoacagliari 
formato porco lower playoff cara ganharam todas series comecam jogo 0x0 
@silvana20182018 grande imbecilidade tirasse protagonista edicao desse ano 
rt @silvana20182018 @marlonleal17 torcer pro arthur aguiar prova imbecilidade 
comparar reacao conservadora 3a via imbecilidade prepotente sup

@laurojardim 23 59 carnaval festa gente desordeira respeita senhor jesus cristo 00 00 ainnn posso curtir sambodromo paz plebezinha vem encher saco deve ser tudo mst seguidor nove dedos poco incoerencia igual papitow 
 isaias 24 10 demolida cidade desordeira todas casas fechadas modo ninguem pode entrar #biblia https t co/gzjv1dlwqy 
@geovane41289970 @veja familia bem assim delinquente desqualificada desordeira desrespeitosa autoritaria acho vcs moram mundo paralelo 
@veja confronta vermes agindo dentro constituicao brasileira coisas ministros @stf_oficial agem forma desordeira inconstitucional acima constituicao democracia #stfvergonhanacional 
@magnomalta @amendoncaagu chama falta vergonha lata q tenta endossar atitude gnt desordeira fazendo bom pastor mim nunca enganaram enganam alienados q dizem cristaos q cristaos n nada vcs fadando religiao evangelica futuro bem triste 
@anne_alvez bino alertada sucesso caia garras dessa desordeira bino 
@thaispsic vai leva cumpanhero carnica junt

rt @mumiaabujamal happy birthday mumia #freemumianow #freemumia #40yearsinprison #mumiaisinnocent #freehimnow 
rt @kamaufranklin like all empires the harsh &amp violent forms of control that have been used on the wretched of the earth have migrate... 
rt @g_ricordeau mumia abu jamal fete son 68e anniversaire en prison apres plus 40 ans derriere les barreaux #freemumianow #freemumia... 
@marinasilva ai mumia ta 
rt @vezapurpura los andaluces pagaron villen psoe 2 500 en hoteles 21 000 en restaurantes 33 000 en prostibulos&amp #8230 https ... 
rt @artofne entiendo puede estar tan generalizado argumento en serio decidme 3 hombres los les haya arruinado la v... 
rt @tresmasciento el socialismo arruinado continentes devastado generaciones destruido economia y bienestar social todos los paise... 
es normal mi finde haya arruinado ir un futbol ayer literal re chinchudo ando 
oh acaban meter en el grupo whatsapp la carrera dia arruinado 
rt @centraldepp perdi tudo importa resultado deste julga

rt @tirodemeta3 facil pedir demissao rogerio ceni vai trazer atuais condicoes clube cuca vem aguirre talv... 
@paparazzorn time vindo duas otimas atuacoes ser falando asneira dessa pqp pra mim hoje ver rmp falar irritante presuncoso aposentar 
aguento arrocha brega funk torando ultimo volume casa vizinho agora trap trap coisa desocupado vagabundo mau carater trambiqueiro gente ma indole vou ligar pra policia 
@senadorhumberto ah imbecil desocupado 
bando desocupado pqp hein 
@xaviervidalb @lassoguillermo usted anda desocupado recoja firmas el ciudadano trabaja y anda en pleitos politicos 
rt @v111ni todos livros isaac apareceu lendo heartstopper lista pq desocupado https t co/dyur5ypbm9 
aaaaaaah vai toma cu povo cara kkkkkkkkkkkkkkkkkkk bando desocupado amigos familia https t co/ijcpqyxwmt 
@douglas_sena7 @bia_qrzx acha deus desocupado igual pra ficar preocupando euhem vai tratar 
@favslouisst91 amg vou olhar novo la li maioria mto desocupada kkkkkkkkkk 
 gosto vc foda filha gosta pq 

rt @fodasemeumano acho 100% pessoas relacionei 99 999% alguma forma sacana comigo interessa... 
album vivo sacana tao bom 
wooyoung deixa folego mandando beijo longe gosta fazer carinho coxa durante beijo fica observando pessoa entao puxa beijar beija tao bem treme ainda arfa durante vezes olhar sorrisinho sacana https t co/wz9navaafr 
@jnkrocksz bisha aespa surra fav meia boca ai testuda fanha muda tornozelo pacoca bp surra coisa nenhuma jisso ai q eh fa sabe cantar direito rose ai sabe gemer palco resumindo fav eh puro fracasso aespa pisa nelas 
@itsfuyuuka ah testuda 
rt @vitoriabenelli_ @brunaluana__ feia testuda 
@brunaluana__ feia testuda 
pisou testuda toda natural https t co/zztlrmjbcg 
gamora nova mo testuda 
@bassettversion vergonha oq mona fan testuda fan dessa bomba serie perfil horroroso menos mlr va lavar louca 
@laraponttes @yasabreuu @ohashi_jun_ @janejjay vai foder testuda 
@lisaboazuda @parkgifs @tracklist testuda feia icon querendo falar alguma coisa https t co/vznqx

@jspilarii vosses ofendero mossa cambada macho iscroto https t co/xqyq676c4p 
@luisferdobairro @virgini56614922 @sandraf62983385 @marciabagnara vamos eliminar gustavo pq macho iscroto insuportavel odeia artur morre inveja eli erros nunca votou artur 
@lafemmedemaki mondronga 
@anascontry mano esperando vc falar negocio mondronga 
caralho serviu demais amei look demais porem n atrevo colocar pq ia ficar mondronga https t co/wm105massi 
nada mondronga rafaela 
mondronga velha 
tomar cu dessa mondronga https t co/eqmwvzzid1 
@marmittasquad @onikelrey mondronga porc4 
cara dessa mondronga bixa amor deus pra falar assim rihanna https t co/xpcu6o0hca 
@marmittasquad n canso surrar mondronga https t co/lxhuln4zpn 
qria roubar marca deus q raiva dessa cachorra mondronga 
viciada chamar outros mondrongo 
@voirvampire moco mondrongo 
@o_antagonista claro pro mondrongo 
mondrongo 
costume usar wpp web mobile perco mao tamanho mensagem conta diferenca telas cada mondrongo mensagem conversa comigo 

@marcofeliciano salva eleitor pastor demo boca furico igual asno psicopata presidente vao tomar https t co/jtavmqpxny 
rt @ericlinsg magoa megalomania realmente conseguem ser escondidas tempo abraham weintraub apelar vitimism... 
@f4b10rms patetico patati infantil patata 
rt @delaespriellae nada le afecta todo le resbala puede mentir soltar incongruencias protagonizar un patetico show una firma en ma... 
@sf_moro paraaaaaaa ta feio vc amigo pra dizer quanto patetico 
@abrahamendieta ah espana nada coges @andreachaveztre crees mexicano... patetico 
@anacunetas55 patetico 
rt @fatosnacionais patetico gente quer dinheiro https t co/mehfdpsvuc 
rt @jok_ase milei tiene nada tan asi es editar imagen tiene robar una foto la plaza llenamos bancar... 
@x_snowice ya voy susurro al llegar su lado enfrentandose al wingull con su zubat el combate aereo duraria un poco ya aquellos pokemon es tuvieran ataques muy fuertes asi desde fuera podia ver algo patetico tengo mejorar un poco pero oye ahi + 
rt

In [6]:
dict_lista = {'text': lista_processada}

@jonastuita cada dia coisa 6 notaram 


In [7]:
lista_processada

['text ',
 'rt @mariama59879065 tvi ficava melhor prolongado rs durante 1 mes porque publico agarrado concorr... ',
 '= mang trong minh dong mau lac hong phai cu goi la quen thuoc voi kieu nay https t co/ostdcs3pvw ',
 'tomamo cu ',
 'n entendo oq passa cabeca dessas pessoas namoral pq alem d levar hate pra leva tb pro proprio fav vao tomar cu chatice ',
 'vai tomar cu professor filho puta ',
 'rt @thulinh_2k2 nua ang ngu ma bi thang trai ut cu vao lon khi k hay https t co/vjiihbwbab ',
 'caralho aleluia vai tomar cu everton ',
 'rt @nhinhi7777 nhoc trai thang hoc spkt tim zalo qanh ay thay ga cho gay bu thu ngai k dam ga 2 3 ngay cuoi cung cung qa con cu... ',
 'mucalol rico aq dando dinheiro pra filho puta burro chat vai tomar cu mucalol ',
 'rt @wtfjunkook comprei armario pra guardar coisas album entra pouco vai tomar cu https t co/41ikwbhi9z ',
 'tiraram dia pra irritar vai tomar cu ',
 'aja cu pra tomar parcero ',
 ' vai tomar cu faz motivos pra estar fodida ideias hj dia https t 

In [8]:
import pandas as pd
df = pd.DataFrame(dict_lista)

In [9]:
df.head()
df.count()

text    6609
dtype: int64

In [10]:
df.to_csv('tweets_ofensivos_finais_com_ofensa.csv', index=False)

In [None]:
#df.to_csv('tweets_neutros_finais_com_coisa.csv', index=False)