In [37]:
import pandas as pd
import spacy
pd.set_option('display.max_colwidth', None)

In [38]:
# Read the data
data = pd.read_csv('../data/libras_dictionary.csv')

In [39]:
# Print the first 5 rows of the data
data.head()

Unnamed: 0,word,subject,interpretation,example_portuguese_sentence,example_libras_sentence,grammar_class,word_origin,video_link,image_link,hand_image_link
0,A,NENHUM,Primeira letra do alfabeto da língua portuguesa; sinal gráfico elementar com que se representam os vocábulos na língua escrita.,Invente qualquer palavra que comece com a letra A.,VOCÊ INVENTAR QUALQUER PALAVRA COMEÇAR A.,SUBSTANTIVO,Nacional,https://www.ines.gov.br/dicionario-de-libras/public/media/palavras/videos/aSm_Prog001.mp4,https://www.ines.gov.br/dicionario-de-libras/public/media/palavras/images/aSm_Prog001.jpg,https://www.ines.gov.br/dicionario-de-libras/public/media/mao/cg01.jpg
1,ABACATE,FRUTA,"O fruto do abacateiro. Comestível, tem a polpa amarelada e macia. É consumido puro, com açúcar, em pratos salgados ou em vitaminas.",Você gosta de abacate com leite?,VOCÊ GOSTAR ABACATE LEITE JUNTO?,SUBSTANTIVO,Nacional,https://www.ines.gov.br/dicionario-de-libras/public/media/palavras/videos/abacateSm_Prog001.mp4,https://www.ines.gov.br/dicionario-de-libras/public/media/palavras/images/abacateSm_Prog001.jpg,https://www.ines.gov.br/dicionario-de-libras/public/media/mao/cg53a.jpg
2,ABACAXI,FRUTA,"Fruta de casca grossa e áspera. Sua polpa pode ser consumida pura, em forma de sucos, doces e sorvetes.","Hoje tomei suco de abacaxi, ele estava ácido.",HOJE S-U-C-O ABACAXI BEBER ÁCID@.,SUBSTANTIVO,Nacional,https://www.ines.gov.br/dicionario-de-libras/public/media/palavras/videos/abacaxiSm_Prog001.mp4,https://www.ines.gov.br/dicionario-de-libras/public/media/palavras/images/abacaxiSm_Prog001.jpg,https://www.ines.gov.br/dicionario-de-libras/public/media/mao/cg47.jpg
3,ABAFAR,NENHUM,"Cobrir ou fechar, para manter o calor.","Se você quer abafar seu quarto, é melhor fechar tudo.",S-I VOCÊ QUERER QUARTO SE@ ABAFAR A-R? MELHOR FECHAR-TUDO.,VERBO,Nacional,https://www.ines.gov.br/dicionario-de-libras/public/media/palavras/videos/abafarSm_Prog001.mp4,https://www.ines.gov.br/dicionario-de-libras/public/media/palavras/images/abafarSm_Prog001.jpg,https://www.ines.gov.br/dicionario-de-libras/public/media/mao/cg07.jpg
4,ABAIXO,NENHUM,"Lugar, posição ou situação inferior, em relação a outros de nível mais elevado.","Não é no primeiro apartamento abaixo, é no segundo.",APARTAMENTO PRIMEIR@ NÃO SEGUND@ ABAIXO.,ADV.,Nacional,https://www.ines.gov.br/dicionario-de-libras/public/media/palavras/videos/abaixoSm_Prog001.mp4,https://www.ines.gov.br/dicionario-de-libras/public/media/palavras/images/abaixoSm_Prog001.jpg,https://www.ines.gov.br/dicionario-de-libras/public/media/mao/cg62.jpg


In [15]:
data[['example_portuguese_sentence', 'example_libras_sentence']].head()

Unnamed: 0,example_portuguese_sentence,example_libras_sentence
0,Invente qualquer palavra que comece com a letra A.,VOCÊ INVENTAR QUALQUER PALAVRA COMEÇAR A.
1,Você gosta de abacate com leite?,VOCÊ GOSTAR ABACATE LEITE JUNTO?
2,"Hoje tomei suco de abacaxi, ele estava ácido.",HOJE S-U-C-O ABACAXI BEBER ÁCID@.
3,"Se você quer abafar seu quarto, é melhor fechar tudo.",S-I VOCÊ QUERER QUARTO SE@ ABAFAR A-R? MELHOR FECHAR-TUDO.
4,"Não é no primeiro apartamento abaixo, é no segundo.",APARTAMENTO PRIMEIR@ NÃO SEGUND@ ABAIXO.


In [44]:
# Remove characters that are not letters from the sentences in Libras
data['example_libras_sentence'] = data['example_libras_sentence'].str.replace("@", "o")
data['example_libras_sentence'] = data['example_libras_sentence'].str.replace("-", "")
data['example_libras_sentence'] = data['example_libras_sentence'].str.lower()
data['example_portuguese_sentence'] = data['example_portuguese_sentence'].str.lower()

In [45]:
data[['example_portuguese_sentence', 'example_libras_sentence']].head(10)

Unnamed: 0,example_portuguese_sentence,example_libras_sentence
0,invente qualquer palavra que comece com a letra a.,você inventar qualquer palavra começar a.
1,você gosta de abacate com leite?,você gostar abacate leite junto?
2,"hoje tomei suco de abacaxi, ele estava ácido.",hoje suco abacaxi beber ácido.
3,"se você quer abafar seu quarto, é melhor fechar tudo.",si você querer quarto seo abafar ar? melhor fechartudo.
4,"não é no primeiro apartamento abaixo, é no segundo.",apartamento primeiro não segundo abaixo.
5,os surdos fizeram um abaixo-assinado pedindo mais empregos ao governo.,surdo abaixoassinado pedir governo emprego mais.
6,a lâmpada do abajur queimou.,coisacônicalâmpada lâmpadaqueimar .
7,está vendo aquela velha se abanando? ela é avó da minha amiga.,2solhar3s velho abanarleque lá(me) vovo amigo(md).
8,o carro velho foi abandonado naquela garagem.,aquelo caragem carro velho abandonar.
9,coitada dessa criança tão bonita dormindo na rua. como seus pais tiveram coragem de abandoná-la?!,criança bonito dormir rua coitado! pai mãe delo abandonar coragem?!


In [46]:
data[['example_portuguese_sentence', 'example_libras_sentence']].to_csv('../data/libras_dictionary_cleaned.csv', index=False)

In [25]:
nlp_pt = spacy.load('pt_core_news_sm')

In [34]:
def separate_words(sentence, recursion_depth=0):
    if recursion_depth > 10:
        return sentence
    doc = nlp_pt(sentence)
    new_sentence = []
    for token in doc:
        if token.text.isupper() and len(token.text) > 1:
            new_sentence.append(separate_words(token.text, recursion_depth + 1))
        else:
            new_sentence.append(token.text)
    return ' '.join(new_sentence)

In [35]:
separate_words("Eu gosto de ABANARLEQUE.")

'Eu gosto de ABANARLEQUE .'