In [1]:
import nltk,math
from nltk import *

# Alicia_utf8.txt
#! /usr/bin/python3

import pyfreeling
import sys

## -----------------------------------------------
## Do whatever is needed with analyzed sentences
## -----------------------------------------------
def ProcessSentences(ls):

    # for each sentence in list
    for s in ls :
        # for each word in sentence
        for w in s :
            # print word form  
            print("word '"+w.get_form()+"'")
            # print possible analysis in word, output lemma and tag
            print("  Possible analysis: {",end="")
            for a in w :
                print(" ("+a.get_lemma()+","+a.get_tag()+")",end="")
            print(" }")
            #  print analysis selected by the tagger 
            print("  Selected Analysis: ("+w.get_lemma()+","+w.get_tag()+")")
        # sentence separator
        print("")  


## -----------------------------------------------
## Set desired options for morphological analyzer
## -----------------------------------------------
def my_maco_options(lang,lpath) :

    # create options holder 
    opt = pyfreeling.maco_options(lang);

    # Provide files for morphological submodules. Note that it is not 
    # necessary to set file for modules that will not be used.
    opt.UserMapFile = "";
    opt.LocutionsFile = lpath + "locucions.dat"; 
    opt.AffixFile = lpath + "afixos.dat";
    opt.ProbabilityFile = lpath + "probabilitats.dat"; 
    opt.DictionaryFile = lpath + "dicc.src";
    opt.NPdataFile = lpath + "np.dat"; 
    opt.PunctuationFile = lpath + "../common/punct.dat"; 
    return opt;



## ----------------------------------------------
## -------------    MAIN PROGRAM  ---------------
## ----------------------------------------------

# set locale to an UTF8 compatible locale 
pyfreeling.util_init_locale("default");

# get requested language from arg1, or English if not provided      
lang = "es"
if len(sys.argv)>1 : lang=sys.argv[1]

# get installation path to use from arg2, or use /usr/local if not provided
ipath = "/usr/local";
if len(sys.argv)>2 : ipath=sys.argv[2]

# path to language data   
lpath = ipath + "/share/freeling/" + lang + "/"

# create analyzers
tk=pyfreeling.tokenizer(lpath+"tokenizer.dat");
sp=pyfreeling.splitter(lpath+"splitter.dat");

# create the analyzer with the required set of maco_options  
morfo=pyfreeling.maco(my_maco_options(lang,lpath));
#  then, (de)activate required modules   
morfo.set_active_options (False,  # UserMap 
                          True,  # NumbersDetection,  
                          True,  # PunctuationDetection,   
                          True,  # DatesDetection,    
                          True,  # DictionarySearch,  
                          True,  # AffixAnalysis,  
                          False, # CompoundAnalysis, 
                          True,  # RetokContractions,
                          True,  # MultiwordsDetection,  
                          True,  # NERecognition,     
                          False, # QuantitiesDetection,  
                          True); # ProbabilityAssignment                 

# create tagger
tagger = pyfreeling.hmm_tagger(lpath+"tagger.dat",True,2)

# process input text
text = "".join(sys.stdin.readlines())

# tokenize input line into a list of words
lw = tk.tokenize(text)
# split list of words in sentences, return list of sentences
ls = sp.split(lw)

# perform morphosyntactic analysis and disambiguation
ls = morfo.analyze(ls)
ls = tagger.analyze(ls)

# do whatever is needed with processed sentences   
ProcessSentences(ls)

In [None]:
A
a
SP
través
través
NCMS000
de
de
SP
la
el
DA0FS0
tarde
tarde
NCFS000
color
color
NCMS000
de
de
SP
oro
oro
NCMS000
el
el
DA0MS0
agua
agua
NCCS000
nos
nos
PP1CP00
lleva
llevar
VMIP3S0
sin
sin
SP
esfuerzo
esfuerzo
NCMS000
por
por
SP
nuestra
nuestro
DP1FSP
parte
parte
NCCS000
,
,
Fc
pues
pues
CS
los
el
DA0MP0
que
que
PR0CN00
empujan
empujar
VMIP3P0
los
el
DA0MP0
remos
remo
NCMP000
son
ser
VSIP3P0
unos
uno
DI0MP0
brazos
brazo
NCMP000
infantiles
infantil
AQ0CP00
que
que
PR0CN00
intentan
intentar
VMIP3P0
,
,
Fc
con
con
SP
sus
su
DP3CPN
manitas
manita
NCFP000
guiar
guiar
VMN0000
el
el
DA0MS0
curso
curso
NCMS000
de
de
SP
nuestra
nuestro
DP1FSP
barca
barca
NCFS000
.
.
Fp
Pero
pero
CC
,
,
Fc
¡
¡
Faa
las
el
DA0FP0
tres
3
Z
son
ser
VSIP3P0
muy
muy
RG
crueles
cruel
AQ0CP00
!
!
Fat
ya
ya
RG
que
que
CS
sin
sin
SP
fijar
fijar
VMN0000
se
se
PP3CN00
en
en
SP
el
el
DA0MS0
apacible
apacible
AQ0CS00
tiempo
tiempo
NCMS000
ni
ni
CC
en
en
SP
el
el
DA0MS0
ensueño
ensueño
NCMS000
de
de
SP
la
el
DA0FS0
hora
hora
NCFS000
presente
presente
AQ0CS00
,
,
Fc
¡
¡
Faa
exigen
exigir
VMIP3P0
una
uno
DI0FS0
historia
historia
NCFS000
de
de
SP
una
uno
DI0FS0
voz
voz
NCFS000
que
que
PR0CN00
apenas
apenas
RG
tiene
tener
VMIP3S0
aliento
aliento
NCMS000
,
,
Fc
tanto
tanto
RG
que
que
CS
ni
ni
RN
a
a
SP
una
uno
DI0FS0
pluma
pluma
NCFS000
podría
poder
VMIC3S0
soplar
soplar
VMN0000
!
!
Fat
Mas
mas
CC
,
,
Fc
¿
¿
Fia
qué
qué
PT00000
podría
poder
VMIC3S0
una
uno
DI0FS0
voz
voz
NCFS000
tan
tan
RG
débil
débil
AQ0CS00
contra
contra
SP
la
el
DA0FS0
voluntad
voluntad
NCFS000
de
de
SP
las
el
DA0FP0
tres
3
Z
?
?
Fit
La
el
DA0FS0
primera
1
AO0FS00
,
,
Fc
imperiosamente
imperiosamente
RG
,
,
Fc
dicta
dictar
VMIP3S0
su
su
DP3CSN
decreto
decreto
NCMS000
:
:
Fd
"
"
Fe
¡
¡
Faa
Comience
comenzar
VMM03S0
el
el
DA0MS0
cuento
cuento
NCMS000
!
!
Fat
"
"
Fe
La
el
DA0FS0
segunda
2
AO0FS00
,
,
Fc
un
uno
DI0MS0
poco
poco
PI0MS00
más
más
RG
amable
amable
AQ0CS00
,
,
Fc
pide
pedir
VMIP3S0
que
que
CS
el
el
DA0MS0
cuento
cuento
NCMS000
no
no
RN
sea
ser
VSSP1S0
tonto
tonto
AQ0MS00
,
,
Fc
mientras
mientras
CS
que
que
CS
la
el
DA0FS0
tercera
3
AO0FS00
interrumpe
interrumpir
VMIP3S0
la
el
DA0FS0
historia
historia
NCFS000
nada
nada
PI0CS00
más
más
RG
que
que
CS
una
uno
DI0FS0
vez
vez
NCFS000
por
por
SP
minuto
minuto
NCMS000
.
.
Fp
Conseguido
conseguir
VMP00SM
a
a
SP
el
el
DA0MS0
fin
fin
NCMS000
el
el
DA0MS0
silencio
silencio
NCMS000
,
,
Fc
con
con
SP
la
el
DA0FS0
imaginación
imaginación
NCFS000
las
lo
PP3FPA0
lleva
llevar
VMIP3S0
,
,
Fc
siguiendo
seguir
VMG0000
a
a
SP
esa
ese
DD0FS0
niña
niño
NCFS000
soñada
soñar
VMP00SF
,
,
Fc
por
por
SP
un
uno
DI0MS0
mundo
mundo
NCMS000
nuevo
nuevo
AQ0MS00
,
,
Fc
de
de
SP
hermosas
hermoso
AQ0FP00
maravillas
maravilla
NCFP000
en
en
SP
el
el
DA0MS0
que
que
PR0CN00
hasta
hasta
SP
los
el
DA0MP0
pájaros
pájaro
NCMP000
y
y
CC
las
el
DA0FP0
bestias
bestia
NCCP000
hablan
hablar
VMIP3P0
con
con
SP
voz
voz
NCFS000
humana
humano
AQ0FS00
,
,
Fc
y
y
CC
ellas
ellos
PP3FP00
casi
casi
RG
se
se
P00CN00
creen
creer
VMIP3P0
estar
estar
VMN0000
allí
allí
RG
.
.
Fp
Y
y
CC
cada
cada
DI0CS0
vez
vez
NCFS000
que
que
PR0CN00
el
el
DA0MS0
narrador
narrador
NCMS000
intentaba
intentar
VMII3S0
,
,
Fc
seca
seco
AQ0FS00
ya
ya
RG
la
el
DA0FS0
fuente
fuente
NCFS000
de
de
SP
su
su
DP3CSN
inspiración
inspiración
NCFS000
dejar
dejar
VMN0000
la
el
DA0FS0
narración
narración
NCFS000
para
para
SP
el
el
DA0MS0
día
día
NCMS000
siguiente
siguiente
AQ0CS00
,
,
Fc
y
y
CC
decía
decir
VMII3S0
:
:
Fd
"
"
Fe
El
el
DA0MS0
resto
resto
NCMS000
para
para
SP
la
el
DA0FS0
próxima
próximo
AQ0FS00
vez
vez
NCFS000
"
"
Fe
,
,
Fc
las
el
DA0FP0
tres
3
Z
,
,
Fc
a
a
SP
el
el
DA0MS0
tiempo
tiempo
NCMS000
,
,
Fc
decían
decir
VMII3P0
:
:
Fd
"
"
Fe
¡
¡
Faa
Ya
ya
RG
es
ser
VSIP3S0
la
el
DA0FS0
próxima
próximo
AQ0FS00
vez
vez
NCFS000
!
!
Fat
"
"
Fe
Y
y
CC
así
así
RG
fue
ser
VSIS3S0
surgiendo
surgir
VMG0000
el
el
DA0MS0
"
"
Fe
País_de_las_Maravillas
país_de_las_maravillas
NP00V00
"
"
Fe
,
,
Fc
poquito
poco
PI0MS00
a
a
SP
poco
poco
PI0MS00
,
,
Fc
y
y
CC
una
uno
PI0FS00
a
a
SP
una
uno
DI0FS0
,
,
Fc
el
el
DA0MS0
mosaico
mosaico
NCMS000
de
de
SP
sus
su
DP3CPN
extrañas
extraño
AQ0FP00
aventuras
aventura
NCFP000
.
.
Fp
Y
y
CC
ahora
ahora
RG
,
,
Fc
que
que
CS
el
el
DA0MS0
relato
relato
NCMS000
toca
tocar
VMIP3S0
a
a
SP
su
su
DP3CSN
fin
fin
NCMS000
,
,
Fc
también
también
RG
el
el
DA0MS0
timón
timón
NCMS000
de
de
SP
la
el
DA0FS0
barca
barca
NCFS000
nos
nos
PP1CP00
vuelve
volver
VMIP3S0
a
a
SP
el
el
DA0MS0
hogar
hogar
NCMS000
,
,
Fc
¡
¡
Faa
una
uno
DI0FS0
alegre
alegre
AQ0CS00
tripulación
tripulación
NCFS000
,
,
Fc
bajo
bajo
SP
el
el
DA0MS0
sol
sol
NCMS000
que
que
PR0CN00
ya
ya
RG
se
se
P00CN00
oculta
ocultar
VMIP3S0
!
!
Fat
Alicia
alicio
NCFS000
,
,
Fc
para
para
SP
ti
ti
PP2CSO0
este
este
DD0MS0
cuento
cuento
NCMS000
infantil
infantil
AQ0CS00
.
.
Fp
Pon
poner
VMM02S0
lo
lo
PP3MSA0
con
con
SP
tu
tu
DP2CSS
mano
mano
NCFS000
pequeña
pequeño
AQ0FS00
y
y
CC
amable
amable
AQ0CS00
donde
donde
PR00000
descansan
descansar
VMIP3P0
los
el
DA0MP0
cuentos
cuento
NCMP000
infantiles
infantil
AQ0CP00
,
,
Fc
entrelazados
entrelazar
VMP00PM
,
,
Fc
como
como
CS
las
el
DA0FP0
flores
flor
NCFP000
ya
ya
RG
marchitas
marchito
AQ0FP00
en
en
SP
la
el
DA0FS0
guirnalda
guirnalda
NCFS000
de
de
SP
la
el
DA0FS0
memoria
memoria
NCFS000
.
.
Fp
Es
ser
VSIP3S0
la
el
DA0FS0
ofrenda
ofrenda
NCFS000
de
de
SP
un
uno
DI0MS0
peregrino
peregrino
NCMS000
que
que
PR0CN00
las
lo
PP3FPA0
recogió
recoger
VMIS3S0
en
en
SP
países
país
NCMP000
lejanos
lejano
AQ0MP00
.
.
Fp