Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

heideltime standalone not working under my ubuntu system #18

Open
GoogleCodeExporter opened this issue Jun 9, 2015 · 7 comments
Open

Comments

@GoogleCodeExporter
Copy link

Ive tried several hours to get Heideltime Standalone to run on my ubuntu 
system, but it still didnt work. 
i followed exactly the how to use instructions in the readme file and i also 
installed the treetagger from 
http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/ with the whole 
package, the tagging scripts, the installation script and the parameter files 
for the languages which i use and i also  indicate the path to the folder 
containing the tree-tagger in config.props, in "treeTaggerHome" (treeTaggerHome 
= /home/chuulio/Dokumente/TreeTagger/)
Ive tried heideltime on a text document about moskow in german, and this is 
what i got:

chuulio@chuulio-UX32VD:~/Dokumente/Temporal_Annotation/Standalone$ java -jar 
de.unihd.dbs.heideltime.standalone.jar /home/chuulio/Dokumente/Moskau.txt -l 
german -vv
Aug 26, 2014 10:47:17 PM 
de.unihd.dbs.heideltime.standalone.HeidelTimeStandalone main
INFO: Verbosity: '-vv'; Logging level set to ALL.
Aug 26, 2014 10:47:17 PM 
de.unihd.dbs.heideltime.standalone.HeidelTimeStandalone main
INFO: Encoding '-e': NOT FOUND OR RECOGNIZED; set to 'UTF-8'
Aug 26, 2014 10:47:17 PM 
de.unihd.dbs.heideltime.standalone.HeidelTimeStandalone main
INFO: Output '-o': NOT FOUND OR RECOGNIZED; set to TIMEML
Aug 26, 2014 10:47:17 PM 
de.unihd.dbs.heideltime.standalone.HeidelTimeStandalone main
INFO: Language '-l': GERMAN
Aug 26, 2014 10:47:17 PM 
de.unihd.dbs.heideltime.standalone.HeidelTimeStandalone main
INFO: Type '-t': NOT FOUND OR RECOGNIZED; set to NARRATIVES
Aug 26, 2014 10:47:17 PM 
de.unihd.dbs.heideltime.standalone.HeidelTimeStandalone main
INFO: Document Creation Time '-dct': NOT FOUND; skipping.
Aug 26, 2014 10:47:17 PM 
de.unihd.dbs.heideltime.standalone.HeidelTimeStandalone main
INFO: Locale '-locale': NOT FOUND, set to environment locale: de_CH
Aug 26, 2014 10:47:17 PM 
de.unihd.dbs.heideltime.standalone.HeidelTimeStandalone main
INFO: Configuration path '-c': config.props
Aug 26, 2014 10:47:17 PM 
de.unihd.dbs.heideltime.standalone.HeidelTimeStandalone readConfigFile
INFO: trying to read in file config.props
Aug 26, 2014 10:47:17 PM 
de.unihd.dbs.heideltime.standalone.HeidelTimeStandalone main
INFO: POS Tagger '-pos': NOT FOUND OR RECOGNIZED; set to TREETAGGER
Aug 26, 2014 10:47:17 PM 
de.unihd.dbs.heideltime.standalone.HeidelTimeStandalone main
INFO: Interval Tagger '-it': NOT FOUND OR RECOGNIZED; set to false
Aug 26, 2014 10:47:17 PM 
de.unihd.dbs.heideltime.standalone.HeidelTimeStandalone main
INFO: Reading document using charset: UTF-8
Aug 26, 2014 10:47:17 PM 
de.unihd.dbs.heideltime.standalone.HeidelTimeStandalone initialize
INFO: HeidelTimeStandalone initialized with language german
Aug 26, 2014 10:47:17 PM 
de.unihd.dbs.heideltime.standalone.HeidelTimeStandalone initialize
INFO: HeidelTime initialized
Aug 26, 2014 10:47:17 PM 
de.unihd.dbs.heideltime.standalone.HeidelTimeStandalone initialize
INFO: JCas factory initialized
Aug 26, 2014 10:47:17 PM 
de.unihd.dbs.heideltime.standalone.HeidelTimeStandalone process
INFO: Processing started
[de.unihd.dbs.uima.annotator.heideltime.HeidelTime] HeidelTime has not found 
any sentence tokens in this document. HeidelTime needs sentence tokens tagged 
by a preprocessing UIMA analysis engine to do its work. Please check your UIMA 
workflow and add an analysis engine that creates these sentence tokens.
Aug 26, 2014 10:47:19 PM 
de.unihd.dbs.heideltime.standalone.HeidelTimeStandalone process
INFO: Processing finished
Aug 26, 2014 10:47:19 PM 
de.unihd.dbs.heideltime.standalone.HeidelTimeStandalone process
INFO: Result formatted
<?xml version="1.0"?>
<!DOCTYPE TimeML SYSTEM "TimeML.dtd">
<TimeML>

Moskau (russisch Москва́ Zum Anhören bitte klicken! [mɐˈskva], 
Moskwa) ist die Hauptstadt der Russischen Föderation und mit rund 11,55 
Millionen Einwohnern (Stand 14. Oktober 2010)[1] die größte Stadt bzw. mit 
15,1 Millionen (2012)[2] die größte Agglomeration Europas. Am 1. Juli 2012 
wurde Moskau durch Eingemeindung der beiden Verwaltungsbezirke Nowomoskowski 
und Troizk im Südwesten der Stadt auf Kosten der Moskauer Oblast um 1480 km², 
d. h. um das 1,39-Fache, auf 2550 km² vergrößert. Durch die Eingliederung 
wuchs die Moskauer Bevölkerung um etwa 235.000 Menschen.

Moskau ist das politische, wirtschaftliche und kulturelle Zentrum des Landes 
mit Hochschulen und Fachschulen sowie zahlreichen Kirchen, Theatern, Museen, 
Galerien und dem 540 Meter hohen Ostankino-Turm. Moskau ist Sitz der 
Russisch-Orthodoxen Kirche: Der Patriarch residiert im Danilow-Kloster, das 
größte russisch-orthodoxe Kirchengebäude ist die Moskauer 
Christ-Erlöser-Kathedrale. Es gibt im Stadtgebiet von Moskau über 300 
Kirchen.[3] Seit dem 16. Jahrhundert wird Moskau auch als Drittes Rom 
bezeichnet. Nach Ende des Zweiten Weltkriegs erhielt Moskau die Auszeichnung 
einer „Heldenstadt“.

Der Kreml und der Rote Platz im Zentrum Moskaus stehen seit 1990 auf der 
UNESCO-Liste des Weltkulturerbes. Mit acht Fernbahnhöfen, drei internationalen 
Flughäfen und drei Binnenhäfen ist die Stadt wichtigster Verkehrsknoten und 
größte Industriestadt Russlands.

Geschichte
Ursprung
Denkmal für den Stadtgründer Juri Dolgoruki

Eine der Sagen kündet davon, dass der Fürst Juri Dolgoruki (1090–1157) im 
Land der Wjatitschen eine hölzerne Stadt zu errichten befahl, und dass diese 
Stadt nach dem Fluss benannt wurde, an dessen Ufern sie emporwuchs. Die erste 
schriftliche Erwähnung Moskaus stammt aus dem Jahre 1147, das darum als das 
Gründungsjahr Moskaus gilt. Doch schon lange davor gab es an der Stelle, wo 
heute Moskau steht, menschliche Niederlassungen. Archäologische Ausgrabungen 
bezeugen, dass die ältesten von ihnen vor etwa 5000 Jahren entstanden waren.

Um 1156 entstand eine erste, noch hölzerne Wehranlage des Kremls, in deren 
Schutz sich der Marktflecken allmählich zu einer beachtlichen Ansiedlung 
entwickelte. Im Jahre 1238 ist die Stadt von den Mongolen erobert und 
niedergebrannt worden. 1263 wurde das Umland zu einem Teilfürstentum im 
Großfürstentum Wladimir-Susdal, wenig später unter Fürst Daniel ein 
eigenständiges Fürstentum. In der ersten Hälfte des 14. Jahrhunderts – die 
Stadt zählte mittlerweile 30.000 Einwohner – erkannte der tatarische 
Großkhan den Moskauer Großfürsten als (ihm allerdings tributpflichtiges) 
Oberhaupt von Russland an.

Der Sieg über die Tataren in der Schlacht von Kulikowo am 8. September 1380, 
angeführt durch den Moskauer Großfürsten Dmitri Donskoi, befreite zwar nicht 
von der Hegemonie der Goldenen Horde (1382 wurde Moskau sogar abermals 
niedergebrannt und geplündert), doch die Stadt festigte dadurch ihr 
politisches und militärisches Ansehen erheblich und gewann mithin beständig 
an wirtschaftlicher Macht. 1480 konnte sie die Tatarenherrschaft endgültig 
abschütteln und wurde zur Hauptstadt des russischen Reiches.

Der seit 1462 regierende Großfürst von Moskau Iwan III., der Große 
(1440–1505), heiratete 1472 die byzantinische Prinzessin Sofia (Zoe) 
Palaiologos, eine Nichte des letzten oströmischen Kaisers Konstantin XI. 
Palaiologos, und übernahm von dort die autokratische Staatsidee und ihre 
Symbole: den Doppeladler und das Hofzeremoniell. Seither gilt Moskau als 
„Drittes Rom“ und Hort der Orthodoxie.
Moskau wird Großstadt
Moskau am Ende des 17. Jahrhunderts

In den beiden letzten Jahrzehnten des 15. Jahrhunderts begann der Ausbau des 
Kreml, in dessen Umkreis sich nun in großer Zahl Handwerker und Kaufleute 
niederließen. Die Einwohnerzahl stieg bald darauf auf mehr als 100.000, so 
dass um 1600 eine Ringmauer um Moskau und eine Erdverschanzung hinzukamen, die 
die blühende Stadt fortan nach außen abschirmten. 1571 war sie ein letztes 
Mal von den Tataren heimgesucht worden, als die überwiegend aus Holz gebaute 
Stadt abbrannte. Bereits ein Jahr später war die Tatarengefahr in der Schlacht 
von Molodi südlich von Moskau aber endgültig gebannt. In der Zeit der Wirren, 
die durch unklare Thronfolgeverhältnisse ausgelöst wurde, rückten polnische 
Truppen in die Stadt und versuchten, eigene Marionetten zu installieren. Eine 
Volksarmee aus Nischni Nowgorod belagerte die Polen jedoch im Moskauer Kreml 
und zwang sie zur Kapitulation. Diese Ereignisse ebneten den Weg für die 
Romanow-Dynastie auf den russischen Thron.

Während die ersten Tuch-, Papier- und Ziegelmanufakturen, Glasfabriken und 
Pulvermühlen entstanden, kulminierten die sozialen Gegensätze des 
Großreiches: 1667 erhoben sich die Bauern im Wolga- und Dongebiet gegen die 
wachsende Unterdrückung, ihr Führer, Stepan Rasin, wurde 1671 auf dem Roten 
Platz in Moskau hingerichtet. Im Jahre 1687 ist die erste Hochschule Russlands, 
die „Slawisch-Griechische Akademie“ eröffnet worden, 1703 erschien die 
erste gedruckte russische Zeitung „Wedomosti“. Im Jahre 1712 ging unter Zar 
Peter dem Großen (1672–1725) das Privileg der Hauptstadt auf das neu 
gegründete Sankt Petersburg über, aber Moskau blieb das wirtschaftliche und 
geistig-kulturelle Zentrum des Landes. 1755 wurde in Moskau mit der heutigen 
Lomonossow-Universität die erste russische Universität eröffnet.
Der Brand von Moskau vor der Einnahme der Stadt durch Napoleon 1812
Twerskaja-Straße im 19. Jahrhundert

Mit dem Moskau des 18. Jahrhunderts ist das Schaffen hervorragender russischer 
Schriftsteller und Dichter verknüpft wie Alexander Sumarokow, Denis Fonwisin, 
Nikolai Karamsin und vieler anderer. In Moskau trat der große russische 
Gelehrte Michail Lomonossow seinen Weg in die Wissenschaft an. Auch in 
späteren Zeiten lebten und wirkten in Moskau viele berühmte russische 
Schriftsteller und Dichter, Wissenschaftler und Künstler, die durch ihr 
Schaffen nicht nur zur russischen, sondern auch zur Weltkultur einen immensen 
Beitrag geleistet haben.

Im Vaterländischen Krieg von 1812, als Napoleon Bonaparte (1769–1821) mit 
seiner „Großen Armee“ auf Moskau zumarschierte, verlor die Stadt in einem 
Flächenbrand – die Bewohner zündeten ihre Häuser an und flohen aus der 
Stadt – zwei Drittel ihrer Bausubstanz. Aber in Moskau kam die französische 
Armee zum Stehen, hier wurde sie wegen Hunger und Kälte zur Umkehr gezwungen, 
die mit ihrem Untergang endete.

Der im Frühjahr 1813 einsetzende großstilige Wieder- und Neuaufbau sprengte 
rasch den alten städtischen Verteidigungsring und verschaffte der Stadt von 
der Mitte des 19. Jahrhunderts an durch zügigen Straßen- und Bahnstreckenbau 
Anschluss an die wichtigsten Städte des Landes. 1890 fuhren die ersten 
elektrischen Straßenbahnen; die erste Volkszählung des Landes fand am 28. 
Januar 1897 statt, die Bevölkerung der Stadt war auf etwa eine Milli


</TimeML>

java and ubuntu version:

chuulio@chuulio-UX32VD:~/Dokumente/Temporal_Annotation/Standalone$ lsb_release 
-a && java -version
No LSB modules are available.
Distributor ID: Ubuntu
Description:    Ubuntu 12.10
Release:    12.10
Codename:   quantal
java version "1.7.0_25"
OpenJDK Runtime Environment (IcedTea 2.3.10) (7u25-2.3.10-1ubuntu0.12.10.2)
OpenJDK 64-Bit Server VM (build 23.7-b01, mixed mode)


any idea?


Original issue reported on code.google.com by julien.p...@gmail.com on 26 Aug 2014 at 8:52

@GoogleCodeExporter
Copy link
Author

i have also tested the treetagger by the command:
chuulio@chuulio-UX32VD:~/Dokumente/TreeTagger/cmd$ cat 
/home/chuulio/Dokumente/Moskau.txt | ./tree-tagger-german > out.txt

Original comment by julien.p...@gmail.com on 26 Aug 2014 at 9:04

Attachments:

@GoogleCodeExporter
Copy link
Author

chuulio@chuulio-UX32VD:~/Dokumente/TreeTagger/cmd$ locale
LANG=de_CH.UTF-8
LANGUAGE=de_CH:de
LC_CTYPE="de_CH.UTF-8"
LC_NUMERIC="de_CH.UTF-8"
LC_TIME="de_CH.UTF-8"
LC_COLLATE="de_CH.UTF-8"
LC_MONETARY="de_CH.UTF-8"
LC_MESSAGES="de_CH.UTF-8"
LC_PAPER="de_CH.UTF-8"
LC_NAME="de_CH.UTF-8"
LC_ADDRESS="de_CH.UTF-8"
LC_TELEPHONE="de_CH.UTF-8"
LC_MEASUREMENT="de_CH.UTF-8"
LC_IDENTIFICATION="de_CH.UTF-8"
LC_ALL=
chuulio@chuulio-UX32VD:~/Dokumente/TreeTagger/cmd$ locale -a
C
C.UTF-8
de_AT.utf8
de_BE.utf8
de_CH.utf8
de_DE.utf8
de_LI.utf8
de_LU.utf8
en_AG
en_AG.utf8
en_AU.utf8
en_BW.utf8
en_CA.utf8
en_DK.utf8
en_GB.utf8
en_HK.utf8
en_IE.utf8
en_IN
en_IN.utf8
en_NG
en_NG.utf8
en_NZ.utf8
en_PH.utf8
en_SG.utf8
en_US.utf8
en_ZA.utf8
en_ZM
en_ZM.utf8
en_ZW.utf8
POSIX
zh_CN.utf8
zh_SG.utf8


Original comment by julien.p...@gmail.com on 26 Aug 2014 at 9:05

@GoogleCodeExporter
Copy link
Author

Issue 19 has been merged into this issue.

Original comment by z...@informatik.uni-heidelberg.de on 26 Aug 2014 at 9:09

@GoogleCodeExporter
Copy link
Author

Hey, thanks for opening the issue.

The error message ("HeidelTime has not found any sentence tokens...") would 
indicate that there's something going wrong with the tokenization. Can you 
provide the full document text as a file? The excerpt that seems to be output 
processes fine on my system.

Kind Regards,
Julian

Original comment by z...@informatik.uni-heidelberg.de on 26 Aug 2014 at 9:13

@GoogleCodeExporter
Copy link
Author

Hi,

I am also having the same problem. Could you please let me know how this was 
resolved at that time. I am getting the tokens correctly with treetagger

dheeru@dheeru-PC:~/heideltime-standalone-1.5$ cat to_tag.txt | 
tree-tagger-english 
    reading parameters ...
    tagging ...
Akbar   NP  Akbar
(   (   (
14  CD  @card@
October NP  October
1542    CD  @card@
– NN  <unknown>
27  CD  @card@
October NP  October
1605    CD  @card@
)   )   )
,   ,   ,
     finished.
also    RB  also
known   VBN know
as  IN  as
Akbar   NP  Akbar
the DT  the
Great   NP  Great
or  CC  or
Akbar   NP  Akbar
I   NP  I
,   ,   ,
was VBD be
Mughal  NP  <unknown>
Emperor NP  <unknown>
from    IN  from
1556    CD  @card@
until   IN  until
his PP$ his
death   NN  death
.   SENT    .
He  PP  he
was VBD be
the DT  the
third   JJ  third
and CC  and
one CD  one
of  IN  of
the DT  the
greatest    JJS great
ruler   NN  ruler
of  IN  of
the DT  the
Mughal  NP  <unknown>
Dynasty NP  <unknown>
in  IN  in
India   NP  India
.   SENT    .


but when I try to execute the same file with heideltime I get same error.

dheeru@dheeru-PC:~/heideltime-standalone-1.5$ sudo java -jar 
de.unihd.dbs.heideltime.standalone.jar to_tag.txt
[de.unihd.dbs.uima.annotator.heideltime.HeidelTime] HeidelTime has not found 
any sentence tokens in this document. HeidelTime needs sentence tokens tagged 
by a preprocessing UIMA analysis engine to do its work. Please check your UIMA 
workflow and add an analysis engine that creates these sentence tokens.
<?xml version="1.0"?>
<!DOCTYPE TimeML SYSTEM "TimeML.dtd">
<TimeML>

Akbar ( 14 October 1542 – 27 October 1605), also known as Akbar the Great or 
Akbar I, was Mughal Emperor from 1556 until his death. He was the third and one 
of the greatest ruler of the Mughal Dynasty in India. 
</TimeML>

Original comment by dheeru.d...@gmail.com on 15 Feb 2015 at 3:18

@GoogleCodeExporter
Copy link
Author

Hey,

have you tried a newer version of the Standalone? We've seen some issues with 
newer versions of the TreeTagger tokenization script, which is why we ported it 
to Java with HeidelTime version 1.8.
Your text processes fine for me (Ubuntu 14.10, echo $LANG: de_DE.UTF-8, java 
version "1.6.0_34"):

julian@dauntless:~$ java -jar de.unihd.dbs.heideltime.standalone.jar test.txt
<?xml version="1.0"?>
<!DOCTYPE TimeML SYSTEM "TimeML.dtd">
<TimeML>
Akbar ( <TIMEX3 tid="t7" type="DATE" value="1542-10-14">14 October 
1542</TIMEX3> – <TIMEX3 tid="t8" type="DATE" value="1605-10-27">27 October 
1605</TIMEX3>), also known as Akbar the Great or Akbar I, was Mughal Emperor 
from <TIMEX3 tid="t3" type="DATE" value="1556">1556</TIMEX3> until his death. 
He was the third and one of the greatest ruler of the Mughal Dynasty in India.

</TimeML>

Original comment by z...@informatik.uni-heidelberg.de on 15 Feb 2015 at 6:24

@GoogleCodeExporter
Copy link
Author

Hey, 

Thanks a lot for the prompt reply. I was using version 1.5, switched to 1.8 and 
it works fine.

Thanks alot!!

Original comment by dheeru.d...@gmail.com on 16 Feb 2015 at 2:02

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

1 participant