java.lang.NumberFormatException: Bad number put into wordToNumber #547

dexception · 2017-10-16T05:39:19Z

Same exceptions over and over again.

2017-10-15 15:36:02 WARN NumberNormalizer:81 - java.lang.NumberFormatException: Bad number put into wordToNumber. Word is: "2.7million", originally part of "2.7million", piece # 0
edu.stanford.nlp.ie.NumberNormalizer.wordToNumber(NumberNormalizer.java:294)
edu.stanford.nlp.ie.NumberNormalizer.findNumbers(NumberNormalizer.java:636)
edu.stanford.nlp.ie.NumberNormalizer.findAndMergeNumbers(NumberNormalizer.java:725)
edu.stanford.nlp.time.TimeExpressionExtractorImpl.extractTimeExpressions(TimeExpressionExtractorImpl.java:189)
edu.stanford.nlp.time.TimeExpressionExtractorImpl.extractTimeExpressions(TimeExpressionExtractorImpl.java:183)
edu.stanford.nlp.time.TimeExpressionExtractorImpl.extractTimeExpressionCoreMaps(TimeExpressionExtractorImpl.java:114)
edu.stanford.nlp.time.TimeExpressionExtractorImpl.extractTimeExpressionCoreMaps(TimeExpressionExtractorImpl.java:104)
edu.stanford.nlp.ie.regexp.NumberSequenceClassifier.runSUTime(NumberSequenceClassifier.java:345)
edu.stanford.nlp.ie.regexp.NumberSequenceClassifier.classifyWithSUTime(NumberSequenceClassifier.java:143)
edu.stanford.nlp.ie.regexp.NumberSequenceClassifier.classifyWithGlobalInformation(NumberSequenceClassifier.java:106)
edu.stanford.nlp.ie.NERClassifierCombiner.recognizeNumberSequences(NERClassifierCombiner.java:369)
edu.stanford.nlp.ie.NERClassifierCombiner.classifyWithGlobalInformation(NERClassifierCombiner.java:312)
edu.stanford.nlp.ie.NERClassifierCombiner.classify(NERClassifierCombiner.java:299)
edu.stanford.nlp.ie.AbstractSequenceClassifier.classifyToCharacterOffsets(AbstractSequenceClassifier.java:618)

2017-10-15 15:38:22 WARN NumberNormalizer:81 - java.lang.NumberFormatException: Bad number put into wordToNumber. Word is: "2.5million", originally part of "2.5million", piece # 0
edu.stanford.nlp.ie.NumberNormalizer.wordToNumber(NumberNormalizer.java:294)
edu.stanford.nlp.ie.NumberNormalizer.findNumbers(NumberNormalizer.java:636)
edu.stanford.nlp.ie.NumberNormalizer.findAndMergeNumbers(NumberNormalizer.java:725)
edu.stanford.nlp.time.TimeExpressionExtractorImpl.extractTimeExpressions(TimeExpressionExtractorImpl.java:189)
edu.stanford.nlp.time.TimeExpressionExtractorImpl.extractTimeExpressions(TimeExpressionExtractorImpl.java:183)
edu.stanford.nlp.time.TimeExpressionExtractorImpl.extractTimeExpressionCoreMaps(TimeExpressionExtractorImpl.java:114)
edu.stanford.nlp.time.TimeExpressionExtractorImpl.extractTimeExpressionCoreMaps(TimeExpressionExtractorImpl.java:104)
edu.stanford.nlp.ie.regexp.NumberSequenceClassifier.runSUTime(NumberSequenceClassifier.java:345)
edu.stanford.nlp.ie.regexp.NumberSequenceClassifier.classifyWithSUTime(NumberSequenceClassifier.java:143)
edu.stanford.nlp.ie.regexp.NumberSequenceClassifier.classifyWithGlobalInformation(NumberSequenceClassifier.java:106)
edu.stanford.nlp.ie.NERClassifierCombiner.recognizeNumberSequences(NERClassifierCombiner.java:369)
edu.stanford.nlp.ie.NERClassifierCombiner.classifyWithGlobalInformation(NERClassifierCombiner.java:312)
edu.stanford.nlp.ie.NERClassifierCombiner.classify(NERClassifierCombiner.java:299)
edu.stanford.nlp.ie.AbstractSequenceClassifier.classifyToCharacterOffsets(AbstractSequenceClassifier.java:618)

2017-10-15 15:42:44 WARN NumberNormalizer:81 - java.lang.NumberFormatException: Bad number put into wordToNumber. Word is: "3.5million", originally part of "3.5million", piece # 0
edu.stanford.nlp.ie.NumberNormalizer.wordToNumber(NumberNormalizer.java:294)
edu.stanford.nlp.ie.NumberNormalizer.findNumbers(NumberNormalizer.java:636)
edu.stanford.nlp.ie.NumberNormalizer.findAndMergeNumbers(NumberNormalizer.java:725)
edu.stanford.nlp.time.TimeExpressionExtractorImpl.extractTimeExpressions(TimeExpressionExtractorImpl.java:189)
edu.stanford.nlp.time.TimeExpressionExtractorImpl.extractTimeExpressions(TimeExpressionExtractorImpl.java:183)
edu.stanford.nlp.time.TimeExpressionExtractorImpl.extractTimeExpressionCoreMaps(TimeExpressionExtractorImpl.java:114)
edu.stanford.nlp.time.TimeExpressionExtractorImpl.extractTimeExpressionCoreMaps(TimeExpressionExtractorImpl.java:104)
edu.stanford.nlp.ie.regexp.NumberSequenceClassifier.runSUTime(NumberSequenceClassifier.java:345)
edu.stanford.nlp.ie.regexp.NumberSequenceClassifier.classifyWithSUTime(NumberSequenceClassifier.java:143)
edu.stanford.nlp.ie.regexp.NumberSequenceClassifier.classifyWithGlobalInformation(NumberSequenceClassifier.java:106)
edu.stanford.nlp.ie.NERClassifierCombiner.recognizeNumberSequences(NERClassifierCombiner.java:369)
edu.stanford.nlp.ie.NERClassifierCombiner.classifyWithGlobalInformation(NERClassifierCombiner.java:312)
edu.stanford.nlp.ie.NERClassifierCombiner.classify(NERClassifierCombiner.java:299)
edu.stanford.nlp.ie.AbstractSequenceClassifier.classifyToCharacterOffsets(AbstractSequenceClassifier.java:618)

2017-10-15 16:32:36 WARN NumberNormalizer:81 - java.lang.NumberFormatException: Bad number put into wordToNumber. Word is: "1783.9million", originally part of "1,783.9million", piece # 0
edu.stanford.nlp.ie.NumberNormalizer.wordToNumber(NumberNormalizer.java:294)
edu.stanford.nlp.ie.NumberNormalizer.findNumbers(NumberNormalizer.java:636)
edu.stanford.nlp.ie.NumberNormalizer.findAndMergeNumbers(NumberNormalizer.java:725)
edu.stanford.nlp.time.TimeExpressionExtractorImpl.extractTimeExpressions(TimeExpressionExtractorImpl.java:189)
edu.stanford.nlp.time.TimeExpressionExtractorImpl.extractTimeExpressions(TimeExpressionExtractorImpl.java:183)
edu.stanford.nlp.time.TimeExpressionExtractorImpl.extractTimeExpressionCoreMaps(TimeExpressionExtractorImpl.java:114)
edu.stanford.nlp.time.TimeExpressionExtractorImpl.extractTimeExpressionCoreMaps(TimeExpressionExtractorImpl.java:104)
edu.stanford.nlp.ie.regexp.NumberSequenceClassifier.runSUTime(NumberSequenceClassifier.java:345)
edu.stanford.nlp.ie.regexp.NumberSequenceClassifier.classifyWithSUTime(NumberSequenceClassifier.java:143)
edu.stanford.nlp.ie.regexp.NumberSequenceClassifier.classifyWithGlobalInformation(NumberSequenceClassifier.java:106)
edu.stanford.nlp.ie.NERClassifierCombiner.recognizeNumberSequences(NERClassifierCombiner.java:369)
edu.stanford.nlp.ie.NERClassifierCombiner.classifyWithGlobalInformation(NERClassifierCombiner.java:312)
edu.stanford.nlp.ie.NERClassifierCombiner.classify(NERClassifierCombiner.java:299)
edu.stanford.nlp.ie.AbstractSequenceClassifier.classifyToCharacterOffsets(AbstractSequenceClassifier.java:618)
com.innefu.util.NERSentimentUtil.getStanford(NERSentimentUtil.java:382)

2017-10-15 16:32:36 WARN NumberNormalizer:81 - java.lang.NumberFormatException: Bad number put into wordToNumber. Word is: "356.8million", originally part of "356.8million", piece # 0
edu.stanford.nlp.ie.NumberNormalizer.wordToNumber(NumberNormalizer.java:294)
edu.stanford.nlp.ie.NumberNormalizer.findNumbers(NumberNormalizer.java:636)
edu.stanford.nlp.ie.NumberNormalizer.findAndMergeNumbers(NumberNormalizer.java:725)
edu.stanford.nlp.time.TimeExpressionExtractorImpl.extractTimeExpressions(TimeExpressionExtractorImpl.java:189)
edu.stanford.nlp.time.TimeExpressionExtractorImpl.extractTimeExpressions(TimeExpressionExtractorImpl.java:183)
edu.stanford.nlp.time.TimeExpressionExtractorImpl.extractTimeExpressionCoreMaps(TimeExpressionExtractorImpl.java:114)
edu.stanford.nlp.time.TimeExpressionExtractorImpl.extractTimeExpressionCoreMaps(TimeExpressionExtractorImpl.java:104)
edu.stanford.nlp.ie.regexp.NumberSequenceClassifier.runSUTime(NumberSequenceClassifier.java:345)
edu.stanford.nlp.ie.regexp.NumberSequenceClassifier.classifyWithSUTime(NumberSequenceClassifier.java:143)
edu.stanford.nlp.ie.regexp.NumberSequenceClassifier.classifyWithGlobalInformation(NumberSequenceClassifier.java:106)
edu.stanford.nlp.ie.NERClassifierCombiner.recognizeNumberSequences(NERClassifierCombiner.java:369)
edu.stanford.nlp.ie.NERClassifierCombiner.classifyWithGlobalInformation(NERClassifierCombiner.java:312)
edu.stanford.nlp.ie.NERClassifierCombiner.classify(NERClassifierCombiner.java:299)
edu.stanford.nlp.ie.AbstractSequenceClassifier.classifyToCharacterOffsets(AbstractSequenceClassifier.java:618)

2017-10-16 00:20:12 WARN NumberNormalizer:81 - java.lang.NumberFormatException: Bad number put into wordToNumber. Word is: "1.7billion", originally part of "1.7billion", piece # 0
edu.stanford.nlp.ie.NumberNormalizer.wordToNumber(NumberNormalizer.java:294)
edu.stanford.nlp.ie.NumberNormalizer.findNumbers(NumberNormalizer.java:636)
edu.stanford.nlp.ie.NumberNormalizer.findAndMergeNumbers(NumberNormalizer.java:725)
edu.stanford.nlp.time.TimeExpressionExtractorImpl.extractTimeExpressions(TimeExpressionExtractorImpl.java:189)
edu.stanford.nlp.time.TimeExpressionExtractorImpl.extractTimeExpressions(TimeExpressionExtractorImpl.java:183)
edu.stanford.nlp.time.TimeExpressionExtractorImpl.extractTimeExpressionCoreMaps(TimeExpressionExtractorImpl.java:114)
edu.stanford.nlp.time.TimeExpressionExtractorImpl.extractTimeExpressionCoreMaps(TimeExpressionExtractorImpl.java:104)
edu.stanford.nlp.ie.regexp.NumberSequenceClassifier.runSUTime(NumberSequenceClassifier.java:345)
edu.stanford.nlp.ie.regexp.NumberSequenceClassifier.classifyWithSUTime(NumberSequenceClassifier.java:143)
edu.stanford.nlp.ie.regexp.NumberSequenceClassifier.classifyWithGlobalInformation(NumberSequenceClassifier.java:106)
edu.stanford.nlp.ie.NERClassifierCombiner.recognizeNumberSequences(NERClassifierCombiner.java:369)
edu.stanford.nlp.ie.NERClassifierCombiner.classifyWithGlobalInformation(NERClassifierCombiner.java:312)
edu.stanford.nlp.ie.NERClassifierCombiner.classify(NERClassifierCombiner.java:299)
edu.stanford.nlp.ie.AbstractSequenceClassifier.classifyToCharacterOffsets(AbstractSequenceClassifier.java:618)

demongolem · 2018-01-23T17:33:04Z

I face the same sort of thing with Word is: ".6billion", originally part of ".6billion", piece # 0. Is there going to be any work done on this?
It looks like consecutive tokens are .6 and billion and then in getTokenText in ChunkAnnotationUtils, the StringBuilder is constructed without a delimiter such that .6billion gets passed to wordToNumber, probably the same as in the original issue reported.

…tead of 0.6 ... addresses #547

AngledLuffa added a commit that referenced this issue Jan 22, 2022

Update the number finding pattern to accommodate starting with .6 ins…

9e18314

…tead of 0.6 ... addresses #547

AngledLuffa added a commit that referenced this issue Feb 12, 2022

Update the number finding pattern to accommodate starting with .6 ins…

5ee2c39

…tead of 0.6 ... addresses #547

AngledLuffa added the fixed on dev label Feb 12, 2022

AngledLuffa closed this as completed Jul 22, 2022

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

java.lang.NumberFormatException: Bad number put into wordToNumber #547

java.lang.NumberFormatException: Bad number put into wordToNumber #547

dexception commented Oct 16, 2017

demongolem commented Jan 23, 2018 •

edited

java.lang.NumberFormatException: Bad number put into wordToNumber #547

java.lang.NumberFormatException: Bad number put into wordToNumber #547

Comments

dexception commented Oct 16, 2017

demongolem commented Jan 23, 2018 • edited

demongolem commented Jan 23, 2018 •

edited