fscrawler does not recover when it lost communication with elasticsearch #255

twindragons1987 · 2016-12-27T13:42:27Z

Hi
I am trying to run fscrawler on my local machine to read data that has been extracted from readpst command and sending it for elasticsearh. It works fine for some iterations and then it gives following error and doesn't recover. Can some one suggest if I am doing something wrong

17:06:22,255 DEBUG [f.p.e.c.f.FsCrawlerImpl] Looking for removed files in [/MY_PATH/]...
17:06:22,255 TRACE [f.p.e.c.f.FsCrawlerImpl] Querying elasticsearch for files in dir [path.encoded:7fbc1f13665e5067aa6550ad5b4a6ba5]
17:06:22,255 WARN  [f.p.e.c.f.FsCrawlerImpl] Error while indexing content from [java.io.IOException: no active node found. Start an elasticsearch cluster first! Expecting something running at [localhost:9200], /MY_PATH]
17:06:22,255 DEBUG [f.p.e.c.f.FsCrawlerImpl] Fs crawler is going to sleep for 15m
17:06:26,295 DEBUG [f.p.e.c.f.c.BulkProcessor] Going to execute new bulk composed of 14 actions
17:06:26,295 WARN  [f.p.e.c.f.c.BulkProcessor] Error executing bulk
java.io.IOException: no active node found. Start an elasticsearch cluster first! Expecting something running at [localhost:9200]
at fr.pilato.elasticsearch.crawler.fs.client.ElasticsearchClient.findNextNode(ElasticsearchClient.java:114) ~[fscrawler-2.1.jar:?]
	at fr.pilato.elasticsearch.crawler.fs.client.ElasticsearchClient.bulk(ElasticsearchClient.java:243) ~[fscrawler-2.1.jar:?]
	at fr.pilato.elasticsearch.crawler.fs.client.BulkProcessor.execute(BulkProcessor.java:136) ~[fscrawler-2.1.jar:?]
	at fr.pilato.elasticsearch.crawler.fs.client.BulkProcessor.executeWhenNeeded(BulkProcessor.java:123) ~[fscrawler-2.1.jar:?]
	at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:511) [?:1.8.0_111]
	at java.util.concurrent.FutureTask.runAndReset(FutureTask.java:308) [?:1.8.0_111]
	at java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.access$301(ScheduledThreadPoolExecutor.java:180) [?:1.8.0_111]
	at java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.run(ScheduledThreadPoolExecutor.java:294) [?:1.8.0_111]
	at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142) [?:1.8.0_111]
	at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617) [?:1.8.0_111]
	at java.lang.Thread.run(Thread.java:745) [?:1.8.0_111]

The text was updated successfully, but these errors were encountered:

dadoonet · 2016-12-27T19:42:36Z

In 2.2, I changed from internal home made REST client to the official REST client (#203).
It might have a better exception handling.

Any chance you can try the 2.2-SNAPSHOT version?

dadoonet · 2016-12-31T00:18:10Z

Closing for now. Feel free to reopen if you can see that problem again with 2.2.

twindragons1987 · 2017-01-05T08:51:58Z

Can you please provide me with a link to 2.2?

dadoonet · 2017-01-05T08:54:24Z

Sure. The README gives it:

From https://oss.sonatype.org/content/repositories/snapshots/fr/pilato/elasticsearch/crawler/fscrawler/2.2-SNAPSHOT/
Latest build: https://oss.sonatype.org/content/repositories/snapshots/fr/pilato/elasticsearch/crawler/fscrawler/2.2-SNAPSHOT/fscrawler-2.2-20170104.191528-56.zip

HTH

c4tom · 2017-03-23T12:27:53Z

I have, maybe, same problem (i am using last version)

09:21:45,826 WARN  [f.p.e.c.f.c.BulkProcessor] Error executing bulk
java.io.IOException: listener timeout after waiting for [30000] ms
	at org.elasticsearch.client.RestClient$SyncResponseListener.get(RestClient.java:617) ~[jar:rsrc:rest-5.2.2.jar!/:?]
	at org.elasticsearch.client.RestClient.performRequest(RestClient.java:212) ~[jar:rsrc:rest-5.2.2.jar!/:?]
	at org.elasticsearch.client.RestClient.performRequest(RestClient.java:184) ~[jar:rsrc:rest-5.2.2.jar!/:?]
	at fr.pilato.elasticsearch.crawler.fs.client.ElasticsearchClient.bulk(ElasticsearchClient.java:149) ~[rsrc:./:?]
	at fr.pilato.elasticsearch.crawler.fs.client.BulkProcessor.execute(BulkProcessor.java:157) [rsrc:./:?]
	at fr.pilato.elasticsearch.crawler.fs.client.BulkProcessor.executeIfNeeded(BulkProcessor.java:137) [rsrc:./:?]
	at fr.pilato.elasticsearch.crawler.fs.client.BulkProcessor.internalAdd(BulkProcessor.java:130) [rsrc:./:?]
	at fr.pilato.elasticsearch.crawler.fs.client.BulkProcessor.add(BulkProcessor.java:118) [rsrc:./:?]
	at fr.pilato.elasticsearch.crawler.fs.client.BulkProcessor.add(BulkProcessor.java:86) [rsrc:./:?]
	at fr.pilato.elasticsearch.crawler.fs.FsCrawlerImpl$FSParser.esIndex(FsCrawlerImpl.java:719) [rsrc:./:?]
	at fr.pilato.elasticsearch.crawler.fs.FsCrawlerImpl$FSParser.esIndex(FsCrawlerImpl.java:703) [rsrc:./:?]
	at fr.pilato.elasticsearch.crawler.fs.FsCrawlerImpl$FSParser.indexFile(FsCrawlerImpl.java:596) [rsrc:./:?]
	at fr.pilato.elasticsearch.crawler.fs.FsCrawlerImpl$FSParser.addFilesRecursively(FsCrawlerImpl.java:386) [rsrc:./:?]
	at fr.pilato.elasticsearch.crawler.fs.FsCrawlerImpl$FSParser.addFilesRecursively(FsCrawlerImpl.java:405) [rsrc:./:?]
	at fr.pilato.elasticsearch.crawler.fs.FsCrawlerImpl$FSParser.run(FsCrawlerImpl.java:273) [rsrc:./:?]
	at java.lang.Thread.run(Thread.java:745) [?:1.8.0_66]

dadoonet · 2017-03-23T12:44:11Z

@candido1212 In which context is this happening? FSCrawler was running and was able to index then suddenly started to fail?
Anything in elasticsearch logs?

If elasticsearch restarts, is FSCrawler able to recover?

Would help a lot if you can provide more details. Feel free to open another issue.

dadoonet self-assigned this Dec 27, 2016

dadoonet added the bug For confirmed bugs label Dec 27, 2016

dadoonet added this to the 2.2 milestone Dec 27, 2016

dadoonet changed the title ~~fscrawler crashes and does not recover~~ fscrawler does not recover when it lost communication with elasticsearch Dec 27, 2016

dadoonet closed this as completed Dec 31, 2016

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

fscrawler does not recover when it lost communication with elasticsearch #255

fscrawler does not recover when it lost communication with elasticsearch #255

twindragons1987 commented Dec 27, 2016 •

edited by dadoonet

Loading

dadoonet commented Dec 27, 2016

dadoonet commented Dec 31, 2016

twindragons1987 commented Jan 5, 2017

dadoonet commented Jan 5, 2017

c4tom commented Mar 23, 2017

dadoonet commented Mar 23, 2017

fscrawler does not recover when it lost communication with elasticsearch #255

fscrawler does not recover when it lost communication with elasticsearch #255

Comments

twindragons1987 commented Dec 27, 2016 • edited by dadoonet Loading

dadoonet commented Dec 27, 2016

dadoonet commented Dec 31, 2016

twindragons1987 commented Jan 5, 2017

dadoonet commented Jan 5, 2017

c4tom commented Mar 23, 2017

dadoonet commented Mar 23, 2017

twindragons1987 commented Dec 27, 2016 •

edited by dadoonet

Loading