GitHub - provider-quest/provider-quest-spark: Using Apache Spark + Observable to collect analytics for Filecoin

provider-quest-spark

Data pipeline for Filecoin analytical data for https://provider.quest/

The following scripts live here:

scripts to collect data from "Provider.Quest" ObservableHQ notebooks and store the data as JSON files
a Pyspark script to run Apache Spark Structured Streaming, which ingests the JSON files continuously, and generates new JSON files with aggregations and mapping
scripts to publish aggregrated data to Textile Buckets for syndication

Documentation

https://observablehq.com/@jimpick/provider-quest-documentation?collection=@jimpick/provider-quest

License

Dual-licensed under MIT + Apache 2.0

Data is licenced as CC-BY-SA 3.0 unless otherwised noted.

Name		Name	Last commit message	Last commit date
Latest commit History 288 Commits
.github/workflows		.github/workflows
data		data
lily		lily
observable-archive		observable-archive
publisher		publisher
sql		sql
src		src
web3-storage-archive		web3-storage-archive
.gitignore		.gitignore
.vimrc		.vimrc
Dockerfile		Dockerfile
Makefile.deals		Makefile.deals
Makefile.deals-named-clients		Makefile.deals-named-clients
README.md		README.md
build-local-docker.sh		build-local-docker.sh
clean-by-miner-region.sh		clean-by-miner-region.sh
clean-client-names.sh		clean-client-names.sh
clean-production.sh		clean-production.sh
clean-staging.sh		clean-staging.sh
dump_averages.sh		dump_averages.sh
dump_averages_staging.sh		dump_averages_staging.sh
estuary-archive.sh		estuary-archive.sh
estuary-list-pins.sh		estuary-list-pins.sh
index-prerender-barchart.js		index-prerender-barchart.js
join-deals-by-region-daily.js		join-deals-by-region-daily.js
lotus-js-client-space-race-miner-power-scanner.tgz		lotus-js-client-space-race-miner-power-scanner.tgz
my-notebook.ojs		my-notebook.ojs
package.json		package.json
publish.sh		publish.sh
pyspark_main_deals.py		pyspark_main_deals.py
pyspark_main_legacy.py		pyspark_main_legacy.py
pyspark_main_power_only.py		pyspark_main_power_only.py
pyspark_main_production.py		pyspark_main_production.py
pyspark_main_staging.py		pyspark_main_staging.py
re-ingest-staging.sh		re-ingest-staging.sh
re-ingest.sh		re-ingest.sh
run-docker.sh		run-docker.sh
run-spark-deals.sh		run-spark-deals.sh
run-spark-legacy.sh		run-spark-legacy.sh
run-spark-production.sh		run-spark-production.sh
run-spark-staging.sh		run-spark-staging.sh
scan-asks-worker.sh		scan-asks-worker.sh
scan-asks.js		scan-asks.js
scan-asks.sh		scan-asks.sh
scan-deals-worker.sh		scan-deals-worker.sh
scan-deals.js		scan-deals.js
scan-deals.sh		scan-deals.sh
scan-dht-addrs-worker.sh		scan-dht-addrs-worker.sh
scan-dht-addrs.js		scan-dht-addrs.js
scan-dht-addrs.sh		scan-dht-addrs.sh
scan-geoip-lookups-worker.sh		scan-geoip-lookups-worker.sh
scan-geoip-lookups.sh		scan-geoip-lookups.sh
scan-ips-baidu.js		scan-ips-baidu.js
scan-ips-geolite2.js		scan-ips-geolite2.js
scan-miner-info-worker.sh		scan-miner-info-worker.sh
scan-miner-info.js		scan-miner-info.js
scan-miner-info.sh		scan-miner-info.sh
scan-miner-power.js		scan-miner-power.js
scan-miner-regions-locations.js		scan-miner-regions-locations.js
scan-multiaddrs-ips-worker.sh		scan-multiaddrs-ips-worker.sh
scan-multiaddrs-ips.js		scan-multiaddrs-ips.js
scan-multiaddrs-ips.sh		scan-multiaddrs-ips.sh
scan-power-worker.sh		scan-power-worker.sh
scan-power.sh		scan-power.sh
scan-provider-country-state-province.js		scan-provider-country-state-province.js
scan-regions-locations-worker.sh		scan-regions-locations-worker.sh
scan-regions-locations.sh		scan-regions-locations.sh
scan-synthetic-locations-worker.sh		scan-synthetic-locations-worker.sh
scan-synthetic-locations.js		scan-synthetic-locations.js
scan-synthetic-locations.sh		scan-synthetic-locations.sh
scan.sh		scan.sh
sorted-archive-json-files.js		sorted-archive-json-files.js
sync-code.sh		sync-code.sh
test-data-deal-pairs.sh		test-data-deal-pairs.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

provider-quest-spark

Documentation

License

About

Releases

Packages

Languages

provider-quest/provider-quest-spark

Folders and files

Latest commit

History

Repository files navigation

provider-quest-spark

Documentation

License

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages