GitHub - streamsets/datacollector-oss at https://githubhelp.com

What is StreamSets Data Collector?

StreamSets Data Collector is an enterprise grade, open source, continuous big data ingestion platform. It has an advanced and easy to use GUI that lets data engineers, data scientists, developers and data infrastructure teams easily create data pipelines in a fraction of the time typically required to create complex ingest scenarios. Out of the box, StreamSets Data Collector reads from and writes to a large number of connectors, including Amazon S3, Microsoft ADLS, Google cloud, JDBC-based, Hadoop and file-based, Kafka, and many others. In addition to a large number of pre-built stages to transform and process the data on the fly, you can also use Groovy, Jython, and JavaScript processors to write custom code.

To learn more, check out http://streamsets.com

Building StreamSets Data Collector

To build the StreamSets Data Collector from source code, click here for details.

License

StreamSets Data Collector is built on open source technologies, our code is licensed with the Apache License 2.0.

Getting Help

A good place to start is to check out http://streamsets.com/community. You can also various support options.

Name		Name	Last commit message	Last commit date
Latest commit History 10,728 Commits
aerospike-lib		aerospike-lib
apache-kafka_0_10-lib		apache-kafka_0_10-lib
apache-kafka_0_11-lib		apache-kafka_0_11-lib
apache-kafka_0_8_1-lib		apache-kafka_0_8_1-lib
apache-kafka_0_8_2-lib		apache-kafka_0_8_2-lib
apache-kafka_0_9-lib		apache-kafka_0_9-lib
apache-kafka_1_0-lib		apache-kafka_1_0-lib
apache-kafka_1_1-lib		apache-kafka_1_1-lib
apache-kafka_2_0-lib		apache-kafka_2_0-lib
apache-kafka_2_1-lib		apache-kafka_2_1-lib
apache-kafka_2_2-lib		apache-kafka_2_2-lib
apache-kafka_2_3-lib		apache-kafka_2_3-lib
apache-kafka_2_4-lib		apache-kafka_2_4-lib
apache-kafka_2_5-lib		apache-kafka_2_5-lib
apache-kafka_2_6-lib		apache-kafka_2_6-lib
apache-kafka_2_7-lib		apache-kafka_2_7-lib
apache-kudu-connection		apache-kudu-connection
apache-kudu_1_0-lib		apache-kudu_1_0-lib
apache-kudu_1_1-lib		apache-kudu_1_1-lib
apache-kudu_1_2-lib		apache-kudu_1_2-lib
apache-kudu_1_3-lib		apache-kudu_1_3-lib
apache-kudu_1_4-lib		apache-kudu_1_4-lib
apache-kudu_1_5-lib		apache-kudu_1_5-lib
apache-kudu_1_6-lib		apache-kudu_1_6-lib
apache-kudu_1_7-lib		apache-kudu_1_7-lib
apache-pulsar_2-lib		apache-pulsar_2-lib
apache-solr_6_1_0-lib		apache-solr_6_1_0-lib
aster-client		aster-client
aws-kinesis-connection		aws-kinesis-connection
aws-lib		aws-lib
aws-s3-connection		aws-s3-connection
aws-secrets-manager-credentialstore-lib		aws-secrets-manager-credentialstore-lib
aws-secrets-manager-credentialstore-protolib		aws-secrets-manager-credentialstore-protolib
aws-shared		aws-shared
aws-sqs-connection		aws-sqs-connection
aws-support		aws-support
azure-connection		azure-connection
azure-keyvault-credentialstore-lib		azure-keyvault-credentialstore-lib
azure-keyvault-credentialstore-protolib		azure-keyvault-credentialstore-protolib
azure-lib		azure-lib
basic-lib		basic-lib
bigtable-lib		bigtable-lib
bootstrap		bootstrap
cassandra-protolib		cassandra-protolib
cassandra_3-lib		cassandra_3-lib
cdh-spark_2_1-lib		cdh-spark_2_1-lib
cdh-spark_2_2-lib		cdh-spark_2_2-lib
cdh-spark_2_3-lib		cdh-spark_2_3-lib
cdh-spark_2_3_r3-lib		cdh-spark_2_3_r3-lib
cdh-spark_2_3_r4-lib		cdh-spark_2_3_r4-lib
cdh_5_10-lib		cdh_5_10-lib
cdh_5_11-lib		cdh_5_11-lib
cdh_5_12-lib		cdh_5_12-lib
cdh_5_13-lib		cdh_5_13-lib
cdh_5_14-lib		cdh_5_14-lib
cdh_5_15-lib		cdh_5_15-lib
cdh_5_16-lib		cdh_5_16-lib
cdh_5_2-lib		cdh_5_2-lib
cdh_5_3-lib		cdh_5_3-lib
cdh_5_4-lib		cdh_5_4-lib
cdh_5_5-lib		cdh_5_5-lib
cdh_5_7-lib		cdh_5_7-lib
cdh_5_8-lib		cdh_5_8-lib
cdh_5_9-lib		cdh_5_9-lib
cdh_6-stagelib-base		cdh_6-stagelib-base
cdh_6_0-lib		cdh_6_0-lib
cdh_6_1-lib		cdh_6_1-lib
cdh_6_2-lib		cdh_6_2-lib
cdh_6_3-lib		cdh_6_3-lib
cdh_kafka_1_2-lib		cdh_kafka_1_2-lib
cdh_kafka_1_3-lib		cdh_kafka_1_3-lib
cdh_kafka_2_0-lib		cdh_kafka_2_0-lib
cdh_kafka_2_1-lib		cdh_kafka_2_1-lib
cdh_kafka_3_0-lib		cdh_kafka_3_0-lib
cdh_kafka_3_1-lib		cdh_kafka_3_1-lib
cdh_kafka_4_1-lib		cdh_kafka_4_1-lib
cdh_spark_2_1_r1-lib		cdh_spark_2_1_r1-lib
cdp_7_1-lib		cdp_7_1-lib
cli		cli
client-api		client-api
cloudera-integration		cloudera-integration
cluster-bootstrap-api		cluster-bootstrap-api
cluster-bootstrap		cluster-bootstrap
cluster-common		cluster-common
cluster-connections/emr-cluster-connection		cluster-connections/emr-cluster-connection
cluster-hdfs-protolib		cluster-hdfs-protolib
cluster-kafka-protolib		cluster-kafka-protolib
common		common
commonlib		commonlib
container-common		container-common
container		container
couchbase-protolib		couchbase-protolib
couchbase_5-lib		couchbase_5-lib
crypto-lib		crypto-lib
cyberark-credentialstore-lib		cyberark-credentialstore-lib
cyberark-credentialstore-protolib		cyberark-credentialstore-protolib
databricks-ml-protolib		databricks-ml-protolib
databricks-ml_2-lib		databricks-ml_2-lib
datacollector-ui		datacollector-ui
dataformats-lib		dataformats-lib

License

streamsets/datacollector-oss

Folders and files

Latest commit

History