Architecture

Databus is based on pipelines and queues.

Each component of the pipeline is called a PipelineStep. It receives an input QueueItem and writes to an output QueueItem. The output QueueItem of one PipelineStep is the input QueueItem of the next PipelineStep.

The underlying queue can either be an in-memory queue or a distributed queue like rabbitmq.

One example of a queue would:

SqlGetSchemaPipelineStep (reads the schema from a set of sql queries)

SaveSchemaPipelineStep (saves the schema to files)

MappingUploadPipelineStep (uploads schema to elasticsearch)

SqlJobPipelineStep (processes a sqljob)

SqlBatchPipelineStep (creates batches of data)

SqlImportPipelineStep (reads data from sql queries)

ConvertDatabaseRowToJsonPipelineStep (converts data to json)

JsonDocumentMergerPipelineStep (merges json from multiple queries into one)

CreateBatchItemsPipelineStep (creates batch files to send to REST API)

SaveBatchPipelineStep (saves batch files)

FileUploadPipelineStep (uploads json to REST API)

Benefits:

The queues can be monitored independently of the PipelineStep.

Each PipelineStep has a defined queue item coming and going out so the QPipelineSteps are very pluggable

You can specify the number of instances of each PipelineStep to use multiple threads

The queues allow work to flow without each PipelineStep completing

The queue manager controls how much data is loaded into memory

Batching allows handling of large amounts of data by only loading small subsets in memory

We use Unity so various modules can be replaced and unit testing is easy

Running via console

You can run ElasticSearchSqlFeederConsole and pass it a xml file. There is a sample fhir.xml.

Running Fabric.Databus via REST API and Docker

Run the project (or get it from docker: curl -sSL https://healthcatalyst.github.io/InstallScripts/installfabricdatabus.txt | sh)

To test it: Get Status of running jobs: curl http://localhost:5000/jobstatus

You'll need a bearer token to validate and queue jobs. To get an access token (replace the url and client ID as needed, you'll need to obtain the client_secret): curl -k https://fabric-identity.azurewebsites.net/connect/token --data "client_id=fabric-installer&grant_type=client_credentials" --data-urlencode "client_secret"

To validate a job (make sure to include the bearer token in an authorization header - e.g. -H "Authorization:Bearer "): curl -XPOST http://localhost:5000/validate --data-binary @job.xml

To post a new job (make sure to include the bearer token in an authorization header - e.g. -H "Authorization:Bearer "): curl -XPOST http://localhost:5000/job --data-binary @cjob.xml

There is a sample config file in the configs/localhost folder.

Creating nested json

Patients table

PatientID	PatientLastNM
1	Jones
2	McConnell

PatientDiagnosis table

DiagnosisID	PatientID	DiagnosisCD
1	1	E11.3
2	1	E 13.4 !

Name		Name	Last commit message	Last commit date
Latest commit History 280 Commits
.vscode		.vscode
Fabric.DataBus.Client		Fabric.DataBus.Client
Fabric.Database.Shared.Tests		Fabric.Database.Shared.Tests
Fabric.Database.Testing		Fabric.Database.Testing
Fabric.Databus.API.Console		Fabric.Databus.API.Console
Fabric.Databus.API.Tests		Fabric.Databus.API.Tests
Fabric.Databus.API		Fabric.Databus.API
Fabric.Databus.Config		Fabric.Databus.Config
Fabric.Databus.Console		Fabric.Databus.Console
Fabric.Databus.Domain		Fabric.Databus.Domain
Fabric.Databus.ElasticSearch		Fabric.Databus.ElasticSearch
Fabric.Databus.Http		Fabric.Databus.Http
Fabric.Databus.Integration.Tests		Fabric.Databus.Integration.Tests
Fabric.Databus.Interfaces		Fabric.Databus.Interfaces
Fabric.Databus.Json.Tests		Fabric.Databus.Json.Tests
Fabric.Databus.Json		Fabric.Databus.Json
Fabric.Databus.JsonSchema		Fabric.Databus.JsonSchema
Fabric.Databus.Nuget.Console		Fabric.Databus.Nuget.Console
Fabric.Databus.PipelineRunner		Fabric.Databus.PipelineRunner
Fabric.Databus.PipelineSteps		Fabric.Databus.PipelineSteps
Fabric.Databus.ProgressMonitors		Fabric.Databus.ProgressMonitors
Fabric.Databus.QueueItems		Fabric.Databus.QueueItems
Fabric.Databus.Queues		Fabric.Databus.Queues
Fabric.Databus.Schema		Fabric.Databus.Schema
Fabric.Databus.Shared		Fabric.Databus.Shared
Fabric.Databus.SqlGenerator		Fabric.Databus.SqlGenerator
Fabric.Databus.TestApi		Fabric.Databus.TestApi
Fabric.Databus.TestHelper		Fabric.Databus.TestHelper
Fabric.Databus.ZipCodeToGeoCode		Fabric.Databus.ZipCodeToGeoCode
Fabric.Shared.PerformanceCounters.UnitTests		Fabric.Shared.PerformanceCounters.UnitTests
Fabric.Shared.PerformanceCounters		Fabric.Shared.PerformanceCounters
Fabric.Shared.ReliableHttp		Fabric.Shared.ReliableHttp
Fabric.Shared.ReliableSql		Fabric.Shared.ReliableSql
Fabric.Shared.Tests		Fabric.Shared.Tests
Fabric.Shared		Fabric.Shared
PipelineRunnerTests		PipelineRunnerTests
PipelineSteps.Tests		PipelineSteps.Tests
configs		configs
.gitignore		.gitignore
.whitesource		.whitesource
CreateDatabase.sql		CreateDatabase.sql
CreateTables.sql		CreateTables.sql
EntityRelationships.csv		EntityRelationships.csv
Fabric.Databus.sln		Fabric.Databus.sln
Fabric.Databus.sln.DotSettings		Fabric.Databus.sln.DotSettings
InitPatientDiagnoses.sql		InitPatientDiagnoses.sql
InitPatientLabs.sql		InitPatientLabs.sql
InitPatients.sql		InitPatients.sql
LICENSE		LICENSE
README.md		README.md
publishdocker.sh		publishdocker.sh
publishnuget.ps1		publishnuget.ps1
run.ps1		run.ps1
rundockerlocal.ps1		rundockerlocal.ps1
runfromdockerhub.ps1		runfromdockerhub.ps1

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Architecture

Running via console

Running Fabric.Databus via REST API and Docker

Creating nested json

About

Releases 2

Packages

Contributors 3

Languages

License

HealthCatalyst/Fabric.Databus

Folders and files

Latest commit

History

Repository files navigation

Architecture

Running via console

Running Fabric.Databus via REST API and Docker

Creating nested json

About

Resources

License

Stars

Watchers

Forks

Releases 2

Packages 0

Contributors 3

Languages

Packages