Synthetic data generation for graph ML experiments

This codebase generates interesting graphs for ML experiments. We've currently focussed on the challenges of review prediction, given three types of nodes:

Product
Person
Review

A review has a score, which is the goal of each experiment to determine.

There are a range of datasets you can generate:

experiment_0
experiment_1
experiment_2
experiment_3
experiment_4
experiment_5
article_0 - companion to the article "An introduction to machine learning on graph databases"
article_1 - companion to the article "Review prediction using graph data in Neo4j and an embedding in Tensorflow"

HOWTO generate data

To generate a dataset (for example, article_0) run the following in this repository's root directory:

python3 -m venv env
source env/bin/activate
pip3 install -r requirements.txt
./generate.py --dataset article_0

Name		Name	Last commit message	Last commit date
Latest commit History 27 Commits
basic_types		basic_types
config		config
data_sets		data_sets
graph_io		graph_io
.DS_Store		.DS_Store
.gitignore		.gitignore
LICENSE		LICENSE
MANIFEST		MANIFEST
README.md		README.md
generate.py		generate.py
requirements.txt		requirements.txt
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Synthetic data generation for graph ML experiments

HOWTO generate data

About

Releases

Packages

Contributors 3

Languages

License

Octavian-ai/synthetic-graph-data

Folders and files

Latest commit

History

Repository files navigation

Synthetic data generation for graph ML experiments

HOWTO generate data

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Packages