ValueVec

ValueVec is a framework for learning word embeddings driven by external continuous values, such as similarity labels based on behavior, attributes, or measurements. Unlike traditional word2vec models that rely solely on linguistic context, ValueVec uses numeric supervision to capture more targeted relationships between terms.

Architecture Overview

ValueVec supports two training paradigms:

Model	Description	Use Case
manual_model/	Custom update logic based on cosine gradient approximations	For learning & debugging
nn_model/	PyTorch-based training using nn.Embedding + MSE loss	For real-world applications

Detailed explanation available in docs/architecture.md

Key Features

Continuous Supervision: Uses numeric similarity scores between words.
Cosine-Based Optimization: Directly optimizes cosine similarity between embeddings.
Manual + Neural Versions: Choose between interpretability or performance.
Custom Datasets: Generate value-supervised datasets from colors, fruits, animals, etc.
Visualizable: Easily inspect the embedding space with built-in PCA projection.

Installation

# Option 1: From PyPI
pip install valuevec

# Option 2: From source
git clone https://github.com/rdoku/valuevec.git
cd valuevec
pip install -e .

Quick Start

# Use an example script to train a value-driven embedding model
python examples/basic_usage.py

For custom training data, see docs/usage.md.

Example Applications

E-commerce – Group keywords with similar price influence
Finance – Cluster terms by correlation with financial metrics
Customer Modeling – Link descriptors to user value or conversion likelihood
Sentiment Analysis – Model emotional intensity beyond polarity

Project Layout

valuevec/
├── manual_model/    # Manual gradient updates
├── nn_model/        # PyTorch-based implementation
├── training_data/   # Data generation utilities
├── examples/        # Ready-to-run training and analysis
├── tests/           # Unit tests
├── docs/            # Markdown documentation

Documentation

docs/architecture.md – Neural vs. manual training
docs/usage.md – Training, inference, visualization
docs/CONTRIBUTING.md – Guidelines for contributing

Contributing

We welcome contributions! Get started with:

git checkout -b feature/your-feature

Then open a Pull Request. For details, see docs/CONTRIBUTING.md.

License

MIT License. See the LICENSE file for details.

Citation

If you use ValueVec in your work, please cite it as:

@software{valuevec2025,
  author = {Ronald Doku},
  title = {ValueVec: Value-Driven Word Embeddings},
  year = {2025},
  url = {https://github.com/rdoku/valuevec}
}

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
.github/workflows		.github/workflows
docs		docs
examples		examples
manual_model		manual_model
nn_model		nn_model
tests		tests
training_data		training_data
valuevecvenv		valuevecvenv
.gitignore		.gitignore
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
README.md		README.md
__init__.py		__init__.py
embeddings_visualization.png		embeddings_visualization.png
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

ValueVec

Architecture Overview

Key Features

Installation

Quick Start

Example Applications

Project Layout

Documentation

Contributing

License

Citation

About

Uh oh!

Releases

Packages

Uh oh!

Languages

License

rdoku/valuevec

Folders and files

Latest commit

History

Repository files navigation

ValueVec

Architecture Overview

Key Features

Installation

Quick Start

Example Applications

Project Layout

Documentation

Contributing

License

Citation

About

Resources

License

Contributing

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages