CHOFF Ingestion System

A local system for categorizing, summarizing, embedding, and managing long conversations based on the CHOFF/PCHOFF framework. This system provides a modular multi-agent architecture for processing conversations with adaptive annotation and embedding strategies.

System Architecture

Core Components

Database Models (models/base.py)
- Conversation storage
- Segment management
- Annotation tracking
- Embedding cache
Services (services/)
- Embedding generation and management
- CHOFF/PCHOFF classification
- Pattern recognition
- Database management
Agents (agents/base.py)
- Ingestion Agent: Handles initial conversation processing
- Classification Agent: Manages CHOFF/PCHOFF classifications
- Pattern Agent: Handles pattern recognition and resonance
- Agent Orchestrator: Coordinates the multi-agent system
API (main.py)
- FastAPI-based REST interface
- Conversation processing endpoints
- Annotation retrieval
- Health monitoring

Hardware Requirements

GPU: AMD Radeon 5300M (supported)
RAM: 32GB
Storage: 0.5TB SSD
Processor: Intel i7

Setup Instructions

Create and activate a virtual environment:

python -m venv venv
source venv/bin/activate  # On Windows: venv\Scripts\activate

Install dependencies:

pip install -r requirements.txt

Run the application:

uvicorn main:app --reload

The API will be available at http://localhost:8000

API Endpoints

Process New Conversation

POST /conversations/
Content-Type: application/json

{
    "text": "Your conversation text here",
    "title": "Optional title"
}

Get Conversation Segments

GET /conversations/{conversation_id}/segments

Get Conversation Annotations

GET /conversations/{conversation_id}/annotations

Health Check

GET /health

CHOFF Framework Implementation

Classification System

Content Type Markers ([type:x])
Insight Classification ([insight:x])
Pattern Recognition (&pattern:x@)
Source Attribution ({source:x})
Resonance Tracking (&resonance:x@)

Processing Pipeline

Ingestion
- Text segmentation
- Initial embedding generation
- Conversation record creation
Classification
- CHOFF/PCHOFF marker assignment
- Insight type determination
- Implementation level assessment
Pattern Recognition
- Pattern identification
- Resonance tracking
- Cross-segment analysis

Resource Management

The system is optimized for local deployment with careful resource management:

Embedding Cache: Prevents redundant embedding computations
Batch Processing: Efficient handling of large conversations
Local Storage: SQLite database for simplified deployment
GPU Optimization: ONNX Runtime for optimized inference

Development

Running Tests

pytest tests/

Code Style

The project follows PEP 8 guidelines. Format code using:

black .

Future Enhancements

Enhanced NLP Processing
- Improved segmentation
- Advanced pattern recognition
- Semantic analysis
Resource Optimization
- Dynamic batch sizing
- Memory management
- GPU utilization optimization
UI Development
- Web interface for visualization
- Interactive annotation
- Pattern exploration tools

License

MIT License - See LICENSE file for details

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

CHOFF Ingestion System

System Architecture

Core Components

Hardware Requirements

Setup Instructions

API Endpoints

Process New Conversation

Get Conversation Segments

Get Conversation Annotations

Health Check

CHOFF Framework Implementation

Classification System

Processing Pipeline

Resource Management

Development

Running Tests

Code Style

Future Enhancements

License

About

Uh oh!

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
agents		agents
ancillary/appendix		ancillary/appendix
models		models
services		services
tests		tests
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
main.py		main.py
requirements.txt		requirements.txt

License

dd-dent/choff-ingestion

Folders and files

Latest commit

History

Repository files navigation

CHOFF Ingestion System

System Architecture

Core Components

Hardware Requirements

Setup Instructions

API Endpoints

Process New Conversation

Get Conversation Segments

Get Conversation Annotations

Health Check

CHOFF Framework Implementation

Classification System

Processing Pipeline

Resource Management

Development

Running Tests

Code Style

Future Enhancements

License

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages