In-Memory Time Series Store

A high-performance, thread-safe, in-memory time series data store implementation with persistence capabilities. Built for efficient handling of time-based metric data with support for concurrent operations and tag-based filtering.

Features

Core Functionality

Fast Insertions: Optimized for high-throughput write operations (up to 10,000 data points/second)
Efficient Queries: Time range and tag-based filtering with minimal latency
Thread Safety: Full concurrent read/write support using ConcurrentSkipListMap
Persistence: Automatic data persistence to CSV files with recovery on restart
Memory Management: Configurable data retention (24 hours default) with automatic cleanup

Advanced Capabilities

Tag-Based Filtering: Support for complex multi-tag queries with AND logic
Duplicate Prevention: Automatic deduplication of identical data points
Graceful Shutdown: Ensures data persistence before application termination
Performance Monitoring: Built-in memory usage tracking and cleanup statistics

Performance Specifications

Metric	Target	Achieved
Write Throughput	10,000 ops/sec	Supported
Query Throughput	1,000 queries/sec	Supported
Maximum Metrics	100,000 unique metrics	Supported
Data Retention	24 hours (configurable)	Implemented
Concurrent Operations	Multi-threaded R/W	Thread-safe

Architecture

Data Model

DataPoint {
    long timestamp;        // Unix timestamp in milliseconds
    String metric;         // Metric name (e.g., "cpu.usage")
    double value;          // Numeric value
    Map<String,String> tags; // Key-value metadata
}

Storage Structure

Primary Index: ConcurrentSkipListMap<Long, List<DataPoint>> sorted by timestamp
Concurrency: CopyOnWriteArrayList for handling multiple data points per timestamp
Persistence: CSV format with automatic serialization/deserialization

Test Coverage

Unit + Performance/Stress Tests:

Basic insert/query operations
Time range filtering
Tag-based filtering
Multi-tag compound filters
Data cleanup and expiration
Persistence and recovery
Concurrent operations(500k records)
Performance under load(500k records)

Project Structure

com/interview/timeseries/
├── TimeSeriesStore.java           # Main interface
├── TimeSeriesStoreImpl.java       # Core implementation
├── DataPoint.java                 # Data model
├── Main.java                      # Demo application
├── TimeSeriesStoreTest.java       # Unit tests
└── TimeSeriesStorePerformanceTest.java # Performance tests

Configuration

Retention Policy

// Default: 24 hours
private final long EXPIRY_DURATION_MS = 24L * 60 * 60 * 1000;

// Cleanup frequency: Every hour
cleanerExecuter.scheduleAtFixedRate(..., 1, 1, TimeUnit.HOURS);

Persistence Settings

// CSV file location
private final String persistenceFile = "data_store.csv";

// File format: timestamp,metric,value,tag1=value1;tag2=value2

Performance Optimization

Write Performance

Data Structure: ConcurrentSkipListMap provides O(log n) insertions
Concurrency: Lock-free operations for high-throughput writes
Deduplication: Efficient duplicate detection using contains()

Query Performance

Time Range: O(log n) for range identification using subMap()
Filtering: Stream-based parallel processing
Memory: Minimal object allocation during queries

Memory Management

Automatic Cleanup: Background thread removes expired data
Lazy Loading: Data loaded from disk only on startup
Efficient Storage: Shared timestamp keys reduce memory overhead

Thread Safety

Concurrency Model

Write Operations: ConcurrentSkipListMap.compute() ensures atomic updates
Read Operations: Lock-free traversal with consistent snapshots
File Operations: Synchronized using diskLock for data integrity
Cleanup Operations: Coordinated with main data operations

Race Condition Prevention

Atomic insertion with duplicate checking
Thread-safe list implementations (CopyOnWriteArrayList)
Proper synchronization for disk I/O operations

Monitoring & Metrics

Built-in Monitoring

// Memory usage tracking
private void logMemory(String label) {
    Runtime runtime = Runtime.getRuntime();
    long used = (runtime.totalMemory() - runtime.freeMemory()) / (1024 * 1024);
    System.out.println("[" + label + "] Memory used: " + used + " MB");
}

// Cleanup statistics
System.out.println("Cleanup executed. Removed " + (before - after) + " expired timestamps.");

Data Persistence

Storage Format

# Format: timestamp,metric,value,tags
1620000000000,cpu.usage,45.2,host=server1;datacenter=us-west
1620000001000,memory.used,60.0,host=server1

Recovery Process

Startup: Automatically loads existing CSV data
Validation: Parses and validates each data point
Insertion: Rebuilds in-memory index structure
Cleanup: Removes expired entries post-recovery

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
gradle/wrapper		gradle/wrapper
src		src
.gitignore		.gitignore
README.md		README.md
build.gradle		build.gradle
data_store.csv		data_store.csv
generate_sample_data.py		generate_sample_data.py
gradlew		gradlew
gradlew.bat		gradlew.bat
settings.gradle		settings.gradle
timeseries_architecture_diagram.svg		timeseries_architecture_diagram.svg

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

In-Memory Time Series Store

Features

Core Functionality

Advanced Capabilities

Performance Specifications

Architecture

Data Model

Storage Structure

Test Coverage

Unit + Performance/Stress Tests:

Project Structure

Configuration

Retention Policy

Persistence Settings

Performance Optimization

Write Performance

Query Performance

Memory Management

Thread Safety

Concurrency Model

Race Condition Prevention

Monitoring & Metrics

Built-in Monitoring

Data Persistence

Storage Format

Recovery Process

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

In-Memory Time Series Store

Features

Core Functionality

Advanced Capabilities

Performance Specifications

Architecture

Data Model

Storage Structure

Test Coverage

Unit + Performance/Stress Tests:

Project Structure

Configuration

Retention Policy

Persistence Settings

Performance Optimization

Write Performance

Query Performance

Memory Management

Thread Safety

Concurrency Model

Race Condition Prevention

Monitoring & Metrics

Built-in Monitoring

Data Persistence

Storage Format

Recovery Process

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages