GenCEO

Follow

🤒

Out sick

Mo Chia GenCEO

🤒

Out sick

Follow

Graduate student working on Multimodal LLMs: vision-language alignment, multimodal RAG, and lightweight evaluation.

1 follower · 24 following

M.S. Student @ University of Washington
Seattle, WA
19:43 (UTC +08:00)
https://Heatmap.io

GenCEO/README.md

Mo Chia

Graduate student focused on Multimodal LLMs.

Research Focus

Vision-language alignment and grounding
Multimodal RAG for document intelligence
Lightweight and reproducible VLM evaluation
Multimodal web-agent trajectory analysis

Growth Timeline (2024-2026)

2024: Built small prototypes for PDF-based multimodal retrieval and chunking.
2025: Standardized evaluation workflow and modality-aware metrics.
2026: Expanded to agent trajectory analytics and benchmark-oriented reporting.

Featured Open Source Projects

mm-rag-playbook: multimodal RAG patterns for PDF-like documents.
vlm-eval-mini: compact evaluation harness for vision-language models.
webagent-trajectory-lab: trajectory analytics toolkit for visual web agents.

Current Priorities

Better multimodal retrieval reranking
Robust science/engineering benchmark protocols
Data-efficient adaptation for medium-size VLMs

Reading Themes

Long-context multimodal reasoning
Agentic planning with visual grounding
Efficient evaluation and error taxonomy

Pinned Loading

go-dialogflow-integration go-dialogflow-integration Public

Integration of Google's Dialogflow NLP services with Go. This project does not include fulfillment.

Go 1
vlm-eval-mini vlm-eval-mini Public

Tiny reproducible evaluation harness for vision-language models

Python 1
webagent-trajectory-lab webagent-trajectory-lab Public

Trajectory analytics toolkit for visual web agents

Python 1
mm-rag-playbook mm-rag-playbook Public

Lightweight multimodal RAG patterns for PDF-like documents

Python 1
DataArcTech/DataArc-SynData-Toolkit DataArcTech/DataArc-SynData-Toolkit Public

Synthetic Data Generation Platform By DataArcTech

Python 1.6k 36
Kail-Fu/InterviewOS Kail-Fu/InterviewOS Public

Replace coding puzzles with real-work simulations.

JavaScript 512 76