AI Engineer • LLMs, RAG, Computer Vision • Ho Chi Minh City, Vietnam
English • Tiếng Việt
AI Engineer with 1.5+ years delivering production AI that ships and scales. I specialize in Large Language Models (LLMs), RAG systems, and real-time computer vision—turning research into user-centered products. I enjoy building reliable AI agents (LangChain/LangGraph), optimizing inference, and crafting experiences that feel instant and useful.
- Recently: LangGraph-based enterprise Q&A agents with streaming reasoning and memory
- Also: Real-time danger detection with YOLO + Triton across multi-camera feeds
- Passion: Making AI accessible and practical for everyone
- LLM & Agents: LangChain, LangGraph, Prompt Engineering, OpenAI, Anthropic, Google Gemini
- Retrieval & Memory: RAG, vector databases, evaluation/optimization
- Vision: YOLO, PyTorch, TensorFlow, image processing pipelines
- MLOps & Infra: Hugging Face, MLflow, Docker, Triton Inference Server, CI/CD, Azure
- Software: Python (expert), JS/TS, FastAPI, React, REST, SQL, MongoDB, PostgreSQL, Git/GitHub
-
Hitachi Digital Services Vietnam — AI Engineer (Jan 2024 – Present)
- Built and deployed a LangGraph-powered enterprise Q&A system with agent memory and streaming responses; integrated with existing infra to reduce latency and improve answer quality.
- Implemented real-time safety monitoring with YOLO + Triton across multiple camera feeds for a Hong Kong entertainment resort; productionized with MLOps best practices.
- Prototyped HoloLens 2 AR assistant with integrated YOLO for tool/component recognition to boost factory floor efficiency and safety.
-
Cinnamon AI — AI Engineer Mentee (Jun 2024 – Sep 2024)
- Hands-on with advanced AI techniques and scalable enterprise architectures; honed system design and best practices.
-
UIT ELO Lab — Research Student (Apr 2022 – Jan 2024)
- Research on optimization and ML-driven problem solving; co-authored a SOICT2023 paper on complex routing optimization.
-
BearMind — AI Chat Extension (React/TS + Gemini) | Apr–May 2025
Chrome extension for intelligent webpage and YouTube analysis with streaming responses and persistent conversation history.
Repo: https://github.com/LETHEVIET/BearMind -
English for The Blind (EFTB) — Accessible Learning Platform | Ongoing
Volunteer project enabling AI-powered, TTS‑enhanced lessons for visually impaired learners.
Live: https://eftb-org.github.io/ -
T5nyllama — Writing Assistant | Apr–May 2024
Fine-tuned small LMs (Unsloth + Hugging Face) with a simple Gradio UI for polished English writing.
Repo: https://github.com/LETHEVIET/t5nyllama
- Microsoft Certified: Azure AI Engineer Associate (Mar 2025)
- Deep Learning Specialization — DeepLearning.AI (Mar 2024)
- AI with Large Language Models — DeepLearning.AI (Dec 2023)
- TensorFlow Developer Certificate — DeepLearning.AI (Jan 2023)
- IELTS 6.5 (valid until Jan 2026)
- Complex routing optimization at SOICT2023
DOI: https://doi.org/10.1145/3628797.3629024
- BSc in Computer Science — University of Information Technology (VNU-HCM)
Honors Program (Top 5% of class), GPA: 8.53/10
- Email: letheviet0708@gmail.com
- LinkedIn: https://linkedin.com/in/viet-le-1b2528289
- Location: Ho Chi Minh City, Vietnam
I’m open to collaborating on LLM agents, RAG pipelines, and real-time vision systems—especially projects with direct user impact or accessibility value.
Xin chào, mình là Lê Thế Việt (LETHEVIET) 👋
Kỹ sư AI • LLMs, RAG, Thị giác máy tính • TP. Hồ Chí Minh, Việt Nam
Kỹ sư AI với hơn 1.5 năm kinh nghiệm xây dựng và triển khai hệ thống AI vào sản xuất, tạo ra tác động rõ rệt cho doanh nghiệp. Mình tập trung vào Large Language Models (LLMs), hệ thống RAG và thị giác máy tính thời gian thực—chuyển hóa nghiên cứu thành sản phẩm thân thiện với người dùng. Mình thích thiết kế agent ổn định (LangChain/LangGraph), tối ưu suy luận và mang lại trải nghiệm “nhanh, hữu ích”.
- Gần đây: Hệ thống Hỏi‑Đáp doanh nghiệp dùng LangGraph với bộ nhớ agent và suy luận/ phản hồi dạng streaming
- Bên cạnh đó: Giám sát an toàn thời gian thực với YOLO + Triton trên nhiều luồng camera
- Đam mê: Biến AI thành công cụ thực tế, dễ tiếp cận
- LLM & Agents: LangChain, LangGraph, Prompt Engineering, OpenAI, Anthropic, Google Gemini
- Truy xuất & Bộ nhớ: RAG, vector database, đánh giá/tối ưu mô hình
- Thị giác máy tính: YOLO, PyTorch, TensorFlow, pipeline xử lý ảnh
- MLOps & Hạ tầng: Hugging Face, MLflow, Docker, Triton Inference Server, CI/CD, Azure
- Phần mềm: Python (chính), JS/TS, FastAPI, React, REST, SQL, MongoDB, PostgreSQL, Git/GitHub
-
Hitachi Digital Services Vietnam — Kỹ sư AI (01/2024 – Nay)
- Xây dựng và triển khai hệ thống Hỏi‑Đáp doanh nghiệp dùng LangGraph, có bộ nhớ agent và phản hồi streaming; tích hợp hạ tầng sẵn có, giảm độ trễ và nâng chất lượng câu trả lời.
- Phát triển hệ thống giám sát an toàn thời gian thực với YOLO + Triton trên nhiều camera cho một khu nghỉ dưỡng tại Hồng Kông; vận hành theo chuẩn MLOps.
- Prototype trợ lý AR trên HoloLens 2 tích hợp YOLO nhận diện dụng cụ/linh kiện, cải thiện hiệu quả và an toàn nhà máy.
-
Cinnamon AI — Mentee Kỹ sư AI (06/2024 – 09/2024)
- Thực hành các kỹ thuật AI nâng cao và kiến trúc hệ thống quy mô doanh nghiệp; rèn luyện tư duy thiết kế hệ thống.
-
UIT ELO Lab — Nghiên cứu sinh (Bán thời gian, 04/2022 – 01/2024)
- Nghiên cứu tối ưu hóa và giải bài toán bằng ML; đồng tác giả bài báo tại SOICT2023 về tối ưu định tuyến phức tạp.
-
BearMind — AI Chat Extension (React/TS + Gemini) | 04–05/2025
Tiện ích Chrome phân tích trang web và YouTube với phản hồi dạng streaming, lưu lịch sử hội thoại bền vững.
Repo: https://github.com/LETHEVIET/BearMind -
English for The Blind (EFTB) — Nền tảng học tập tiếp cận | Đang triển khai
Dự án thiện nguyện tích hợp AI TTS để tạo bài học âm thanh tự nhiên cho người khiếm thị.
Live: https://eftb-org.github.io/ -
T5nyllama — Trợ lý viết tiếng Anh | 04–05/2024
Fine‑tune các mô hình ngôn ngữ nhỏ (Unsloth + Hugging Face) với giao diện Gradio thân thiện.
Repo: https://github.com/LETHEVIET/t5nyllama
- Microsoft Certified: Azure AI Engineer Associate (03/2025)
- Deep Learning Specialization — DeepLearning.AI (03/2024)
- AI with Large Language Models — DeepLearning.AI (12/2023)
- TensorFlow Developer Certificate — DeepLearning.AI (01/2023)
- IELTS 6.5 (hiệu lực đến 01/2026)
- Tối ưu hóa định tuyến phức tạp — SOICT2023
DOI: https://doi.org/10.1145/3628797.3629024
- Cử nhân Khoa học Máy tính — Trường ĐH Công nghệ Thông tin (ĐHQG‑HCM)
Chương trình Chất lượng cao (Top 5% khóa), GPA: 8.53/10
- Email: letheviet0708@gmail.com
- LinkedIn: https://linkedin.com/in/viet-le-1b2528289
- Địa điểm: TP. Hồ Chí Minh, Việt Nam
Mình sẵn sàng hợp tác về LLM agents, RAG pipelines và hệ thống thị giác máy tính thời gian thực—đặc biệt các dự án tạo tác động trực tiếp đến người dùng hoặc tính tiếp cận.