Skip to content
View LETHEVIET's full-sized avatar
🎯
Focusing
🎯
Focusing

Highlights

  • Pro

Block or report LETHEVIET

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Please don't include any personal information such as legal names or email addresses. Maximum 100 characters, markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
LETHEVIET/README.md

Hi, I'm Viet The Le (LETHEVIET) 👋

AI Engineer • LLMs, RAG, Computer Vision • Ho Chi Minh City, Vietnam

LinkedIn · Email · GitHub

English • Tiếng Việt


About me

AI Engineer with 1.5+ years delivering production AI that ships and scales. I specialize in Large Language Models (LLMs), RAG systems, and real-time computer vision—turning research into user-centered products. I enjoy building reliable AI agents (LangChain/LangGraph), optimizing inference, and crafting experiences that feel instant and useful.

  • Recently: LangGraph-based enterprise Q&A agents with streaming reasoning and memory
  • Also: Real-time danger detection with YOLO + Triton across multi-camera feeds
  • Passion: Making AI accessible and practical for everyone

What I work with

  • LLM & Agents: LangChain, LangGraph, Prompt Engineering, OpenAI, Anthropic, Google Gemini
  • Retrieval & Memory: RAG, vector databases, evaluation/optimization
  • Vision: YOLO, PyTorch, TensorFlow, image processing pipelines
  • MLOps & Infra: Hugging Face, MLflow, Docker, Triton Inference Server, CI/CD, Azure
  • Software: Python (expert), JS/TS, FastAPI, React, REST, SQL, MongoDB, PostgreSQL, Git/GitHub

Experience highlights

  • Hitachi Digital Services Vietnam — AI Engineer (Jan 2024 – Present)

    • Built and deployed a LangGraph-powered enterprise Q&A system with agent memory and streaming responses; integrated with existing infra to reduce latency and improve answer quality.
    • Implemented real-time safety monitoring with YOLO + Triton across multiple camera feeds for a Hong Kong entertainment resort; productionized with MLOps best practices.
    • Prototyped HoloLens 2 AR assistant with integrated YOLO for tool/component recognition to boost factory floor efficiency and safety.
  • Cinnamon AI — AI Engineer Mentee (Jun 2024 – Sep 2024)

    • Hands-on with advanced AI techniques and scalable enterprise architectures; honed system design and best practices.
  • UIT ELO Lab — Research Student (Apr 2022 – Jan 2024)

    • Research on optimization and ML-driven problem solving; co-authored a SOICT2023 paper on complex routing optimization.

Featured projects

  • BearMind — AI Chat Extension (React/TS + Gemini) | Apr–May 2025
    Chrome extension for intelligent webpage and YouTube analysis with streaming responses and persistent conversation history.
    Repo: https://github.com/LETHEVIET/BearMind

  • English for The Blind (EFTB) — Accessible Learning Platform | Ongoing
    Volunteer project enabling AI-powered, TTS‑enhanced lessons for visually impaired learners.
    Live: https://eftb-org.github.io/

  • T5nyllama — Writing Assistant | Apr–May 2024
    Fine-tuned small LMs (Unsloth + Hugging Face) with a simple Gradio UI for polished English writing.
    Repo: https://github.com/LETHEVIET/t5nyllama


Certifications

  • Microsoft Certified: Azure AI Engineer Associate (Mar 2025)
  • Deep Learning Specialization — DeepLearning.AI (Mar 2024)
  • AI with Large Language Models — DeepLearning.AI (Dec 2023)
  • TensorFlow Developer Certificate — DeepLearning.AI (Jan 2023)
  • IELTS 6.5 (valid until Jan 2026)

Publication


Education

  • BSc in Computer Science — University of Information Technology (VNU-HCM)
    Honors Program (Top 5% of class), GPA: 8.53/10

GitHub at a glance

GitHub Stats Top Languages

GitHub Streak Profile Trophies


Get in touch

I’m open to collaborating on LLM agents, RAG pipelines, and real-time vision systems—especially projects with direct user impact or accessibility value.


Tiếng Việt

Xin chào, mình là Lê Thế Việt (LETHEVIET) 👋

Kỹ sư AI • LLMs, RAG, Thị giác máy tính • TP. Hồ Chí Minh, Việt Nam

LinkedIn · Email · GitHub


Giới thiệu

Kỹ sư AI với hơn 1.5 năm kinh nghiệm xây dựng và triển khai hệ thống AI vào sản xuất, tạo ra tác động rõ rệt cho doanh nghiệp. Mình tập trung vào Large Language Models (LLMs), hệ thống RAG và thị giác máy tính thời gian thực—chuyển hóa nghiên cứu thành sản phẩm thân thiện với người dùng. Mình thích thiết kế agent ổn định (LangChain/LangGraph), tối ưu suy luận và mang lại trải nghiệm “nhanh, hữu ích”.

  • Gần đây: Hệ thống Hỏi‑Đáp doanh nghiệp dùng LangGraph với bộ nhớ agent và suy luận/ phản hồi dạng streaming
  • Bên cạnh đó: Giám sát an toàn thời gian thực với YOLO + Triton trên nhiều luồng camera
  • Đam mê: Biến AI thành công cụ thực tế, dễ tiếp cận

Kỹ năng & công nghệ

  • LLM & Agents: LangChain, LangGraph, Prompt Engineering, OpenAI, Anthropic, Google Gemini
  • Truy xuất & Bộ nhớ: RAG, vector database, đánh giá/tối ưu mô hình
  • Thị giác máy tính: YOLO, PyTorch, TensorFlow, pipeline xử lý ảnh
  • MLOps & Hạ tầng: Hugging Face, MLflow, Docker, Triton Inference Server, CI/CD, Azure
  • Phần mềm: Python (chính), JS/TS, FastAPI, React, REST, SQL, MongoDB, PostgreSQL, Git/GitHub

Kinh nghiệm nổi bật

  • Hitachi Digital Services Vietnam — Kỹ sư AI (01/2024 – Nay)

    • Xây dựng và triển khai hệ thống Hỏi‑Đáp doanh nghiệp dùng LangGraph, có bộ nhớ agent và phản hồi streaming; tích hợp hạ tầng sẵn có, giảm độ trễ và nâng chất lượng câu trả lời.
    • Phát triển hệ thống giám sát an toàn thời gian thực với YOLO + Triton trên nhiều camera cho một khu nghỉ dưỡng tại Hồng Kông; vận hành theo chuẩn MLOps.
    • Prototype trợ lý AR trên HoloLens 2 tích hợp YOLO nhận diện dụng cụ/linh kiện, cải thiện hiệu quả và an toàn nhà máy.
  • Cinnamon AI — Mentee Kỹ sư AI (06/2024 – 09/2024)

    • Thực hành các kỹ thuật AI nâng cao và kiến trúc hệ thống quy mô doanh nghiệp; rèn luyện tư duy thiết kế hệ thống.
  • UIT ELO Lab — Nghiên cứu sinh (Bán thời gian, 04/2022 – 01/2024)

    • Nghiên cứu tối ưu hóa và giải bài toán bằng ML; đồng tác giả bài báo tại SOICT2023 về tối ưu định tuyến phức tạp.

Dự án tiêu biểu

  • BearMind — AI Chat Extension (React/TS + Gemini) | 04–05/2025
    Tiện ích Chrome phân tích trang web và YouTube với phản hồi dạng streaming, lưu lịch sử hội thoại bền vững.
    Repo: https://github.com/LETHEVIET/BearMind

  • English for The Blind (EFTB) — Nền tảng học tập tiếp cận | Đang triển khai
    Dự án thiện nguyện tích hợp AI TTS để tạo bài học âm thanh tự nhiên cho người khiếm thị.
    Live: https://eftb-org.github.io/

  • T5nyllama — Trợ lý viết tiếng Anh | 04–05/2024
    Fine‑tune các mô hình ngôn ngữ nhỏ (Unsloth + Hugging Face) với giao diện Gradio thân thiện.
    Repo: https://github.com/LETHEVIET/t5nyllama


Chứng chỉ

  • Microsoft Certified: Azure AI Engineer Associate (03/2025)
  • Deep Learning Specialization — DeepLearning.AI (03/2024)
  • AI with Large Language Models — DeepLearning.AI (12/2023)
  • TensorFlow Developer Certificate — DeepLearning.AI (01/2023)
  • IELTS 6.5 (hiệu lực đến 01/2026)

Công bố khoa học


Học vấn

  • Cử nhân Khoa học Máy tính — Trường ĐH Công nghệ Thông tin (ĐHQG‑HCM)
    Chương trình Chất lượng cao (Top 5% khóa), GPA: 8.53/10

Hoạt động GitHub

Thống kê GitHub Ngôn ngữ hàng đầu

Chuỗi đóng góp Thành tựu hồ sơ


Liên hệ

Mình sẵn sàng hợp tác về LLM agents, RAG pipelines và hệ thống thị giác máy tính thời gian thực—đặc biệt các dự án tạo tác động trực tiếp đến người dùng hoặc tính tiếp cận.

Pinned Loading

  1. BearMind Public

    Forked from imtiger/wxt-react-shadcn-tailwindcss-chrome-extension

    TypeScript

  2. SAAS-HC Public

    C++