I am a Japanese AI & Python developer specializing in Autonomous AI Agent Development and complex media workflow automation. The tools and agentic workflows showcased here are exclusively developed for students of my online development course, AI-Driven Academy. (AIエージェント開発と複雑なコンテンツ制作ワークフローの自動化を専門とするPythonデベロッパーです。ここで紹介するツールや自律型AIシステムは、私が運営するAI自動化開発講座の受講生向けに提供している専用ツールです。)
➡️ AI-Driven Academy (開発講座) Official Website
(自律型AIエージェント向け カスタムスキル&ワークフロー開発)
- Overview: I design and develop highly complex, strict execution pipelines for autonomous AI agents (like Antigravity). These agents can execute multi-step processes—from web research and automated scriptwriting to API-driven YouTube uploads—by strictly following modularized rules, validation gates, and human-in-the-loop approvals. (概要: Antigravityなどの自律型AIエージェントに対し、Webリサーチから台本生成、YouTube自動投稿に至る多段プロセスを、厳格なルールやバリデーションゲートに従って自律実行させるカスタムスキルおよびワークフローを開発しています。)
(多言語AI自動吹き替え・ローカライズシステム)
- Overview: A fully automated pipeline that translates and localizes videos. It handles everything from downloading and transcribing to translation, TTS voice generation, and audio ducking, outputting a complete localized video. (概要: 動画の文字起こしから翻訳、音声合成、BGMダッキング調整、字幕の焼き付けまでを一気通貫で行う完全自動のローカライズパイプラインです。)
(GPU高速文字起こし & YouTube動画制作フルオートメーション)
- Overview: An advanced transcription system using GPU-accelerated local processing (Whisper Turbo), paired with a next-generation creative tool that completely automates video production, exporting a ready-to-edit
.xmlproject file for DaVinci Resolve. (概要: ローカルGPUを活用した高速文字起こしシステムと、企画から音声・動的字幕・画像素材を生成しDaVinci Resolve用プロジェクトファイル(.xml)を自動出力する次世代動画生成システムです。)
(Note: The tools listed above are part of the curriculum for my paid course and are not available to the general public. Please visit the official website for details.) (注: 上記ツールは講座の教材の一部であり、一般公開はしておりません。詳細については公式サイトをご覧ください。)
- AI Agent Development: Autonomous Workflow Design, Strict LLM Prompting, Validation Gates, Human-in-the-loop execution
- Languages: Python
- AI / ML: OpenAI Whisper, Google Gemini (Pro/Flash/Vision), Advanced Prompt Engineering
- Media Processing: FFmpeg, DaVinci Resolve XML generation, PyAnnote (Speaker Diarization)
- API Integration: Google Cloud APIs, YouTube Data API, REST APIs