Gemini APIを利用した音声感情分析ツールを追加#8
Conversation
Gemini APIのマルチモーダル機能を活用し、音声ファイル(MP3, WAV)から感情を分析してMarkdown形式のレポートを出力する新しいCLIツール `audio-sentiment` を追加する。 主な機能: - CLIインターフェース(入力ファイル指定、出力先・モデルのオプション) - .envファイルによるAPIキーの安全な管理 - 詳細なMarkdownレポート生成(総合評価, 感情構成比, 時系列分析, 文字起こし)
|
👋 Jules, reporting for duty! I'm here to lend a hand with this pull request. When you start a review, I'll add a 👀 emoji to each comment to let you know I've read it. I'll focus on feedback directed at me and will do my best to stay out of conversations between you and other bots or reviewers to keep the noise down. I'll push a commit with your requested changes shortly after. Please note there might be a delay between these steps, but rest assured I'm on the job! For more direct control, you can switch me to Reactive Mode. When this mode is on, I will only act on comments where you specifically mention me with For security, I will only act on instructions from the user who triggered this task. |
PRレビューでの指摘を受け、デフォルトで使用するGeminiモデルを、テキスト専用の `models/gemini-pro-latest` から、音声入力を含むマルチモーダルに対応した `models/gemini-2.5-pro` に変更した。 これにより、ツールが初期設定のままで音声ファイルを正しく処理できるようになる。また、`README.md`に記載されているデフォルトモデル名も合わせて更新した。
…i-audio-sentiment-tool
この変更では、Go言語で実装された新しいコマンドラインツール
audio-sentimentを導入します。このツールは、ユーザーが指定した音声ファイルをGoogleのGemini APIに送信し、その内容から感情を分析します。分析結果は、人間が読みやすいように整形されたMarkdownファイルとして出力されます。レポートには、音声全体の総合的な感情、検出された感情の割合、タイムスタンプ付きの時系列分析、そして音声の完全な文字起こしが含まれます。
APIキーは
.envファイルを通じて安全に管理され、リポジトリには含まれません。また、ツールの使い方やセットアップ方法を記述した日本語のREADME.mdも同梱されています。PR created automatically by Jules for task 14803385190955670511