Merge branch 'master' into refactor/core_in_metas

VOICEVOX · Jun 23, 2024 · c9e3349 · c9e3349
2 parents 1cb5223 + 066dcf0
commit c9e3349
Show file tree

Hide file tree

Showing 3 changed files with 120 additions and 112 deletions.
diff --git a/voicevox_engine/app/application.py b/voicevox_engine/app/application.py
@@ -64,9 +64,9 @@ def generate_app(
     app = configure_middlewares(app, cors_policy_mode, allow_origin)
     app = configure_global_exception_handlers(app)
 
-    metas_store = MetasStore(speaker_info_dir, core_manager)
     resource_manager = ResourceManager(is_development())
     resource_manager.register_dir(speaker_info_dir)
+    metas_store = MetasStore(speaker_info_dir, core_manager, resource_manager)
 
     app.include_router(
         generate_tts_pipeline_router(
@@ -77,9 +77,7 @@ def generate_app(
     app.include_router(
         generate_preset_router(preset_manager, verify_mutability_allowed)
     )
-    app.include_router(
-        generate_speaker_router(resource_manager, metas_store, speaker_info_dir)
-    )
+    app.include_router(generate_speaker_router(resource_manager, metas_store))
     if engine_manifest.supported_features.manage_library:
         app.include_router(
             generate_library_router(library_manager, verify_mutability_allowed)

diff --git a/voicevox_engine/app/routers/character.py b/voicevox_engine/app/routers/character.py
@@ -1,18 +1,16 @@
 """話者情報機能を提供する API Router"""
 
-from pathlib import Path
-from typing import Annotated, Literal, TypeAlias
+from typing import Annotated
 
 from fastapi import APIRouter, Depends, HTTPException, Request
 from fastapi.responses import FileResponse
 from pydantic.json_schema import SkipJsonSchema
 
 from voicevox_engine.metas.Metas import Speaker, SpeakerInfo
-from voicevox_engine.metas.MetasStore import MetasStore, filter_characters_and_styles
+from voicevox_engine.metas.MetasStore import MetasStore, ResourceFormat
 from voicevox_engine.resource_manager import ResourceManager, ResourceManagerError
 
 RESOURCE_ENDPOINT = "_resources"
-ResourceFormat: TypeAlias = Literal["base64", "url"]
 
 
 async def _get_resource_baseurl(request: Request) -> str:
@@ -22,7 +20,6 @@ async def _get_resource_baseurl(request: Request) -> str:
 def generate_speaker_router(
     resource_manager: ResourceManager,
     metas_store: MetasStore,
-    speaker_info_dir: Path,
 ) -> APIRouter:
     """話者情報 API Router を生成する"""
     router = APIRouter(tags=["その他"])
@@ -43,113 +40,14 @@ def speaker_info(
         指定されたspeaker_uuidの話者に関する情報をjson形式で返します。
         画像や音声はresource_formatで指定した形式で返されます。
         """
-        return _speaker_info(
+        return metas_store.speaker_info(
             speaker_uuid=speaker_uuid,
             speaker_or_singer="speaker",
             core_version=core_version,
             resource_baseurl=resource_baseurl,
             resource_format=resource_format,
         )
 
-    # FIXME: この関数をどこかに切り出す
-    def _speaker_info(
-        speaker_uuid: str,
-        speaker_or_singer: Literal["speaker", "singer"],
-        core_version: str | None,
-        resource_baseurl: str,
-        resource_format: ResourceFormat,
-    ) -> SpeakerInfo:
-        # エンジンに含まれる話者メタ情報は、次のディレクトリ構造に従わなければならない：
-        # {root_dir}/
-        #   character_info/
-        #       {speaker_uuid_0}/
-        #           policy.md
-        #           portrait.png
-        #           icons/
-        #               {id_0}.png
-        #               {id_1}.png
-        #               ...
-        #           portraits/
-        #               {id_0}.png
-        #               {id_1}.png
-        #               ...
-        #           voice_samples/
-        #               {id_0}_001.wav
-        #               {id_0}_002.wav
-        #               {id_0}_003.wav
-        #               {id_1}_001.wav
-        #               ...
-        #       {speaker_uuid_1}/
-        #           ...
-
-        # 該当話者を検索する
-        characters = metas_store.characters(core_version)
-        speakers = filter_characters_and_styles(characters, speaker_or_singer)
-        speaker = next(
-            filter(lambda spk: spk.speaker_uuid == speaker_uuid, speakers), None
-        )
-        if speaker is None:
-            raise HTTPException(status_code=404, detail="該当する話者が見つかりません")
-
-        # 話者情報を取得する
-        try:
-            speaker_path = speaker_info_dir / speaker_uuid
-
-            # speaker policy
-            policy_path = speaker_path / "policy.md"
-            policy = policy_path.read_text("utf-8")
-
-            def _resource_str(path: Path) -> str:
-                resource_str = resource_manager.resource_str(
-                    path, "hash" if resource_format == "url" else "base64"
-                )
-                if resource_format == "base64":
-                    return resource_str
-                return f"{resource_baseurl}/{resource_str}"
-
-            # speaker portrait
-            portrait_path = speaker_path / "portrait.png"
-            portrait = _resource_str(portrait_path)
-
-            # スタイル情報を取得する
-            style_infos = []
-            for style in speaker.styles:
-                id = style.id
-
-                # style icon
-                style_icon_path = speaker_path / "icons" / f"{id}.png"
-                icon = _resource_str(style_icon_path)
-
-                # style portrait
-                style_portrait_path = speaker_path / "portraits" / f"{id}.png"
-                style_portrait = None
-                if style_portrait_path.exists():
-                    style_portrait = _resource_str(style_portrait_path)
-
-                # voice samples
-                voice_samples: list[str] = []
-                for j in range(3):
-                    num = str(j + 1).zfill(3)
-                    voice_path = speaker_path / "voice_samples" / f"{id}_{num}.wav"
-                    voice_samples.append(_resource_str(voice_path))
-
-                style_infos.append(
-                    {
-                        "id": id,
-                        "icon": icon,
-                        "portrait": style_portrait,
-                        "voice_samples": voice_samples,
-                    }
-                )
-        except (FileNotFoundError, ResourceManagerError):
-            msg = "追加情報が見つかりませんでした"
-            raise HTTPException(status_code=500, detail=msg)
-
-        spk_info = SpeakerInfo(
-            policy=policy, portrait=portrait, style_infos=style_infos
-        )
-        return spk_info
-
     @router.get("/singers")
     def singers(core_version: str | SkipJsonSchema[None] = None) -> list[Speaker]:
         """歌手情報の一覧を取得します"""
@@ -166,7 +64,7 @@ def singer_info(
         指定されたspeaker_uuidの歌手に関する情報をjson形式で返します。
         画像や音声はresource_formatで指定した形式で返されます。
         """
-        return _speaker_info(
+        return metas_store.speaker_info(
             speaker_uuid=speaker_uuid,
             speaker_or_singer="singer",
             core_version=core_version,

diff --git a/voicevox_engine/metas/MetasStore.py b/voicevox_engine/metas/MetasStore.py
@@ -2,18 +2,23 @@
 
 from dataclasses import dataclass
 from pathlib import Path
-from typing import Final, Literal
+from typing import Final, Literal, TypeAlias
 
+from fastapi import HTTPException
 from pydantic import BaseModel, Field
 
 from voicevox_engine.core.core_adapter import CoreCharacterStyle
 from voicevox_engine.core.core_initializer import CoreManager
 from voicevox_engine.metas.Metas import (
     Speaker,
+    SpeakerInfo,
     SpeakerStyle,
     SpeakerSupportedFeatures,
     StyleId,
 )
+from voicevox_engine.resource_manager import ResourceManager, ResourceManagerError
+
+ResourceFormat: TypeAlias = Literal["base64", "url"]
 
 
 def cast_styles(cores: list[CoreCharacterStyle]) -> list[SpeakerStyle]:
@@ -69,7 +74,12 @@ class MetasStore:
     話者やスタイルのメタ情報を管理する
     """
 
-    def __init__(self, engine_speakers_path: Path, core_manager: CoreManager) -> None:
+    def __init__(
+        self,
+        engine_speakers_path: Path,
+        core_manager: CoreManager,
+        resource_manager: ResourceManager,
+    ) -> None:
         """
         Parameters
         ----------
@@ -78,7 +88,9 @@ def __init__(self, engine_speakers_path: Path, core_manager: CoreManager) -> Non
         core_manager:
             コアマネージャー
         """
+        self._speakers_path = engine_speakers_path
         self._core_manager = core_manager
+        self._resource_manager = resource_manager
         # エンジンに含まれる各話者のメタ情報
         self._loaded_metas: dict[str, _EngineSpeaker] = {
             folder.name: _EngineSpeaker.model_validate_json(
@@ -117,6 +129,106 @@ def characters(self, core_version: str | None) -> list[Character]:
             )
         return characters
 
+    def speaker_info(
+        self,
+        speaker_uuid: str,
+        speaker_or_singer: Literal["speaker", "singer"],
+        core_version: str | None,
+        resource_baseurl: str,
+        resource_format: ResourceFormat,
+    ) -> SpeakerInfo:
+        # キャラクター情報は以下のディレクトリ構造に従わなければならない。
+        # {engine_speakers_path}/
+        #     {speaker_uuid_0}/
+        #         policy.md
+        #         portrait.png
+        #         icons/
+        #             {id_0}.png
+        #             {id_1}.png
+        #             ...
+        #         portraits/
+        #             {id_0}.png
+        #             {id_1}.png
+        #             ...
+        #         voice_samples/
+        #             {id_0}_001.wav
+        #             {id_0}_002.wav
+        #             {id_0}_003.wav
+        #             {id_1}_001.wav
+        #             ...
+        #     {speaker_uuid_1}/
+        #         ...
+
+        # 該当話者を検索する
+        characters = self.characters(core_version)
+        speakers = filter_characters_and_styles(characters, speaker_or_singer)
+        speaker = next(
+            filter(lambda spk: spk.speaker_uuid == speaker_uuid, speakers), None
+        )
+        if speaker is None:
+            # FIXME: HTTPExceptionはこのファイルとドメインが合わないので辞める
+            raise HTTPException(status_code=404, detail="該当する話者が見つかりません")
+
+        # 話者情報を取得する
+        try:
+            speaker_path = self._speakers_path / speaker_uuid
+
+            # speaker policy
+            policy_path = speaker_path / "policy.md"
+            policy = policy_path.read_text("utf-8")
+
+            def _resource_str(path: Path) -> str:
+                resource_str = self._resource_manager.resource_str(
+                    path, "hash" if resource_format == "url" else "base64"
+                )
+                if resource_format == "base64":
+                    return resource_str
+                return f"{resource_baseurl}/{resource_str}"
+
+            # speaker portrait
+            portrait_path = speaker_path / "portrait.png"
+            portrait = _resource_str(portrait_path)
+
+            # スタイル情報を取得する
+            style_infos = []
+            for style in speaker.styles:
+                id = style.id
+
+                # style icon
+                style_icon_path = speaker_path / "icons" / f"{id}.png"
+                icon = _resource_str(style_icon_path)
+
+                # style portrait
+                style_portrait_path = speaker_path / "portraits" / f"{id}.png"
+                style_portrait = None
+                if style_portrait_path.exists():
+                    style_portrait = _resource_str(style_portrait_path)
+
+                # voice samples
+                voice_samples: list[str] = []
+                for j in range(3):
+                    num = str(j + 1).zfill(3)
+                    voice_path = speaker_path / "voice_samples" / f"{id}_{num}.wav"
+                    voice_samples.append(_resource_str(voice_path))
+
+                style_infos.append(
+                    {
+                        "id": id,
+                        "icon": icon,
+                        "portrait": style_portrait,
+                        "voice_samples": voice_samples,
+                    }
+                )
+        except (FileNotFoundError, ResourceManagerError):
+            # FIXME: HTTPExceptionはこのファイルとドメインが合わないので辞める
+            msg = "追加情報が見つかりませんでした"
+            raise HTTPException(status_code=500, detail=msg)
+
+        spk_info = SpeakerInfo(
+            policy=policy, portrait=portrait, style_infos=style_infos
+        )
+        return spk_info
+
     def talk_characters(self, core_version: str | None) -> list[Speaker]:
         """話せるキャラクターの情報の一覧を取得する。"""
         return filter_characters_and_styles(self.characters(core_version), "speaker")