In [None]:
from langchain_core.prompts import ChatPromptTemplate
from langchain_ollama.llms import OllamaLLM
from typing import Dict

class NonLogin():
    def __init__(self):
        self.start_model()
        self.prompts()
        self.initialize()
    def start_model(self):
        self.model = OllamaLLM(model="qwen2.5:3b", base_url = "http://localhost:11434")
    def prompts(self):
        self.best_route = """
            你是太原市的旅游助手，用户想了解{place}的{info}信息。

            请按照以下要求生成回答：
            - 如果用户询问的是“最佳路线”或“游览顺序”，请推荐一个合理的游览线路。
            - 使用“→”符号连接各个景点，展示清晰的游览顺序。
            - 路线应尽量连贯，反映出地理位置或文化逻辑上的合理性。
            - 不要添加多余的解释或段落，只输出路线内容本身。

            示例输出格式（仅供参考）：
            晋祠南门牌坊 → 飞龙阁 → 龙亭照壁图壁 → 水镜台 → 航取 → 品道讲堂 → 圣母殿...

            请根据{place}实际情况生成类似的路线内容。

            回答：
            """
        self.Traffic_information = """
            你是太原市的旅游助手，负责根据用户的问题提供专业且详细的指导。
            用户想了解关于{place}的{info}信息。

            请严格按照以下格式和内容要求进行回答，并使用中文输出：

            1. 回答必须分为以下三个固定部分，且顺序一致：
            - 公交线路信息
            - 自驾信息
            - 其他信息

            2. 每个部分需包含以下具体内容（如有）：

            【公交线路信息】
            - 公交线路编号（例如：10路、308路等）
            - 起点与终点名称
            - 主要经过站点
            - 首末班车时间（注明夏季和冬季时间）
            - 全程票价（注明票价金额及是否单一票制）

            【自驾信息】
            - 推荐行车路线（起点→目的地，注明主干道名称）
            - 预计行驶时间（例如：30–45分钟）
            - 停车场位置（距离景点多少米）
            - 停车容量（可容纳多少车辆）
            - 收费标准（按次或按天，并写金额）

            【其他信息】
            - 是否免费开放、特别活动或展览说明
            - 周边推荐景点或设施（如公园、餐厅）
            - 建议事项或出行提示

            3. 如果某部分没有相关信息，请明确写出“暂无相关信息”。

            4. 内容需简明、客观、格式统一，使用项目符号“–”列出每条内容。

            回答：
            """
        self.template_culinary_specialities = """
            你是太原市的旅游助手，负责根据用户的问题提供专业且详细的指导。
            用户想了解关于{place}的{info}信息。

            请根据以下要求作答：
            - 使用清晰的项目符号格式组织内容
            - 若涉及交通，请包括：公交线路编号、出发地与到达地、经过站点、运营时间（夏季/冬季）、票价等详细信息
            - 若涉及停车场或自驾信息，请提供：停车位置、容量、占地面积、收费标准等具体说明
            - 回答应简洁明了，信息完整，格式统一

            回答：
            """

        self.cultural_introduction = """
            你是太原市的旅游助手，负责根据用户的问题提供指导。
            用户想了解关于{place}的{info}信息。
            你的回答应当简明且具有专业性。
            回答：
            """
        self.Sightseeing_tours = """
            你是太原市的旅游助手，负责根据用户的问题提供指导。
            用户想了解关于{place}的{info}信息。
            你的回答应当简明且具有专业性。
            回答：
            """
        self.prompt_best_route = ChatPromptTemplate.from_template(self.best_route)
        self.prompt_Traffic_information = ChatPromptTemplate.from_template(self.Traffic_information)
        self.prompt_culinary_specialities = ChatPromptTemplate.from_template(self.template_culinary_specialities)
        self.prompt_cultural_introduction = ChatPromptTemplate.from_template(self.cultural_introduction)
        self.prompt_Sightseeing_tours = ChatPromptTemplate.from_template(self.Sightseeing_tours)

    def initialize(self):
        self.chain_cultural_introduction = self.prompt_cultural_introduction | self.model
        self.chain_best_route = self.prompt_best_route | self.model
        self.chain_prompt_Sightseeing_tours = self.prompt_Sightseeing_tours | self.model
        self.chain_culinary_specialities = self.prompt_culinary_specialities | self.model
        self.chain_Traffic_information = self.prompt_Traffic_information | self.model
    def invoke(self, place, info):
        if place == "文化介绍":
            return self.chain_cultural_introduction.invoke({"info": info, "place": place})
        elif place == "最佳路线":
            return self.chain_best_route.invoke({"info": info, "place": place})
        elif place == "景点游览":
            return self.chain_prompt_Sightseeing_tours.invoke({"info": info, "place": place})
        elif place == "特色美食":
            return self.chain_culinary_specialities.invoke({"info": info, "place": place})
        elif place == "交通信息":
            return self.chain_Traffic_information.invoke({"info": info, "place": place})
        else:
            return self.chain_prompt_Sightseeing_tours.invoke({"info": info, "place": place})

In [None]:
non_login = NonLogin()

In [None]:
non_login.invoke("景点游览","景点游览")

In [None]:
import torch
print("CUDA Available:", torch.cuda.is_available())

In [None]:

import pyaudio
from funasr import AutoModel
from funasr.utils.postprocess_utils import rich_transcription_postprocess

In [None]:
from funasr import AutoModel


class SpeechRecognitionModel:
    def __init__(self):
        self.model = None
        self.load_model()
    
    def load_model(self):
        """Initialize the ASR model with specified configurations"""
        self.model = AutoModel(
            model=r"D:\Backend_Algorithm_travel_assistance\downloaded_models\paraformer-zh", 
            model_revision="v2.0.4",
            vad_model=r"D:\Backend_Algorithm_travel_assistance\downloaded_models\fsmn-vad", 
            vad_model_revision="v2.0.4",
            punc_model=r"D:\Backend_Algorithm_travel_assistance\downloaded_models\ct-punc", 
            punc_model_revision="v2.0.4"
        )

    def transcribe(self, audio_data):
        """Transcribe audio data to text"""
        res = self.model.generate(
            input=audio_data,
            cache={},
            language="zn",
            use_itn=True,
            batch_size_s=60,
            merge_vad=True,
            merge_length_s=15,
        )
        return res[0]["text"] if res else ""
    

In [None]:
sppech_model = SpeechRecognitionModel()

In [None]:
# Audio settings
SAMPLE_RATE = 16000
FORMAT = pyaudio.paInt16
CHANNELS = 1
CHUNK_MS = 4500  # 2.5 seconds per chunk
CHUNK_SIZE = int(SAMPLE_RATE * CHUNK_MS / 1000)

# Initialize PyAudio
p = pyaudio.PyAudio()
stream = p.open(format=FORMAT,
                channels=CHANNELS,
                rate=SAMPLE_RATE,
                input=True,
                frames_per_buffer=CHUNK_SIZE)



print("Real-time speech recognition started. Press Ctrl+C to stop.")

try:
    while True:
        # Read audio chunk from microphone
        audio_data = stream.read(CHUNK_SIZE, exception_on_overflow=False)
        
        # Convert to bytes-like object (if needed by the model)
        audio_16KHz = bytes(audio_data)
        text = sppech_model.transcribe(audio_16KHz)
        print("Recognized:", text)

except KeyboardInterrupt:
    print("\nStopping...")
finally:
    # Clean up
    stream.stop_stream()
    stream.close()
    p.terminate()

In [7]:
from langchain_core.prompts import ChatPromptTemplate
from langchain_ollama.llms import OllamaLLM
from typing import Dict

class NonLoginSpeechAnswer():
    def __init__(self):
        self.start_model()
        self.prompts()
        self.initialize()
    def start_model(self):
        self.model = OllamaLLM(model="qwen2.5:3b", base_url = "http://localhost:11434")
    def prompts(self):
        self.prompt_template = """
            你是太原市的专业旅游助手，用户向你提出了以下问题：{question}

            请根据问题内容，判断其属于以下哪一类信息需求，并严格按照对应要求进行回答。请使用中文输出，保持格式统一、信息清晰、内容简明、专业。

            === 问题类型与回答要求 ===

            1. 【最佳路线/游览顺序】  
            - 如果用户询问的是“最佳路线”或“游览顺序”，请提供合理的游览线路。  
            - 使用“→”符号连接景点，展示清晰的游览顺序。  
            - 路线需考虑地理位置和文化逻辑的连贯性。  
            - 不要添加解释性文字，仅输出路线本身。  
            - 示例：晋祠南门牌坊 → 飞龙阁 → 龙亭照壁图壁 → 水镜台 → 航取 → 品道讲堂 → 圣母殿

            2. 【交通信息】  
            - 如果用户询问的是交通方式、自驾、公交等问题，请按以下三个部分回答：  
                【公交线路信息】  
                - 公交线路编号（如：10路、308路）  
                - 起点与终点名称  
                - 主要经过站点  
                - 首末班车时间（注明夏季和冬季）  
                - 全程票价（含是否单一票制）  
                
                【自驾信息】  
                - 推荐行车路线（注明主干道）  
                - 预计行驶时间  
                - 停车场位置（距离景点多少米）  
                - 停车容量  
                - 收费标准（按次/按天）  
                
                【其他信息】  
                - 是否免费开放、特别活动等  
                - 周边推荐设施（如餐厅、公园）  
                - 出行建议或提示  
            - 若某部分无资料，请写“暂无相关信息”。

            3. 【美食特产】  
            - 如果用户想了解某地美食、特产，请使用项目符号列出。  
            - 内容应包括菜名、所属菜系、代表性描述、食材或口味特点。  
            - 排除无关内容，保持简洁、信息完整、格式一致。  

            4. 【文化介绍】  
            - 如果问题涉及历史背景、文化价值、习俗等，请简要、客观地介绍。  
            - 语言需专业、内容具代表性和准确性。  

            5. 【景点游览信息】  
            - 如果用户提问涉及景点详情（如看点、开放情况、活动等），请提供全面介绍。  
            - 内容需涵盖开放时间、票价、景区特色、参观建议等。  
            - 回答应具有导览实用性、逻辑清晰、重点突出。

            === 说明 ===  
            - 请根据问题内容自行判断类型，选择对应的格式与信息内容作答。  
            - 不要重复问题、不要添加“以下是您要的信息”类语言。  
            - 若问题不清晰，请结合上下文尽量识别其意图并作出合理推测回答。

            回答：
            """

        self.prompt = ChatPromptTemplate.from_template(self.prompt_template)

    def initialize(self):
        self.chain = self.prompt | self.model
    def invoke(self, answer):
        return self.chain.invoke({"question": answer})
        

In [8]:
model = NonLoginSpeechAnswer()

In [9]:
model.invoke("hello")

'由于用户的问题非常简短且没有具体说明是关于哪个景点或哪方面的信息需求，我无法直接提供相关信息。请用户提供更多信息，比如他们想了解的具体地点、是否需要交通信息、美食推荐还是文化介绍等。这样我才能更准确地帮助到您。'

In [40]:
from transformers import BarkModel
from transformers import AutoProcessor
import numpy as np

import torch
class TextToAudio():
    def __init__(self):
        self.load_all_models()
        self.voice_preset = r"D:\Backend_Algorithm_travel_assistance\downloaded_models\zh_speaker_7.npz"
    
    def load_all_models(self):
        model_path = r'D:\Backend_Algorithm_travel_assistance\downloaded_models\bark-small'
        self.model = BarkModel.from_pretrained(model_path).to("cuda")
        self.processor = AutoProcessor.from_pretrained(model_path, padding=True, truncation=True)
    
    def generate(self, text):
        chunks = self.split_text(text)
        audio_segments = []

        for chunk in chunks:
            inputs = self.processor(chunk, voice_preset=self.voice_preset).to("cuda")
            inputs = {k: v.to("cuda") for k, v in inputs.items()}
            output = self.model.generate(**inputs)
            audio_array = output.cpu().numpy().squeeze()
            audio_segments.append(audio_array)
        
        final_audio = np.concatenate(audio_segments)
        return final_audio

    def split_text(self, text, max_len=30):
        """Splits the text into chunks based on a character limit, prioritizing sentence completion at full stops or commas."""
        if len(text) <= max_len:
            return [text]
        
        chunks = []
        start = 0
        text_length = len(text)
        
        while start < text_length:
            end = start + max_len
            window_end = min(end, text_length)
            
            # Find the last full stop in the current window
            last_full_stop = text.rfind('。', start, window_end)
            if last_full_stop != -1:
                # Include the full stop by setting end to last_full_stop + 1
                end = last_full_stop + 1
            else:
                # No full stop found, look for the last comma
                last_comma = text.rfind('，', start, window_end)
                if last_comma != -1:
                    # Include the comma by setting end to last_comma + 1
                    end = last_comma + 1
                else:
                    # No punctuation found, split at max_len or remaining text
                    end = window_end
            
            # Ensure we don't exceed the text length
            end = min(end, text_length)
            chunk = text[start:end].strip()
            if chunk:  # Avoid adding empty chunks
                chunks.append(chunk)
            start = end  # Move to the next part
        
        return chunks

In [41]:
speech_model = TextToAudio()


In [42]:
text = "我叫泰华，我住在巴基斯坦伊斯兰堡。巴基斯坦正在与印度交战，我想参战并成为英雄。我是一名人工智能工程师，目前在中国太原市工作。"

In [43]:
tex = speech_model.generate(text)

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:10000 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:10000 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:10000 for open-end generation.


In [46]:
type(tex)


numpy.ndarray

In [39]:
from IPython.display import Audio
Audio(tex, rate=24000)
