In [1]:
import numpy as np
import tritonclient.http

In [18]:
url = "10.10.66.25:8000"
model_name = "speech-video-handler"
model_version = "1"
batch_size = 1

In [15]:
triton_client = tritonclient.http.InferenceServerClient(url=url, verbose=False)

In [4]:
triton_client.is_model_ready(model_name=model_name, model_version=model_version)

True

In [5]:
model_metadata = triton_client.get_model_metadata(model_name=model_name, model_version=model_version)

In [6]:
model_config = triton_client.get_model_config(model_name=model_name, model_version=model_version)

### Video handler requests

In [19]:
_input = tritonclient.http.InferInput(name="video_url", shape=(batch_size,), datatype="BYTES")
output_1 = tritonclient.http.InferRequestedOutput(name="AUDIO_TEXT", binary_data=False)
# output_2 = tritonclient.http.InferRequestedOutput(name="LANGUAGE", binary_data=False)

In [20]:
video_url = "https://cdn-st.rutubelist.ru/media/d1/e7/642dc2194fcdb69664f832d5f2dd/fhd.mp4"

In [21]:
_input.set_data_from_numpy(np.asarray([video_url] * batch_size, dtype=object))

response = triton_client.infer(
        model_name=model_name,
        model_version=model_version,
        inputs=[_input],
        outputs=[output_1],
    )

print(response.get_response())

{'model_name': 'speech-video-handler', 'model_version': '1', 'outputs': [{'name': 'AUDIO_TEXT', 'datatype': 'BYTES', 'shape': [], 'data': ['я убежден что чем беднее человек тем сложнее его удовлетворить потому что тот человек у которого нет денег он всегда недоволен чем он всегда просит больше который в принципе удовлетворен своими деньгами он говорит классно это здорово спасибо и идет и делает']}]}


In [12]:
np.array2string(response.as_numpy("AUDIO_TEXT"))

"'я убежден что чем беднее человек тем сложнее его удовлетворить потому что тот человек у которого нет денег он всегда недоволен чем он всегда просит больше который в принципе удовлетворен своими деньгами он говорит классно это здорово спасибо и идет и делает'"

In [26]:
response.get_output("AUDIO_TEXT")['data'][0]

'я убежден что чем беднее человек тем сложнее его удовлетворить потому что тот человек у которого нет денег он всегда недоволен чем он всегда просит больше который в принципе удовлетворен своими деньгами он говорит классно это здорово спасибо и идет и делает'

### Xclip handler requests

In [10]:
model_name = "xclip-video-handler"

_input = tritonclient.http.InferInput(name="video_url", shape=(batch_size,), datatype="BYTES")
output_1 = tritonclient.http.InferRequestedOutput(name="EMBEDDING", binary_data=False)

In [16]:
video_url = "https://cdn-st.rutubelist.ru/media/d1/e7/642dc2194fcdb69664f832d5f2dd/fhd.mp4"
_input.set_data_from_numpy(np.asarray([video_url] * batch_size, dtype=object))

response = triton_client.infer(
        model_name=model_name,
        model_version=model_version,
        inputs=[_input],
        outputs=[output_1],
    )

print(response.get_response())

{'model_name': 'xclip-video-handler', 'model_version': '1', 'outputs': [{'name': 'EMBEDDING', 'datatype': 'FP32', 'shape': [1024], 'data': [-0.49318191409111023, 0.023339077830314636, -0.5225439071655273, 0.1777774542570114, -0.2323152720928192, 0.22025181353092194, -0.09798445552587509, 0.7454572319984436, 0.08714231848716736, 0.28635159134864807, 0.12191367149353027, -0.24281525611877441, -0.038871459662914276, -0.13562141358852386, -0.058452628552913666, -0.14142967760562897, 0.3659122884273529, -0.10255752503871918, 0.30384907126426697, 0.013143140822649002, 0.05487372353672981, -0.20608806610107422, 0.7059949636459351, -0.0076920222491025925, 0.10847508907318115, -0.02158338762819767, -0.5053426027297974, -0.15521427989006042, 0.4549076557159424, 0.0709013044834137, -0.3505921959877014, -0.21067583560943604, -0.09154418110847473, 0.23630720376968384, -0.14902491867542267, -0.3323853611946106, 0.16837696731090546, -0.6743078231811523, -0.39782020449638367, 0.14741799235343933, 0.30

In [13]:
triton_client.close()