BUG: qwen1.5 gptq int8 errored #1046

qinxuye · 2024-02-28T03:48:38Z

Describe the bug

A clear and concise description of what the bug is.

To Reproduce

To help us to reproduce this bug, please provide information below:

Your Python version.
The version of xinference you use.
Versions of crucial packages.
Full stack of the error.
Minimized code to reproduce the error.

2024-02-28 03:45:45,757 xinference.api.restful_api 188628 ERROR    Chat completion stream got an error: [address=0.0.0.0:43203, pid=188725] probability tensor contains either `inf`, `nan` or element < 0
Traceback (most recent call last):
  File "/new_data2/xuyeqin-data/projects/inference/xinference/api/restful_api.py", line 1257, in stream_results
    async for item in iterator:
  File "/home/xuyeqin/miniconda3/miniconda/lib/python3.11/site-packages/xoscar/api.py", line 340, in __anext__
    return await self._actor_ref.__xoscar_next__(self._uid)
           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/home/xuyeqin/miniconda3/miniconda/lib/python3.11/site-packages/xoscar/backends/context.py", line 227, in send
    return self._process_result_message(result)
           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/home/xuyeqin/miniconda3/miniconda/lib/python3.11/site-packages/xoscar/backends/context.py", line 102, in _process_result_message
    raise message.as_instanceof_cause()
  File "/home/xuyeqin/miniconda3/miniconda/lib/python3.11/site-packages/xoscar/backends/pool.py", line 657, in send
    result = await self._run_coro(message.message_id, coro)
    ^^^^^^^^^^^^^^^^^
  File "/home/xuyeqin/miniconda3/miniconda/lib/python3.11/site-packages/xoscar/backends/pool.py", line 368, in _run_coro
    return await coro
  File "/home/xuyeqin/miniconda3/miniconda/lib/python3.11/site-packages/xoscar/api.py", line 384, in __on_receive__
    return await super().__on_receive__(message)  # type: ignore
    ^^^^^^^^^^^^^^^^^
  File "xoscar/core.pyx", line 558, in __on_receive__
    raise ex
  File "xoscar/core.pyx", line 520, in xoscar.core._BaseActor.__on_receive__
    async with self._lock:
    ^^^^^^^^^^^^^^^^^
  File "xoscar/core.pyx", line 521, in xoscar.core._BaseActor.__on_receive__
    with debug_async_timeout('actor_lock_timeout',
    ^^^^^^^^^^^^^^^^^
  File "xoscar/core.pyx", line 526, in xoscar.core._BaseActor.__on_receive__
    result = await result
    ^^^^^^^^^^^^^^^^^
  File "/home/xuyeqin/miniconda3/miniconda/lib/python3.11/site-packages/xoscar/api.py", line 431, in __xoscar_next__
    raise e
  File "/home/xuyeqin/miniconda3/miniconda/lib/python3.11/site-packages/xoscar/api.py", line 417, in __xoscar_next__
    r = await asyncio.to_thread(_wrapper, gen)
    ^^^^^^^^^^^^^^^^^
  File "/home/xuyeqin/miniconda3/miniconda/lib/python3.11/asyncio/threads.py", line 25, in to_thread
    return await loop.run_in_executor(None, func_call)
      ^^^^^^^^^^^^^^^^^
  File "/home/xuyeqin/miniconda3/miniconda/lib/python3.11/concurrent/futures/thread.py", line 58, in run
    result = self.fn(*self.args, **self.kwargs)
    ^^^^^^^^^^^^^^^^^
  File "/home/xuyeqin/miniconda3/miniconda/lib/python3.11/site-packages/xoscar/api.py", line 402, in _wrapper
    return next(_gen)
  File "/new_data2/xuyeqin-data/projects/inference/xinference/core/model.py", line 257, in _to_json_generator
    for v in gen:
  File "/new_data2/xuyeqin-data/projects/inference/xinference/model/llm/utils.py", line 470, in _to_chat_completion_chunks
    for i, chunk in enumerate(chunks):
    ^^^^^^^^^^^^^^^^^
  File "/new_data2/xuyeqin-data/projects/inference/xinference/model/llm/pytorch/core.py", line 253, in generator_wrapper
    for completion_chunk, completion_usage in generate_stream(
    ^^^^^^^^^^^^^^^^^
  File "/home/xuyeqin/miniconda3/miniconda/lib/python3.11/site-packages/torch/utils/_contextlib.py", line 35, in generator_context
    response = gen.send(None)
    ^^^^^^^^^^^^^^^^^
  File "/new_data2/xuyeqin-data/projects/inference/xinference/model/llm/pytorch/utils.py", line 214, in generate_stream
    indices = torch.multinomial(probs, num_samples=2)
    ^^^^^^^^^^^^^^^^^
RuntimeError: [address=0.0.0.0:43203, pid=188725] probability tensor contains either `inf`, `nan` or element < 0

Expected behavior

A clear and concise description of what you expected to happen.

Additional context

Add any other context about the problem here.

The text was updated successfully, but these errors were encountered:

qinxuye · 2024-02-28T04:24:33Z

qwen1.5 gptq int8 worked for torch == 2.1.2, error only showed for torch == 2.2.0

qinxuye · 2024-02-28T08:56:10Z

Similar issue #733 .

github-actions · 2024-08-07T19:04:04Z

This issue is stale because it has been open for 7 days with no activity.

github-actions · 2024-08-12T19:04:48Z

This issue was closed because it has been inactive for 5 days since being marked as stale.

XprobeBot added the bug Something isn't working label Feb 28, 2024

XprobeBot added this to the v0.9.1 milestone Feb 28, 2024

XprobeBot modified the milestones: v0.9.1, v0.9.2, v0.9.3 Mar 1, 2024

XprobeBot modified the milestones: v0.9.3, v0.9.4, v0.9.5 Mar 15, 2024

XprobeBot modified the milestones: v0.10.0, v0.10.1 Mar 29, 2024

XprobeBot modified the milestones: v0.10.1, v0.10.2 Apr 12, 2024

XprobeBot modified the milestones: v0.10.2, v0.10.3, v0.11.0 Apr 19, 2024

XprobeBot modified the milestones: v0.11.0, v0.11.1, v0.11.2 May 11, 2024

XprobeBot modified the milestones: v0.11.2, v0.11.3 May 24, 2024

XprobeBot modified the milestones: v0.11.3, v0.11.4, v0.12.0, v0.12.1 May 31, 2024

XprobeBot modified the milestones: v0.12.1, v0.12.2 Jun 14, 2024

XprobeBot modified the milestones: v0.12.2, v0.12.4, v0.13.0, v0.13.1 Jun 28, 2024

XprobeBot modified the milestones: v0.13.1, v0.13.2 Jul 12, 2024

XprobeBot modified the milestones: v0.13.2, v0.13.4 Jul 26, 2024

github-actions bot added the stale label Aug 7, 2024

github-actions bot closed this as not planned Won't fix, can't repro, duplicate, stale Aug 12, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

BUG: qwen1.5 gptq int8 errored #1046

BUG: qwen1.5 gptq int8 errored #1046

qinxuye commented Feb 28, 2024

qinxuye commented Feb 28, 2024

qinxuye commented Feb 28, 2024

github-actions bot commented Aug 7, 2024

github-actions bot commented Aug 12, 2024

BUG: qwen1.5 gptq int8 errored #1046

BUG: qwen1.5 gptq int8 errored #1046

Comments

qinxuye commented Feb 28, 2024

Describe the bug

To Reproduce

Expected behavior

Additional context

qinxuye commented Feb 28, 2024

qinxuye commented Feb 28, 2024

github-actions bot commented Aug 7, 2024

github-actions bot commented Aug 12, 2024