From 6744f41a49020095b4a12f7e2e2338b4be86b1dd Mon Sep 17 00:00:00 2001
From: Caio Carvalho <21188280+lowercase00@users.noreply.github.com>
Date: Mon, 6 Feb 2023 08:45:15 -0300
Subject: [PATCH 01/19] Multithreading first WIP

---
 rq/worker.py | 212 ++++++++++++++++++++++++++++++++++++++++++++++++++-
 1 file changed, 211 insertions(+), 1 deletion(-)

diff --git a/rq/worker.py b/rq/worker.py
index 06a707e77..897993f57 100644
--- a/rq/worker.py
+++ b/rq/worker.py
@@ -1,3 +1,4 @@
+from concurrent.futures import ThreadPoolExecutor
 import errno
 import logging
 import os
@@ -51,7 +52,7 @@
 from .results import Result
 from .scheduler import RQScheduler
 from .suspension import is_suspended
-from .timeouts import JobTimeoutException, HorseMonitorTimeoutException, UnixSignalDeathPenalty
+from .timeouts import JobTimeoutException, HorseMonitorTimeoutException, TimerDeathPenalty, UnixSignalDeathPenalty
 from .utils import backend_class, ensure_list, get_version, make_colorizer, utcformat, utcnow, utcparse, compact
 from .version import VERSION
 from .worker_registration import clean_worker_registry, get_keys
@@ -1408,3 +1409,212 @@ class RandomWorker(Worker):
 
     def reorder_queues(self, reference_queue):
         shuffle(self._ordered_queues)
+
+
+class ThreadPoolWorker(Worker):
+
+    death_penalty_class = TimerDeathPenalty
+
+    def __init__(self, *args, **kwargs):
+        self.threadpool_size = kwargs.pop('pool_size', 12)
+        self.executor = ThreadPoolExecutor(max_workers=self.threadpool_size)
+        self._idle_threads = self.threadpool_size
+        super(ThreadPoolWorker, self).__init__(*args, **kwargs)
+
+    @property
+    def idle_threads(self):
+        size = self.executor._work_queue.qsize()
+        if size <= self.threadpool_size:
+            return True
+        return False
+
+    def _original_work(
+        self,
+        burst: bool = False,
+        logging_level: str = "INFO",
+        date_format=DEFAULT_LOGGING_DATE_FORMAT,
+        log_format=DEFAULT_LOGGING_FORMAT,
+        max_jobs=None,
+        with_scheduler: bool = False,
+    ):
+        """Starts the work loop.
+
+        Pops and performs all jobs on the current list of queues.  When all
+        queues are empty, block and wait for new jobs to arrive on any of the
+        queues, unless `burst` mode is enabled.
+
+        The return value indicates whether any jobs were processed.
+        """
+        completed_jobs = 0
+        setup_loghandlers(logging_level, date_format, log_format)
+        self.register_birth()
+        self.log.info("Worker %s: started, version %s", self.key, VERSION)
+        self.subscribe()
+        self.set_state(WorkerStatus.STARTED)
+        qnames = self.queue_names()
+        self.log.info('*** Listening on %s...', green(', '.join(qnames)))
+
+        if with_scheduler:
+            # Make scheduler ready.
+            pass
+
+        self._install_signal_handlers()
+        try:
+            while True:
+                try:
+                    self.check_for_suspension(burst)
+
+                    if self.should_run_maintenance_tasks:
+                        self.run_maintenance_tasks()
+
+                    if self._stop_requested:
+                        self.log.info('Worker %s: stopping on request', self.key)
+                        break
+
+                    if not self.idle_threads:
+                        self.log.info('Threadpool is full, waiting...')
+                        time.sleep
+                        break
+
+                    timeout = None if burst else self._get_timeout()
+                    result = self.dequeue_job_and_maintain_ttl(timeout)
+                    if result is None:
+                        if burst:
+                            self.log.info("Worker %s: done, quitting", self.key)
+                        break
+
+                    job, queue = result
+                    self.reorder_queues(reference_queue=queue)
+                    self.execute_job(job, queue)
+                    self.heartbeat()
+
+                    completed_jobs += 1
+                    if max_jobs is not None:
+                        if completed_jobs >= max_jobs:
+                            self.log.info("Worker %s: finished executing %d jobs, quitting", self.key, completed_jobs)
+                            break
+
+                except redis.exceptions.TimeoutError:
+                    self.log.error(f"Worker {self.key}: Redis connection timeout, quitting...")
+                    break
+
+                except StopRequested:
+                    break
+
+                except SystemExit:
+                    # Cold shutdown detected
+                    raise
+
+                except:  # noqa
+                    self.log.error('Worker %s: found an unhandled exception, quitting...', self.key, exc_info=True)
+                    break
+        finally:
+            self.register_death()
+            self.unsubscribe()
+
+        return bool(completed_jobs)
+
+
+    def work(self, burst=False, logging_level="INFO", date_format=DEFAULT_LOGGING_DATE_FORMAT,
+             log_format=DEFAULT_LOGGING_FORMAT, max_jobs=None, with_scheduler=False):
+        """Starts the work loop.
+        Pops and performs all jobs on the current list of queues.  When all
+        queues are empty, block and wait for new jobs to arrive on any of the
+        queues, unless `burst` mode is enabled.
+        The return value indicates whether any jobs were processed.
+        """
+        setup_loghandlers(logging_level, date_format, log_format)
+        completed_jobs = 0
+        self.register_birth()
+        self.log.info("Worker %s: started, version %s", self.key, VERSION)
+        self.subscribe()
+        self.set_state(WorkerStatus.STARTED)
+        qnames = self.queue_names()
+        self.log.info('*** Listening on %s...', green(', '.join(qnames)))
+
+        try:
+            while True:
+                self.check_for_suspension(burst)
+                if self.should_run_maintenance_tasks:
+                    self.run_maintenance_tasks()
+                if self._stop_requested:
+                    self.log.info("Stopping on request.")
+                    break
+                timeout = None if burst else max(1, self.default_worker_ttl - 60)
+                try:
+                    result = self.dequeue_job(timeout)
+                    if result is None:
+                        if burst:
+                            self.log.info("Worker %s: done. Will finish current running tasks and quit.", self.key)
+                        break
+                except StopRequested:
+                    break
+
+                job, queue = result
+                self.execute_job(job, queue)
+                completed_jobs += 1
+                if max_jobs is not None:
+                    if completed_jobs >= max_jobs:
+                        self.log.info(
+                            "Worker %s: finished executing %d jobs, quitting",
+                            self.key, completed_jobs
+                        )
+                        break
+
+        finally:
+            if not self.is_horse:
+                self.register_death()
+        return self.did_perform_work
+
+    def execute_job(self, job, queue):
+        def job_done(child):
+            self.heartbeat()
+            if job.get_status() == JobStatus.FINISHED:
+                queue.enqueue_dependents(job)
+
+        self.log.info("Executing job %s from %s", blue(job.id), green(queue.name))
+        future = self.executor.submit(self.perform_job, job, queue)
+        return future.add_done_callback(job_done)
+
+    def dequeue_job(self, timeout: Optional[int] = None) -> Optional[tuple[Job, Queue]]:
+        if self._stop_requested:
+            raise StopRequested()
+        result = None
+        while True:
+            if self._stop_requested:
+                raise StopRequested()
+            self.heartbeat()
+            try:
+                result = self.queue_class.dequeue_any(
+                    self.queues, timeout, connection=self.connection
+                )
+                if result is not None:
+                    job, queue = result
+                    self.log.info(
+                        "Found job on queue %s: %s with ID (%s)"
+                        % (green(queue.name), blue(job.description), job.id)
+                    )
+                break
+            except DequeueTimeout:
+                pass
+        self.heartbeat()
+        return result
+
+    def _shutdown(self):
+        """
+        If shutdown is requested in the middle of a job, wait until
+        finish before shutting down and save the request in redis
+        """
+        if self.get_state() == WorkerStatus.BUSY:
+            self._stop_requested = True
+            self.set_shutdown_requested_date()
+            self.log.debug('Stopping after current horse is finished. '
+                           'Press Ctrl+C again for a cold shutdown.')
+            self.executor.shutdown()
+            if self.scheduler:
+                self.stop_scheduler()
+        else:
+            if self.scheduler:
+                self.stop_scheduler()
+            raise StopRequested()
+

From 4e9073014900740a8aab985b39ca39e8d8e8dbe3 Mon Sep 17 00:00:00 2001
From: Caio Carvalho <21188280+lowercase00@users.noreply.github.com>
Date: Tue, 7 Feb 2023 02:24:48 -0300
Subject: [PATCH 02/19] Add locking mechanism

---
 rq/worker.py         | 114 ++---
 tests/test_worker.py | 999 ++++++++++++++++++++++++++++++++++++++++++-
 2 files changed, 1024 insertions(+), 89 deletions(-)

diff --git a/rq/worker.py b/rq/worker.py
index 794c2d5bb..4d9d840f6 100644
--- a/rq/worker.py
+++ b/rq/worker.py
@@ -1,4 +1,3 @@
-from concurrent.futures import ThreadPoolExecutor
 import errno
 import logging
 import os
@@ -6,15 +5,18 @@
 import signal
 import socket
 import sys
+import threading
 import time
 import traceback
 import warnings
 
+
 from datetime import timedelta
 from enum import Enum
 from uuid import uuid4
 from random import shuffle
 from typing import Callable, List, Optional, TYPE_CHECKING, Type
+from concurrent.futures import ThreadPoolExecutor
 
 if TYPE_CHECKING:
     from redis import Redis
@@ -1386,19 +1388,30 @@ class ThreadPoolWorker(Worker):
     death_penalty_class = TimerDeathPenalty
 
     def __init__(self, *args, **kwargs):
-        self.threadpool_size = kwargs.pop('pool_size', 12)
-        self.executor = ThreadPoolExecutor(max_workers=self.threadpool_size)
+        self.threadpool_size = kwargs.pop('pool_size', 24)
+        self.executor = ThreadPoolExecutor(max_workers=self.threadpool_size, thread_name_prefix="rq_workers_")
         self._idle_threads = self.threadpool_size
+        self._lock = threading.Lock()
         super(ThreadPoolWorker, self).__init__(*args, **kwargs)
 
     @property
-    def idle_threads(self):
-        size = self.executor._work_queue.qsize()
-        if size <= self.threadpool_size:
+    def _is_pool_full(self):
+        if self._idle_threads == 0:
             return True
         return False
 
-    def _original_work(
+    def _change_idle_counter(self, operation):
+        with self._lock:
+            self._idle_threads += operation
+
+    def _wait_for_slot(self):
+        while 1:
+            if self._is_pool_full:
+                continue
+            self.log.info('Found a slot, ready to work')
+            break
+
+    def work(
         self,
         burst: bool = False,
         logging_level: str = "INFO",
@@ -1441,10 +1454,9 @@ def _original_work(
                         self.log.info('Worker %s: stopping on request', self.key)
                         break
 
-                    if not self.idle_threads:
-                        self.log.info('Threadpool is full, waiting...')
-                        time.sleep
-                        break
+                    if self._is_pool_full:
+                        self.log.info('Threadpool is full, waiting for idle workers...')
+                        self._wait_for_slot()
 
                     timeout = None if burst else self._get_timeout()
                     result = self.dequeue_job_and_maintain_ttl(timeout)
@@ -1484,91 +1496,17 @@ def _original_work(
 
         return bool(completed_jobs)
 
-
-    def work(self, burst=False, logging_level="INFO", date_format=DEFAULT_LOGGING_DATE_FORMAT,
-             log_format=DEFAULT_LOGGING_FORMAT, max_jobs=None, with_scheduler=False):
-        """Starts the work loop.
-        Pops and performs all jobs on the current list of queues.  When all
-        queues are empty, block and wait for new jobs to arrive on any of the
-        queues, unless `burst` mode is enabled.
-        The return value indicates whether any jobs were processed.
-        """
-        setup_loghandlers(logging_level, date_format, log_format)
-        completed_jobs = 0
-        self.register_birth()
-        self.log.info("Worker %s: started, version %s", self.key, VERSION)
-        self.subscribe()
-        self.set_state(WorkerStatus.STARTED)
-        qnames = self.queue_names()
-        self.log.info('*** Listening on %s...', green(', '.join(qnames)))
-
-        try:
-            while True:
-                self.check_for_suspension(burst)
-                if self.should_run_maintenance_tasks:
-                    self.run_maintenance_tasks()
-                if self._stop_requested:
-                    self.log.info("Stopping on request.")
-                    break
-                timeout = None if burst else max(1, self.default_worker_ttl - 60)
-                try:
-                    result = self.dequeue_job(timeout)
-                    if result is None:
-                        if burst:
-                            self.log.info("Worker %s: done. Will finish current running tasks and quit.", self.key)
-                        break
-                except StopRequested:
-                    break
-
-                job, queue = result
-                self.execute_job(job, queue)
-                completed_jobs += 1
-                if max_jobs is not None:
-                    if completed_jobs >= max_jobs:
-                        self.log.info(
-                            "Worker %s: finished executing %d jobs, quitting",
-                            self.key, completed_jobs
-                        )
-                        break
-
-        finally:
-            if not self.is_horse:
-                self.register_death()
-        return self.did_perform_work
-
     def execute_job(self, job, queue):
         def job_done(child):
+            self._change_idle_counter(+1)
             self.heartbeat()
             if job.get_status() == JobStatus.FINISHED:
                 queue.enqueue_dependents(job)
 
         self.log.info("Executing job %s from %s", blue(job.id), green(queue.name))
         future = self.executor.submit(self.perform_job, job, queue)
-        return future.add_done_callback(job_done)
-
-    def dequeue_job(self, timeout: Optional[int] = None) -> Optional[tuple[Job, Queue]]:
-        if self._stop_requested:
-            raise StopRequested()
-        result = None
-        while True:
-            if self._stop_requested:
-                raise StopRequested()
-            self.heartbeat()
-            try:
-                result = self.queue_class.dequeue_any(
-                    self.queues, timeout, connection=self.connection
-                )
-                if result is not None:
-                    job, queue = result
-                    self.log.info(
-                        "Found job on queue %s: %s with ID (%s)"
-                        % (green(queue.name), blue(job.description), job.id)
-                    )
-                break
-            except DequeueTimeout:
-                pass
-        self.heartbeat()
-        return result
+        self._change_idle_counter(-1)
+        future.add_done_callback(job_done)
 
     def _shutdown(self):
         """
diff --git a/tests/test_worker.py b/tests/test_worker.py
index b0bb3d765..d90b81c3e 100644
--- a/tests/test_worker.py
+++ b/tests/test_worker.py
@@ -35,7 +35,7 @@
 from rq.suspension import resume, suspend
 from rq.utils import utcnow
 from rq.version import VERSION
-from rq.worker import HerokuWorker, WorkerStatus, RoundRobinWorker, RandomWorker
+from rq.worker import HerokuWorker, ThreadPoolWorker, WorkerStatus, RoundRobinWorker, RandomWorker
 from rq.serializers import JSONSerializer
 
 
@@ -1426,3 +1426,1000 @@ def test_random_worker(self):
         sorted_ids.sort()
         expected_ser.sort()
         self.assertEqual(sorted_ids, expected_ser)
+
+
+class TestThreadpoolWorker(RQTestCase):
+
+    def test_create_worker(self):
+        """ThreadPoolWorker creation using various inputs."""
+
+        # With single string argument
+        w = ThreadPoolWorker('foo')
+        self.assertEqual(w.queues[0].name, 'foo')
+
+        # With list of strings
+        w = ThreadPoolWorker(['foo', 'bar'])
+        self.assertEqual(w.queues[0].name, 'foo')
+        self.assertEqual(w.queues[1].name, 'bar')
+
+        self.assertEqual(w.queue_keys(), [w.queues[0].key, w.queues[1].key])
+        self.assertEqual(w.queue_names(), ['foo', 'bar'])
+
+        # With iterable of strings
+        w = ThreadPoolWorker(iter(['foo', 'bar']))
+        self.assertEqual(w.queues[0].name, 'foo')
+        self.assertEqual(w.queues[1].name, 'bar')
+
+        # With single Queue
+        w = ThreadPoolWorker(Queue('foo'))
+        self.assertEqual(w.queues[0].name, 'foo')
+
+        # With iterable of Queues
+        w = ThreadPoolWorker(iter([Queue('foo'), Queue('bar')]))
+        self.assertEqual(w.queues[0].name, 'foo')
+        self.assertEqual(w.queues[1].name, 'bar')
+
+        # With list of Queues
+        w = ThreadPoolWorker([Queue('foo'), Queue('bar')])
+        self.assertEqual(w.queues[0].name, 'foo')
+        self.assertEqual(w.queues[1].name, 'bar')
+
+        # With string and serializer
+        w = ThreadPoolWorker('foo', serializer=json)
+        self.assertEqual(w.queues[0].name, 'foo')
+
+        # With queue having serializer
+        w = ThreadPoolWorker(Queue('foo'), serializer=json)
+        self.assertEqual(w.queues[0].name, 'foo')
+
+    def test_work_and_quit(self):
+        """ThreadPoolWorker processes work, then quits."""
+        fooq, barq = Queue('foo'), Queue('bar')
+        w = ThreadPoolWorker([fooq, barq])
+        self.assertEqual(
+            w.work(burst=True), False,
+            'Did not expect any work on the queue.'
+        )
+
+        fooq.enqueue(say_hello, name='Frank')
+        self.assertEqual(
+            w.work(burst=True), True,
+            'Expected at least some work done.'
+        )
+
+    def test_work_and_quit_custom_serializer(self):
+        """ThreadPoolWorker processes work, then quits."""
+        fooq, barq = Queue('foo', serializer=JSONSerializer), Queue('bar', serializer=JSONSerializer)
+        w = ThreadPoolWorker([fooq, barq], serializer=JSONSerializer)
+        self.assertEqual(
+            w.work(burst=True), False,
+            'Did not expect any work on the queue.'
+        )
+
+        fooq.enqueue(say_hello, name='Frank')
+        self.assertEqual(
+            w.work(burst=True), True,
+            'Expected at least some work done.'
+        )
+
+    def test_worker_all(self):
+        """ThreadPoolWorker.all() works properly"""
+        foo_queue = Queue('foo')
+        bar_queue = Queue('bar')
+
+        w1 = ThreadPoolWorker([foo_queue, bar_queue], name='w1')
+        w1.register_birth()
+        w2 = ThreadPoolWorker([foo_queue], name='w2')
+        w2.register_birth()
+
+        self.assertEqual(
+            set(ThreadPoolWorker.all(connection=foo_queue.connection)),
+            set([w1, w2])
+        )
+        self.assertEqual(set(ThreadPoolWorker.all(queue=foo_queue)), set([w1, w2]))
+        self.assertEqual(set(ThreadPoolWorker.all(queue=bar_queue)), set([w1]))
+
+        w1.register_death()
+        w2.register_death()
+
+    def test_worked_in_parallel(self):
+        """Test that each job sleeps in a different thread"""
+        q = Queue()
+        q.enqueue(long_running_job, 1)
+        q.enqueue(long_running_job, 1)
+        q.enqueue(long_running_job, 1)
+        q.enqueue(long_running_job, 1)
+        t0 = datetime.now()
+        w = ThreadPoolWorker([q], pool_size=4)
+        w.work(burst=True)
+        t1 = datetime.now()
+        self.assertGreaterEqual((t1 - t0).seconds, 1)
+        self.assertLess((t1 - t0).seconds, 1.1)
+
+    def test_find_by_key(self):
+        """ThreadPoolWorker.find_by_key restores queues, state and job_id."""
+        queues = [Queue('foo'), Queue('bar')]
+        w = ThreadPoolWorker(queues)
+        w.register_death()
+        w.register_birth()
+        w.set_state(WorkerStatus.STARTED)
+        worker = ThreadPoolWorker.find_by_key(w.key)
+        self.assertEqual(worker.queues, queues)
+        self.assertEqual(worker.get_state(), WorkerStatus.STARTED)
+        self.assertEqual(worker._job_id, None)
+        self.assertTrue(worker.key in ThreadPoolWorker.all_keys(worker.connection))
+        self.assertEqual(worker.version, VERSION)
+
+        # If worker is gone, its keys should also be removed
+        worker.connection.delete(worker.key)
+        ThreadPoolWorker.find_by_key(worker.key)
+        self.assertFalse(worker.key in ThreadPoolWorker.all_keys(worker.connection))
+
+        self.assertRaises(ValueError, ThreadPoolWorker.find_by_key, 'foo')
+
+    def test_worker_ttl(self):
+        """ThreadPoolWorker ttl."""
+        w = ThreadPoolWorker([])
+        w.register_birth()
+        [worker_key] = self.testconn.smembers(ThreadPoolWorker.redis_workers_keys)
+        self.assertIsNotNone(self.testconn.ttl(worker_key))
+        w.register_death()
+
+    def test_work_via_string_argument(self):
+        """ThreadPoolWorker processes work fed via string arguments."""
+        q = Queue('foo')
+        w = ThreadPoolWorker([q])
+        job = q.enqueue('tests.fixtures.say_hello', name='Frank')
+        self.assertEqual(
+            w.work(burst=True), True,
+            'Expected at least some work done.'
+        )
+        expected_result = 'Hi there, Frank!'
+        self.assertEqual(job.result, expected_result)
+        # Only run if Redis server supports streams
+        if job.supports_redis_streams:
+            self.assertEqual(Result.fetch_latest(job).return_value, expected_result)
+        self.assertIsNone(job.worker_name)
+
+    def test_job_times(self):
+        """job times are set correctly."""
+        q = Queue('foo')
+        w = ThreadPoolWorker([q])
+        before = utcnow()
+        before = before.replace(microsecond=0)
+        job = q.enqueue(say_hello)
+        self.assertIsNotNone(job.enqueued_at)
+        self.assertIsNone(job.started_at)
+        self.assertIsNone(job.ended_at)
+        self.assertEqual(
+            w.work(burst=True), True,
+            'Expected at least some work done.'
+        )
+        self.assertEqual(job.result, 'Hi there, Stranger!')
+        after = utcnow()
+        job.refresh()
+        self.assertTrue(
+            before <= job.enqueued_at <= after,
+            'Not %s <= %s <= %s' % (before, job.enqueued_at, after)
+        )
+        self.assertTrue(
+            before <= job.started_at <= after,
+            'Not %s <= %s <= %s' % (before, job.started_at, after)
+        )
+        self.assertTrue(
+            before <= job.ended_at <= after,
+            'Not %s <= %s <= %s' % (before, job.ended_at, after)
+        )
+
+    def test_work_is_unreadable(self):
+        """Unreadable jobs are put on the failed job registry."""
+        q = Queue()
+        self.assertEqual(q.count, 0)
+
+        # NOTE: We have to fake this enqueueing for this test case.
+        # What we're simulating here is a call to a function that is not
+        # importable from the worker process.
+        job = Job.create(func=div_by_zero, args=(3,), origin=q.name)
+        job.save()
+
+        job_data = job.data
+        invalid_data = job_data.replace(b'div_by_zero', b'nonexisting')
+        assert job_data != invalid_data
+        self.testconn.hset(job.key, 'data', zlib.compress(invalid_data))
+
+        # We use the low-level internal function to enqueue any data (bypassing
+        # validity checks)
+        q.push_job_id(job.id)
+
+        self.assertEqual(q.count, 1)
+
+        # All set, we're going to process it
+        w = ThreadPoolWorker([q])
+        w.work(burst=True)   # should silently pass
+        self.assertEqual(q.count, 0)
+
+        failed_job_registry = FailedJobRegistry(queue=q)
+        self.assertTrue(job in failed_job_registry)
+
+    @mock.patch('rq.worker.logger.error')
+    def test_deserializing_failure_is_handled(self, mock_logger_error):
+        """
+        Test that exceptions are properly handled for a job that fails to
+        deserialize.
+        """
+        q = Queue()
+        self.assertEqual(q.count, 0)
+
+        # as in test_work_is_unreadable(), we create a fake bad job
+        job = Job.create(func=div_by_zero, args=(3,), origin=q.name)
+        job.save()
+
+        # setting data to b'' ensures that pickling will completely fail
+        job_data = job.data
+        invalid_data = job_data.replace(b'div_by_zero', b'')
+        assert job_data != invalid_data
+        self.testconn.hset(job.key, 'data', zlib.compress(invalid_data))
+
+        # We use the low-level internal function to enqueue any data (bypassing
+        # validity checks)
+        q.push_job_id(job.id)
+        self.assertEqual(q.count, 1)
+
+        # Now we try to run the job...
+        w = ThreadPoolWorker([q])
+        job, queue = w.dequeue_job_and_maintain_ttl(10)
+        w.perform_job(job, queue)
+
+        # An exception should be logged here at ERROR level
+        self.assertIn("Traceback", mock_logger_error.call_args[0][0])
+
+    def test_heartbeat(self):
+        """Heartbeat saves last_heartbeat"""
+        q = Queue()
+        w = ThreadPoolWorker([q])
+        w.register_birth()
+
+        self.assertEqual(str(w.pid), as_text(self.testconn.hget(w.key, 'pid')))
+        self.assertEqual(w.hostname,
+                         as_text(self.testconn.hget(w.key, 'hostname')))
+        last_heartbeat = self.testconn.hget(w.key, 'last_heartbeat')
+        self.assertIsNotNone(self.testconn.hget(w.key, 'birth'))
+        self.assertTrue(last_heartbeat is not None)
+        w = ThreadPoolWorker.find_by_key(w.key)
+        self.assertIsInstance(w.last_heartbeat, datetime)
+
+        # worker.refresh() shouldn't fail if last_heartbeat is None
+        # for compatibility reasons
+        self.testconn.hdel(w.key, 'last_heartbeat')
+        w.refresh()
+        # worker.refresh() shouldn't fail if birth is None
+        # for compatibility reasons
+        self.testconn.hdel(w.key, 'birth')
+        w.refresh()
+
+    def test_maintain_heartbeats(self):
+        """worker.maintain_heartbeats() shouldn't create new job keys"""
+        queue = Queue(connection=self.testconn)
+        worker = ThreadPoolWorker([queue], connection=self.testconn)
+        job = queue.enqueue(say_hello)
+        worker.maintain_heartbeats(job)
+        self.assertTrue(self.testconn.exists(worker.key))
+        self.assertTrue(self.testconn.exists(job.key))
+
+        self.testconn.delete(job.key)
+
+        worker.maintain_heartbeats(job)
+        self.assertFalse(self.testconn.exists(job.key))
+
+    @slow
+    def test_heartbeat_survives_lost_connection(self):
+        with mock.patch.object(ThreadPoolWorker, 'heartbeat') as mocked:
+            # None -> Heartbeat is first called before the job loop
+            mocked.side_effect = [None, redis.exceptions.ConnectionError()]
+            q = Queue()
+            w = ThreadPoolWorker([q])
+            w.work(burst=True)
+            # First call is prior to job loop, second raises the error,
+            # third is successful, after "recovery"
+            assert mocked.call_count == 3
+
+    def test_job_timeout_moved_to_failed_job_registry(self):
+        """Jobs that run long are moved to FailedJobRegistry"""
+        queue = Queue()
+        worker = ThreadPoolWorker([queue])
+        job = queue.enqueue(long_running_job, 5, job_timeout=1)
+        worker.work(burst=True)
+        self.assertIn(job, job.failed_job_registry)
+        job.refresh()
+        self.assertIn('rq.timeouts.JobTimeoutException', job.exc_info)
+
+    @slow
+    def test_heartbeat_busy(self):
+        """Periodic heartbeats while horse is busy with long jobs"""
+        q = Queue()
+        w = ThreadPoolWorker([q], job_monitoring_interval=5)
+
+        for timeout, expected_heartbeats in [(2, 0), (7, 1), (12, 2)]:
+            job = q.enqueue(long_running_job,
+                            args=(timeout,),
+                            job_timeout=30,
+                            result_ttl=-1)
+            with mock.patch.object(w, 'heartbeat', wraps=w.heartbeat) as mocked:
+                w.execute_job(job, q)
+                self.assertEqual(mocked.call_count, expected_heartbeats)
+            job = Job.fetch(job.id)
+            self.assertEqual(job.get_status(), JobStatus.FINISHED)
+
+    def test_work_fails(self):
+        """Failing jobs are put on the failed queue."""
+        q = Queue()
+        self.assertEqual(q.count, 0)
+
+        # Action
+        job = q.enqueue(div_by_zero)
+        self.assertEqual(q.count, 1)
+
+        # keep for later
+        enqueued_at_date = str(job.enqueued_at)
+
+        w = ThreadPoolWorker([q])
+        w.work(burst=True)
+
+        # Postconditions
+        self.assertEqual(q.count, 0)
+        failed_job_registry = FailedJobRegistry(queue=q)
+        self.assertTrue(job in failed_job_registry)
+        self.assertEqual(w.get_current_job_id(), None)
+
+        # Check the job
+        job = Job.fetch(job.id)
+        self.assertEqual(job.origin, q.name)
+
+        # Should be the original enqueued_at date, not the date of enqueueing
+        # to the failed queue
+        self.assertEqual(str(job.enqueued_at), enqueued_at_date)
+        self.assertTrue(job.exc_info)  # should contain exc_info
+        if job.supports_redis_streams:
+            result = Result.fetch_latest(job)
+            self.assertEqual(result.exc_string, job.exc_info)
+            self.assertEqual(result.type, Result.Type.FAILED)
+
+    def test_statistics(self):
+        """Successful and failed job counts are saved properly"""
+        queue = Queue(connection=self.connection)
+        job = queue.enqueue(div_by_zero)
+        worker = ThreadPoolWorker([queue])
+        worker.register_birth()
+
+        self.assertEqual(worker.failed_job_count, 0)
+        self.assertEqual(worker.successful_job_count, 0)
+        self.assertEqual(worker.total_working_time, 0)
+
+        registry = StartedJobRegistry(connection=worker.connection)
+        job.started_at = utcnow()
+        job.ended_at = job.started_at + timedelta(seconds=0.75)
+        worker.handle_job_failure(job, queue)
+        worker.handle_job_success(job, queue, registry)
+
+        worker.refresh()
+        self.assertEqual(worker.failed_job_count, 1)
+        self.assertEqual(worker.successful_job_count, 1)
+        self.assertEqual(worker.total_working_time, 1.5)  # 1.5 seconds
+
+        worker.handle_job_failure(job, queue)
+        worker.handle_job_success(job, queue, registry)
+
+        worker.refresh()
+        self.assertEqual(worker.failed_job_count, 2)
+        self.assertEqual(worker.successful_job_count, 2)
+        self.assertEqual(worker.total_working_time, 3.0)
+
+    def test_handle_retry(self):
+        """handle_job_failure() handles retry properly"""
+        connection = self.testconn
+        queue = Queue(connection=connection)
+        retry = Retry(max=2)
+        job = queue.enqueue(div_by_zero, retry=retry)
+        registry = FailedJobRegistry(queue=queue)
+
+        worker = ThreadPoolWorker([queue])
+
+        # If job is configured to retry, it will be put back in the queue
+        # and not put in the FailedJobRegistry.
+        # This is the original execution
+        queue.empty()
+        worker.handle_job_failure(job, queue)
+        job.refresh()
+        self.assertEqual(job.retries_left, 1)
+        self.assertEqual([job.id], queue.job_ids)
+        self.assertFalse(job in registry)
+
+        # First retry
+        queue.empty()
+        worker.handle_job_failure(job, queue)
+        job.refresh()
+        self.assertEqual(job.retries_left, 0)
+        self.assertEqual([job.id], queue.job_ids)
+
+        # Second retry
+        queue.empty()
+        worker.handle_job_failure(job, queue)
+        job.refresh()
+        self.assertEqual(job.retries_left, 0)
+        self.assertEqual([], queue.job_ids)
+        # If a job is no longer retries, it's put in FailedJobRegistry
+        self.assertTrue(job in registry)
+
+    def test_total_working_time(self):
+        """worker.total_working_time is stored properly"""
+        queue = Queue()
+        job = queue.enqueue(long_running_job, 0.05)
+        worker = ThreadPoolWorker([queue])
+        worker.register_birth()
+
+        worker.perform_job(job, queue)
+        worker.refresh()
+        # total_working_time should be a little bit more than 0.05 seconds
+        self.assertGreaterEqual(worker.total_working_time, 0.05)
+        # in multi-user environments delays might be unpredictable,
+        # please adjust this magic limit accordingly in case if It takes even longer to run
+        self.assertLess(worker.total_working_time, 1)
+
+    def test_max_jobs(self):
+        """ThreadPoolWorker exits after number of jobs complete."""
+        queue = Queue()
+        job1 = queue.enqueue(do_nothing)
+        job2 = queue.enqueue(do_nothing)
+        worker = ThreadPoolWorker([queue])
+        worker.work(max_jobs=1)
+
+        self.assertEqual(JobStatus.FINISHED, job1.get_status())
+        self.assertEqual(JobStatus.QUEUED, job2.get_status())
+
+    def test_disable_default_exception_handler(self):
+        """
+        Job is not moved to FailedJobRegistry when default custom exception
+        handler is disabled.
+        """
+        queue = Queue(name='default', connection=self.testconn)
+
+        job = queue.enqueue(div_by_zero)
+        worker = ThreadPoolWorker([queue], disable_default_exception_handler=False)
+        worker.work(burst=True)
+
+        registry = FailedJobRegistry(queue=queue)
+        self.assertTrue(job in registry)
+
+        # Job is not added to FailedJobRegistry if
+        # disable_default_exception_handler is True
+        job = queue.enqueue(div_by_zero)
+        worker = ThreadPoolWorker([queue], disable_default_exception_handler=True)
+        worker.work(burst=True)
+        self.assertFalse(job in registry)
+
+    def test_custom_exc_handling(self):
+        """Custom exception handling."""
+
+        def first_handler(job, *exc_info):
+            job.meta = {'first_handler': True}
+            job.save_meta()
+            return True
+
+        def second_handler(job, *exc_info):
+            job.meta.update({'second_handler': True})
+            job.save_meta()
+
+        def black_hole(job, *exc_info):
+            # Don't fall through to default behaviour (moving to failed queue)
+            return False
+
+        q = Queue()
+        self.assertEqual(q.count, 0)
+        job = q.enqueue(div_by_zero)
+
+        w = ThreadPoolWorker([q], exception_handlers=first_handler)
+        w.work(burst=True)
+
+        # Check the job
+        job.refresh()
+        self.assertEqual(job.is_failed, True)
+        self.assertTrue(job.meta['first_handler'])
+
+        job = q.enqueue(div_by_zero)
+        w = ThreadPoolWorker([q], exception_handlers=[first_handler, second_handler])
+        w.work(burst=True)
+
+        # Both custom exception handlers are run
+        job.refresh()
+        self.assertEqual(job.is_failed, True)
+        self.assertTrue(job.meta['first_handler'])
+        self.assertTrue(job.meta['second_handler'])
+
+        job = q.enqueue(div_by_zero)
+        w = ThreadPoolWorker([q], exception_handlers=[first_handler, black_hole,
+                                            second_handler])
+        w.work(burst=True)
+
+        # second_handler is not run since it's interrupted by black_hole
+        job.refresh()
+        self.assertEqual(job.is_failed, True)
+        self.assertTrue(job.meta['first_handler'])
+        self.assertEqual(job.meta.get('second_handler'), None)
+
+    def test_deleted_jobs_arent_executed(self):
+        """Cancelling jobs."""
+
+        SENTINEL_FILE = '/tmp/rq-tests.txt'  # noqa
+
+        try:
+            # Remove the sentinel if it is leftover from a previous test run
+            os.remove(SENTINEL_FILE)
+        except OSError as e:
+            if e.errno != 2:
+                raise
+
+        q = Queue()
+        job = q.enqueue(create_file, SENTINEL_FILE)
+
+        # Here, we cancel the job, so the sentinel file may not be created
+        self.testconn.delete(job.key)
+
+        w = ThreadPoolWorker([q])
+        w.work(burst=True)
+        assert q.count == 0
+
+        # Should not have created evidence of execution
+        self.assertEqual(os.path.exists(SENTINEL_FILE), False)
+
+    @slow  # noqa
+    def test_timeouts(self):
+        """ThreadPoolWorker kills jobs after timeout."""
+        sentinel_file = '/tmp/.rq_sentinel'
+
+        q = Queue()
+        w = ThreadPoolWorker([q])
+
+        # Put it on the queue with a timeout value
+        res = q.enqueue(create_file_after_timeout,
+                        args=(sentinel_file, 4),
+                        job_timeout=1)
+
+        try:
+            os.unlink(sentinel_file)
+        except OSError as e:
+            if e.errno == 2:
+                pass
+
+        self.assertEqual(os.path.exists(sentinel_file), False)
+        w.work(burst=True)
+        self.assertEqual(os.path.exists(sentinel_file), False)
+
+        # TODO: Having to do the manual refresh() here is really ugly!
+        res.refresh()
+        self.assertIn('JobTimeoutException', as_text(res.exc_info))
+
+    def test_dequeue_job_and_maintain_ttl_non_blocking(self):
+        """Not passing a timeout should return immediately with None as a result"""
+        q = Queue()
+        w = ThreadPoolWorker([q])
+
+        # Put it on the queue with a timeout value
+        self.assertIsNone(w.dequeue_job_and_maintain_ttl(None))
+
+    def test_worker_sets_result_ttl(self):
+        """Ensure that ThreadPoolWorker properly sets result_ttl for individual jobs."""
+        q = Queue()
+        job = q.enqueue(say_hello, args=('Frank',), result_ttl=10)
+        w = ThreadPoolWorker([q])
+        self.assertIn(job.get_id().encode(), self.testconn.lrange(q.key, 0, -1))
+        w.work(burst=True)
+        self.assertNotEqual(self.testconn.ttl(job.key), 0)
+        self.assertNotIn(job.get_id().encode(), self.testconn.lrange(q.key, 0, -1))
+
+        # Job with -1 result_ttl don't expire
+        job = q.enqueue(say_hello, args=('Frank',), result_ttl=-1)
+        w = ThreadPoolWorker([q])
+        self.assertIn(job.get_id().encode(), self.testconn.lrange(q.key, 0, -1))
+        w.work(burst=True)
+        self.assertEqual(self.testconn.ttl(job.key), -1)
+        self.assertNotIn(job.get_id().encode(), self.testconn.lrange(q.key, 0, -1))
+
+        # Job with result_ttl = 0 gets deleted immediately
+        job = q.enqueue(say_hello, args=('Frank',), result_ttl=0)
+        w = ThreadPoolWorker([q])
+        self.assertIn(job.get_id().encode(), self.testconn.lrange(q.key, 0, -1))
+        w.work(burst=True)
+        self.assertEqual(self.testconn.get(job.key), None)
+        self.assertNotIn(job.get_id().encode(), self.testconn.lrange(q.key, 0, -1))
+
+    def test_worker_sets_job_status(self):
+        """Ensure that worker correctly sets job status."""
+        q = Queue()
+        w = ThreadPoolWorker([q])
+
+        job = q.enqueue(say_hello)
+        self.assertEqual(job.get_status(), JobStatus.QUEUED)
+        self.assertEqual(job.is_queued, True)
+        self.assertEqual(job.is_finished, False)
+        self.assertEqual(job.is_failed, False)
+
+        w.work(burst=True)
+        job = Job.fetch(job.id)
+        self.assertEqual(job.get_status(), JobStatus.FINISHED)
+        self.assertEqual(job.is_queued, False)
+        self.assertEqual(job.is_finished, True)
+        self.assertEqual(job.is_failed, False)
+
+        # Failed jobs should set status to "failed"
+        job = q.enqueue(div_by_zero, args=(1,))
+        w.work(burst=True)
+        job = Job.fetch(job.id)
+        self.assertEqual(job.get_status(), JobStatus.FAILED)
+        self.assertEqual(job.is_queued, False)
+        self.assertEqual(job.is_finished, False)
+        self.assertEqual(job.is_failed, True)
+
+    def test_get_current_job(self):
+        """Ensure worker.get_current_job() works properly"""
+        q = Queue()
+        worker = ThreadPoolWorker([q])
+        job = q.enqueue_call(say_hello)
+
+        self.assertEqual(self.testconn.hget(worker.key, 'current_job'), None)
+        worker.set_current_job_id(job.id)
+        self.assertEqual(
+            worker.get_current_job_id(),
+            as_text(self.testconn.hget(worker.key, 'current_job'))
+        )
+        self.assertEqual(worker.get_current_job(), job)
+
+    def test_custom_job_class(self):
+        """Ensure ThreadPoolWorker accepts custom job class."""
+        q = Queue()
+        worker = ThreadPoolWorker([q], job_class=CustomJob)
+        self.assertEqual(worker.job_class, CustomJob)
+
+    def test_custom_queue_class(self):
+        """Ensure ThreadPoolWorker accepts custom queue class."""
+        q = CustomQueue()
+        worker = ThreadPoolWorker([q], queue_class=CustomQueue)
+        self.assertEqual(worker.queue_class, CustomQueue)
+
+    def test_custom_queue_class_is_not_global(self):
+        """Ensure ThreadPoolWorker custom queue class is not global."""
+        q = CustomQueue()
+        worker_custom = ThreadPoolWorker([q], queue_class=CustomQueue)
+        q_generic = Queue()
+        worker_generic = ThreadPoolWorker([q_generic])
+        self.assertEqual(worker_custom.queue_class, CustomQueue)
+        self.assertEqual(worker_generic.queue_class, Queue)
+        self.assertEqual(ThreadPoolWorker.queue_class, Queue)
+
+    def test_custom_job_class_is_not_global(self):
+        """Ensure ThreadPoolWorker custom job class is not global."""
+        q = Queue()
+        worker_custom = ThreadPoolWorker([q], job_class=CustomJob)
+        q_generic = Queue()
+        worker_generic = ThreadPoolWorker([q_generic])
+        self.assertEqual(worker_custom.job_class, CustomJob)
+        self.assertEqual(worker_generic.job_class, Job)
+        self.assertEqual(ThreadPoolWorker.job_class, Job)
+
+    def test_prepare_job_execution(self):
+        """Prepare job execution does the necessary bookkeeping."""
+        queue = Queue(connection=self.testconn)
+        job = queue.enqueue(say_hello)
+        worker = ThreadPoolWorker([queue])
+        worker.prepare_job_execution(job)
+
+        # Updates working queue
+        registry = StartedJobRegistry(connection=self.testconn)
+        self.assertEqual(registry.get_job_ids(), [job.id])
+
+        # Updates worker's current job
+        self.assertEqual(worker.get_current_job_id(), job.id)
+
+        # job status is also updated
+        self.assertEqual(job._status, JobStatus.STARTED)
+        self.assertEqual(job.worker_name, worker.name)
+
+    def test_work_unicode_friendly(self):
+        """ThreadPoolWorker processes work with unicode description, then quits."""
+        q = Queue('foo')
+        w = ThreadPoolWorker([q])
+        job = q.enqueue('tests.fixtures.say_hello', name='Adam',
+                        description='你好 世界!')
+        self.assertEqual(w.work(burst=True), True,
+                         'Expected at least some work done.')
+        self.assertEqual(job.result, 'Hi there, Adam!')
+        self.assertEqual(job.description, '你好 世界!')
+
+    def test_work_log_unicode_friendly(self):
+        """ThreadPoolWorker process work with unicode or str other than pure ascii content,
+        logging work properly"""
+        q = Queue("foo")
+        w = ThreadPoolWorker([q])
+
+        job = q.enqueue('tests.fixtures.say_hello', name='阿达姆',
+                        description='你好 世界!')
+        w.work(burst=True)
+        self.assertEqual(job.get_status(), JobStatus.FINISHED)
+
+        job = q.enqueue('tests.fixtures.say_hello_unicode', name='阿达姆',
+                        description='你好 世界!')
+        w.work(burst=True)
+        self.assertEqual(job.get_status(), JobStatus.FINISHED)
+
+    def test_suspend_worker_execution(self):
+        """Test Pause ThreadPoolWorker Execution"""
+
+        SENTINEL_FILE = '/tmp/rq-tests.txt'  # noqa
+
+        try:
+            # Remove the sentinel if it is leftover from a previous test run
+            os.remove(SENTINEL_FILE)
+        except OSError as e:
+            if e.errno != 2:
+                raise
+
+        q = Queue()
+        q.enqueue(create_file, SENTINEL_FILE)
+
+        w = ThreadPoolWorker([q])
+
+        suspend(self.testconn)
+
+        w.work(burst=True)
+        assert q.count == 1
+
+        # Should not have created evidence of execution
+        self.assertEqual(os.path.exists(SENTINEL_FILE), False)
+
+        resume(self.testconn)
+        w.work(burst=True)
+        assert q.count == 0
+        self.assertEqual(os.path.exists(SENTINEL_FILE), True)
+
+    @slow
+    def test_suspend_with_duration(self):
+        q = Queue()
+        for _ in range(5):
+            q.enqueue(do_nothing)
+
+        w = ThreadPoolWorker([q])
+
+        # This suspends workers for working for 2 second
+        suspend(self.testconn, 2)
+
+        # So when this burst of work happens the queue should remain at 5
+        w.work(burst=True)
+        assert q.count == 5
+
+        sleep(3)
+
+        # The suspension should be expired now, and a burst of work should now clear the queue
+        w.work(burst=True)
+        assert q.count == 0
+
+    def test_worker_hash_(self):
+        """ThreadPoolWorkers are hashed by their .name attribute"""
+        q = Queue('foo')
+        w1 = ThreadPoolWorker([q], name="worker1")
+        w2 = ThreadPoolWorker([q], name="worker2")
+        w3 = ThreadPoolWorker([q], name="worker1")
+        worker_set = set([w1, w2, w3])
+        self.assertEqual(len(worker_set), 2)
+
+    def test_worker_sets_birth(self):
+        """Ensure worker correctly sets worker birth date."""
+        q = Queue()
+        w = ThreadPoolWorker([q])
+
+        w.register_birth()
+
+        birth_date = w.birth_date
+        self.assertIsNotNone(birth_date)
+        self.assertEqual(type(birth_date).__name__, 'datetime')
+
+    def test_worker_sets_death(self):
+        """Ensure worker correctly sets worker death date."""
+        q = Queue()
+        w = ThreadPoolWorker([q])
+
+        w.register_death()
+
+        death_date = w.death_date
+        self.assertIsNotNone(death_date)
+        self.assertIsInstance(death_date, datetime)
+
+    def test_clean_queue_registries(self):
+        """worker.clean_registries sets last_cleaned_at and cleans registries."""
+        foo_queue = Queue('foo', connection=self.testconn)
+        foo_registry = StartedJobRegistry('foo', connection=self.testconn)
+        self.testconn.zadd(foo_registry.key, {'foo': 1})
+        self.assertEqual(self.testconn.zcard(foo_registry.key), 1)
+
+        bar_queue = Queue('bar', connection=self.testconn)
+        bar_registry = StartedJobRegistry('bar', connection=self.testconn)
+        self.testconn.zadd(bar_registry.key, {'bar': 1})
+        self.assertEqual(self.testconn.zcard(bar_registry.key), 1)
+
+        worker = ThreadPoolWorker([foo_queue, bar_queue])
+        self.assertEqual(worker.last_cleaned_at, None)
+        worker.clean_registries()
+        self.assertNotEqual(worker.last_cleaned_at, None)
+        self.assertEqual(self.testconn.zcard(foo_registry.key), 0)
+        self.assertEqual(self.testconn.zcard(bar_registry.key), 0)
+
+        # worker.clean_registries() only runs once every 15 minutes
+        # If we add another key, calling clean_registries() should do nothing
+        self.testconn.zadd(bar_registry.key, {'bar': 1})
+        worker.clean_registries()
+        self.assertEqual(self.testconn.zcard(bar_registry.key), 1)
+
+    def test_should_run_maintenance_tasks(self):
+        """ThreadPoolWorkers should run maintenance tasks on startup and every hour."""
+        queue = Queue(connection=self.testconn)
+        worker = ThreadPoolWorker(queue)
+        self.assertTrue(worker.should_run_maintenance_tasks)
+
+        worker.last_cleaned_at = utcnow()
+        self.assertFalse(worker.should_run_maintenance_tasks)
+        worker.last_cleaned_at = utcnow() - timedelta(seconds=3700)
+        self.assertTrue(worker.should_run_maintenance_tasks)
+
+    def test_worker_calls_clean_registries(self):
+        """ThreadPoolWorker calls clean_registries when run."""
+        queue = Queue(connection=self.testconn)
+        registry = StartedJobRegistry(connection=self.testconn)
+        self.testconn.zadd(registry.key, {'foo': 1})
+
+        worker = ThreadPoolWorker(queue, connection=self.testconn)
+        worker.work(burst=True)
+        self.assertEqual(self.testconn.zcard(registry.key), 0)
+
+    def test_job_dependency_race_condition(self):
+        """Dependencies added while the job gets finished shouldn't get lost."""
+
+        # This patches the enqueue_dependents to enqueue a new dependency AFTER
+        # the original code was executed.
+        orig_enqueue_dependents = Queue.enqueue_dependents
+
+        def new_enqueue_dependents(self, job, *args, **kwargs):
+            orig_enqueue_dependents(self, job, *args, **kwargs)
+            if hasattr(Queue, '_add_enqueue') and Queue._add_enqueue is not None and Queue._add_enqueue.id == job.id:
+                Queue._add_enqueue = None
+                Queue().enqueue_call(say_hello, depends_on=job)
+
+        Queue.enqueue_dependents = new_enqueue_dependents
+
+        q = Queue()
+        w = ThreadPoolWorker([q])
+        with mock.patch.object(ThreadPoolWorker, 'execute_job', wraps=w.execute_job) as mocked:
+            parent_job = q.enqueue(say_hello, result_ttl=0)
+            Queue._add_enqueue = parent_job
+            job = q.enqueue_call(say_hello, depends_on=parent_job)
+            w.work(burst=True)
+            job = Job.fetch(job.id)
+            self.assertEqual(job.get_status(), JobStatus.FINISHED)
+            self.assertEqual(mocked.call_count, 3)
+
+    def test_self_modification_persistence(self):
+        """Make sure that any meta modification done by
+        the job itself persists completely through the
+        queue/worker/job stack."""
+        q = Queue()
+        # Also make sure that previously existing metadata
+        # persists properly
+        job = q.enqueue(modify_self, meta={'foo': 'bar', 'baz': 42},
+                        args=[{'baz': 10, 'newinfo': 'waka'}])
+
+        w = ThreadPoolWorker([q])
+        w.work(burst=True)
+
+        job_check = Job.fetch(job.id)
+        self.assertEqual(job_check.meta['foo'], 'bar')
+        self.assertEqual(job_check.meta['baz'], 10)
+        self.assertEqual(job_check.meta['newinfo'], 'waka')
+
+    def test_self_modification_persistence_with_error(self):
+        """Make sure that any meta modification done by
+        the job itself persists completely through the
+        queue/worker/job stack -- even if the job errored"""
+        q = Queue()
+        # Also make sure that previously existing metadata
+        # persists properly
+        job = q.enqueue(modify_self_and_error, meta={'foo': 'bar', 'baz': 42},
+                        args=[{'baz': 10, 'newinfo': 'waka'}])
+
+        w = ThreadPoolWorker([q])
+        w.work(burst=True)
+
+        # Postconditions
+        self.assertEqual(q.count, 0)
+        failed_job_registry = FailedJobRegistry(queue=q)
+        self.assertTrue(job in failed_job_registry)
+        self.assertEqual(w.get_current_job_id(), None)
+
+        job_check = Job.fetch(job.id)
+        self.assertEqual(job_check.meta['foo'], 'bar')
+        self.assertEqual(job_check.meta['baz'], 10)
+        self.assertEqual(job_check.meta['newinfo'], 'waka')
+
+    @mock.patch('rq.worker.logger.info')
+    def test_log_result_lifespan_true(self, mock_logger_info):
+        """Check that log_result_lifespan True causes job lifespan to be logged."""
+        q = Queue()
+
+        w = ThreadPoolWorker([q])
+        job = q.enqueue(say_hello, args=('Frank',), result_ttl=10)
+        w.perform_job(job, q)
+        mock_logger_info.assert_called_with('Result is kept for %s seconds', 10)
+        self.assertIn('Result is kept for %s seconds', [c[0][0] for c in mock_logger_info.call_args_list])
+
+    @mock.patch('rq.worker.logger.info')
+    def test_log_result_lifespan_false(self, mock_logger_info):
+        """Check that log_result_lifespan False causes job lifespan to not be logged."""
+        q = Queue()
+
+        class ThreadPoolWorker(ThreadPoolWorker):
+            log_result_lifespan = False
+
+        w = ThreadPoolWorker([q])
+        job = q.enqueue(say_hello, args=('Frank',), result_ttl=10)
+        w.perform_job(job, q)
+        self.assertNotIn('Result is kept for 10 seconds', [c[0][0] for c in mock_logger_info.call_args_list])
+
+    @mock.patch('rq.worker.logger.info')
+    def test_log_job_description_true(self, mock_logger_info):
+        """Check that log_job_description True causes job lifespan to be logged."""
+        q = Queue()
+        w = ThreadPoolWorker([q])
+        q.enqueue(say_hello, args=('Frank',), result_ttl=10)
+        w.dequeue_job_and_maintain_ttl(10)
+        self.assertIn("Frank", mock_logger_info.call_args[0][2])
+
+    @mock.patch('rq.worker.logger.info')
+    def test_log_job_description_false(self, mock_logger_info):
+        """Check that log_job_description False causes job lifespan to not be logged."""
+        q = Queue()
+        w = ThreadPoolWorker([q], log_job_description=False)
+        q.enqueue(say_hello, args=('Frank',), result_ttl=10)
+        w.dequeue_job_and_maintain_ttl(10)
+        self.assertNotIn("Frank", mock_logger_info.call_args[0][2])
+
+    def test_worker_configures_socket_timeout(self):
+        """Ensures that the worker correctly updates Redis client connection to have a socket_timeout"""
+        q = Queue()
+        _ = ThreadPoolWorker([q])
+        connection_kwargs = q.connection.connection_pool.connection_kwargs
+        self.assertEqual(connection_kwargs["socket_timeout"], 415)
+
+    def test_worker_version(self):
+        q = Queue()
+        w = ThreadPoolWorker([q])
+        w.version = '0.0.0'
+        w.register_birth()
+        self.assertEqual(w.version, '0.0.0')
+        w.refresh()
+        self.assertEqual(w.version, '0.0.0')
+        # making sure that version is preserved when worker is retrieved by key
+        worker = ThreadPoolWorker.find_by_key(w.key)
+        self.assertEqual(worker.version, '0.0.0')
+
+    def test_python_version(self):
+        python_version = sys.version
+        q = Queue()
+        w = ThreadPoolWorker([q])
+        w.register_birth()
+        self.assertEqual(w.python_version, python_version)
+        # now patching version
+        python_version = 'X.Y.Z.final'  # dummy version
+        self.assertNotEqual(python_version, sys.version)  # otherwise tests are pointless
+        w2 = ThreadPoolWorker([q])
+        w2.python_version = python_version
+        w2.register_birth()
+        self.assertEqual(w2.python_version, python_version)
+        # making sure that version is preserved when worker is retrieved by key
+        worker = ThreadPoolWorker.find_by_key(w2.key)
+        self.assertEqual(worker.python_version, python_version)

From a39497b847d5a8735b4e971c460b9a71a964af46 Mon Sep 17 00:00:00 2001
From: Caio Carvalho <21188280+lowercase00@users.noreply.github.com>
Date: Tue, 7 Feb 2023 19:09:57 -0300
Subject: [PATCH 03/19] Add Callback, Dependencies & Registration Tests

---
 rq/worker.py                      |   7 +-
 tests/test_callbacks.py           |  56 +++++++++++-
 tests/test_dependencies.py        | 140 +++++++++++++++++++++++++++++-
 tests/test_worker_registration.py | 111 +++++++++++++++++++++++
 4 files changed, 309 insertions(+), 5 deletions(-)

diff --git a/rq/worker.py b/rq/worker.py
index 4d9d840f6..fab1dc028 100644
--- a/rq/worker.py
+++ b/rq/worker.py
@@ -1408,7 +1408,7 @@ def _wait_for_slot(self):
         while 1:
             if self._is_pool_full:
                 continue
-            self.log.info('Found a slot, ready to work')
+            self.log.info('Found idle thread, ready to work')
             break
 
     def work(
@@ -1431,7 +1431,8 @@ def work(
         completed_jobs = 0
         setup_loghandlers(logging_level, date_format, log_format)
         self.register_birth()
-        self.log.info("Worker %s: started, version %s", self.key, VERSION)
+        self.log.info("ThreadpoolWorker %s: started, version %s", self.key, VERSION)
+        self.log.warning("*** WARNING: ThreadpoolWorker is in beta and may be unstable. Don't use it in production!")
         self.subscribe()
         self.set_state(WorkerStatus.STARTED)
         qnames = self.queue_names()
@@ -1455,7 +1456,7 @@ def work(
                         break
 
                     if self._is_pool_full:
-                        self.log.info('Threadpool is full, waiting for idle workers...')
+                        self.log.info('Threadpool is full, waiting for idle threads...')
                         self._wait_for_slot()
 
                     timeout = None if burst else self._get_timeout()
diff --git a/tests/test_callbacks.py b/tests/test_callbacks.py
index 680ee388a..733b379fe 100644
--- a/tests/test_callbacks.py
+++ b/tests/test_callbacks.py
@@ -5,7 +5,7 @@
 
 from rq import Queue, Worker
 from rq.job import Job, JobStatus, UNEVALUATED
-from rq.worker import SimpleWorker
+from rq.worker import SimpleWorker, ThreadPoolWorker
 
 
 class QueueCallbackTestCase(RQTestCase):
@@ -131,6 +131,60 @@ def test_failure_callback(self):
         # TODO: add test case for error while executing failure callback
 
 
+class ThreadPoolWorkerCallbackTestCase(RQTestCase):
+    def test_success_callback(self):
+        """Test success callback is executed only when job is successful"""
+        queue = Queue(connection=self.testconn)
+        worker = ThreadPoolWorker([queue])
+
+        job = queue.enqueue(say_hello, on_success=save_result)
+
+        # Callback is executed when job is successfully executed
+        worker.work(burst=True)
+        self.assertEqual(job.get_status(), JobStatus.FINISHED)
+        self.assertEqual(
+            self.testconn.get('success_callback:%s' % job.id).decode(),
+            job.return_value()
+        )
+
+        job = queue.enqueue(div_by_zero, on_success=save_result)
+        worker.work(burst=True)
+        self.assertEqual(job.get_status(), JobStatus.FAILED)
+        self.assertFalse(self.testconn.exists('success_callback:%s' % job.id))
+
+    def test_erroneous_success_callback(self):
+        """Test exception handling when executing success callback"""
+        queue = Queue(connection=self.testconn)
+        worker = ThreadPoolWorker([queue])
+
+        # If success_callback raises an error, job will is considered as failed
+        job = queue.enqueue(say_hello, on_success=erroneous_callback)
+        worker.work(burst=True)
+        self.assertEqual(job.get_status(), JobStatus.FAILED)
+
+    def test_failure_callback(self):
+        """Test failure callback is executed only when job a fails"""
+        queue = Queue(connection=self.testconn)
+        worker = ThreadPoolWorker([queue])
+
+        job = queue.enqueue(div_by_zero, on_failure=save_exception)
+
+        # Callback is executed when job is successfully executed
+        worker.work(burst=True)
+        self.assertEqual(job.get_status(), JobStatus.FAILED)
+        job.refresh()
+        print(job.exc_info)
+        self.assertIn('div_by_zero',
+                      self.testconn.get('failure_callback:%s' % job.id).decode())
+
+        job = queue.enqueue(div_by_zero, on_success=save_result)
+        worker.work(burst=True)
+        self.assertEqual(job.get_status(), JobStatus.FAILED)
+        self.assertFalse(self.testconn.exists('failure_callback:%s' % job.id))
+
+        # TODO: add test case for error while executing failure callback
+
+
 class JobCallbackTestCase(RQTestCase):
 
     def test_job_creation_with_success_callback(self):
diff --git a/tests/test_dependencies.py b/tests/test_dependencies.py
index 26b115d49..7b7bd9e12 100644
--- a/tests/test_dependencies.py
+++ b/tests/test_dependencies.py
@@ -1,3 +1,4 @@
+from rq.worker import ThreadPoolWorker
 from tests import RQTestCase
 from tests.fixtures import check_dependencies_are_met, div_by_zero, say_hello
 
@@ -116,7 +117,6 @@ def test_job_dependency(self):
 
         self.assertEqual(q.job_ids, ["fake_job_id_2", "fake_job_id_1"])
 
-
     def test_dependencies_are_met_if_parent_is_canceled(self):
         """When parent job is canceled, it should be treated as failed"""
         queue = Queue(connection=self.testconn)
@@ -161,3 +161,141 @@ def test_dependencies_are_met_at_execution_time(self):
         w = Worker([queue])
         w.work(burst=True)
         assert job_c.result
+
+
+class TestThreadpoolWorkerDependencies(RQTestCase):
+
+    def test_job_dependency(self):
+        """Enqueue dependent jobs only when appropriate"""
+        q = Queue(connection=self.testconn)
+        w = ThreadPoolWorker([q], connection=q.connection)
+
+        # enqueue dependent job when parent successfully finishes
+        parent_job = q.enqueue(say_hello)
+        job = q.enqueue_call(say_hello, depends_on=parent_job)
+        w.work(burst=True)
+        job = Job.fetch(job.id, connection=self.testconn)
+        self.assertEqual(job.get_status(), JobStatus.FINISHED)
+        q.empty()
+
+        # don't enqueue dependent job when parent fails
+        parent_job = q.enqueue(div_by_zero)
+        job = q.enqueue_call(say_hello, depends_on=parent_job)
+        w.work(burst=True)
+        job = Job.fetch(job.id, connection=self.testconn)
+        self.assertNotEqual(job.get_status(), JobStatus.FINISHED)
+        q.empty()
+
+        # don't enqueue dependent job when Dependency.allow_failure=False (the default)
+        parent_job = q.enqueue(div_by_zero)
+        dependency = Dependency(jobs=parent_job)
+        job = q.enqueue_call(say_hello, depends_on=dependency)
+        w.work(burst=True)
+        job = Job.fetch(job.id, connection=self.testconn)
+        self.assertNotEqual(job.get_status(), JobStatus.FINISHED)
+
+        # enqueue dependent job when Dependency.allow_failure=True
+        parent_job = q.enqueue(div_by_zero)
+        dependency = Dependency(jobs=parent_job, allow_failure=True)
+        job = q.enqueue_call(say_hello, depends_on=dependency)
+
+        job = Job.fetch(job.id, connection=self.testconn)
+        self.assertTrue(job.allow_dependency_failures)
+
+        w.work(burst=True)
+        job = Job.fetch(job.id, connection=self.testconn)
+        self.assertEqual(job.get_status(), JobStatus.FINISHED)
+
+        # When a failing job has multiple dependents, only enqueue those
+        # with allow_failure=True
+        parent_job = q.enqueue(div_by_zero)
+        job_allow_failure = q.enqueue(say_hello,
+                                      depends_on=Dependency(jobs=parent_job, allow_failure=True))
+        job = q.enqueue(say_hello,
+                        depends_on=Dependency(jobs=parent_job, allow_failure=False))
+        w.work(burst=True, max_jobs=1)
+        self.assertEqual(parent_job.get_status(), JobStatus.FAILED)
+        self.assertEqual(job_allow_failure.get_status(), JobStatus.QUEUED)
+        self.assertEqual(job.get_status(), JobStatus.DEFERRED)
+        q.empty()
+
+        # only enqueue dependent job when all dependencies have finished/failed
+        first_parent_job = q.enqueue(div_by_zero)
+        second_parent_job = q.enqueue(say_hello)
+        dependencies = Dependency(jobs=[first_parent_job, second_parent_job], allow_failure=True)
+        job = q.enqueue_call(say_hello, depends_on=dependencies)
+        w.work(burst=True, max_jobs=1)
+        self.assertEqual(first_parent_job.get_status(), JobStatus.FAILED)
+        self.assertEqual(second_parent_job.get_status(), JobStatus.QUEUED)
+        self.assertEqual(job.get_status(), JobStatus.DEFERRED)
+
+        # When second job finishes, dependent job should be queued
+        w.work(burst=True, max_jobs=1)
+        self.assertEqual(second_parent_job.get_status(), JobStatus.FINISHED)
+        self.assertEqual(job.get_status(), JobStatus.QUEUED)
+        w.work(burst=True)
+        job = Job.fetch(job.id, connection=self.testconn)
+        self.assertEqual(job.get_status(), JobStatus.FINISHED)
+
+        # Test dependant is enqueued at front
+        q.empty()
+        parent_job = q.enqueue(say_hello)
+        q.enqueue(
+            say_hello,
+            job_id='fake_job_id_1',
+            depends_on=Dependency(jobs=[parent_job])
+        )
+        q.enqueue(
+            say_hello,
+            job_id='fake_job_id_2',
+            depends_on=Dependency(jobs=[parent_job],enqueue_at_front=True)
+        )
+        #q.enqueue(say_hello) # This is a filler job that will act as a separator for jobs, one will be enqueued at front while the other one at the end of the queue
+        w.work(burst=True, max_jobs=1)
+
+        self.assertEqual(q.job_ids, ["fake_job_id_2", "fake_job_id_1"])
+
+    def test_dependencies_are_met_if_parent_is_canceled(self):
+        """When parent job is canceled, it should be treated as failed"""
+        queue = Queue(connection=self.testconn)
+        job = queue.enqueue(say_hello)
+        job.set_status(JobStatus.CANCELED)
+        dependent_job = queue.enqueue(say_hello, depends_on=job)
+        # dependencies_are_met() should return False, whether or not
+        # parent_job is provided
+        self.assertFalse(dependent_job.dependencies_are_met(job))
+        self.assertFalse(dependent_job.dependencies_are_met())
+
+    def test_can_enqueue_job_if_dependency_is_deleted(self):
+        queue = Queue(connection=self.testconn)
+
+        dependency_job = queue.enqueue(say_hello, result_ttl=0)
+
+        w = ThreadPoolWorker([queue])
+        w.work(burst=True)
+
+        assert queue.enqueue(say_hello, depends_on=dependency_job)
+
+    def test_dependencies_are_met_if_dependency_is_deleted(self):
+        queue = Queue(connection=self.testconn)
+
+        dependency_job = queue.enqueue(say_hello, result_ttl=0)
+        dependent_job = queue.enqueue(say_hello, depends_on=dependency_job)
+
+        w = ThreadPoolWorker([queue])
+        w.work(burst=True, max_jobs=1)
+
+        assert dependent_job.dependencies_are_met()
+        assert dependent_job.get_status() == JobStatus.QUEUED
+
+    def test_dependencies_are_met_at_execution_time(self):
+        queue = Queue(connection=self.testconn)
+        queue.empty()
+        queue.enqueue(say_hello, job_id="A")
+        queue.enqueue(say_hello, job_id="B")
+        job_c = queue.enqueue(check_dependencies_are_met, job_id="C", depends_on=["A", "B"])
+
+        job_c.dependencies_are_met()
+        w = ThreadPoolWorker([queue])
+        w.work(burst=True)
+        assert job_c.result
diff --git a/tests/test_worker_registration.py b/tests/test_worker_registration.py
index 30a3c822a..936d4c024 100644
--- a/tests/test_worker_registration.py
+++ b/tests/test_worker_registration.py
@@ -1,4 +1,5 @@
 from rq.utils import ceildiv
+from rq.worker import ThreadPoolWorker
 from tests import RQTestCase
 from unittest.mock import patch
 
@@ -116,3 +117,113 @@ def test_clean_large_registry(self):
 
             expected_call_count = (ceildiv(MAX_WORKERS, MAX_KEYS)) * SREM_CALL_COUNT
             self.assertEqual(pipeline_mock.return_value.__enter__.return_value.srem.call_count, expected_call_count)
+
+
+class TestThreadPoolWorkerRegistry(RQTestCase):
+
+    def test_worker_registration(self):
+        """Ensure worker.key is correctly set in Redis."""
+        foo_queue = Queue(name='foo')
+        bar_queue = Queue(name='bar')
+        worker = ThreadPoolWorker([foo_queue, bar_queue])
+
+        register(worker)
+        redis = worker.connection
+
+        self.assertTrue(redis.sismember(worker.redis_workers_keys, worker.key))
+        self.assertEqual(Worker.count(connection=redis), 1)
+        self.assertTrue(
+            redis.sismember(WORKERS_BY_QUEUE_KEY % foo_queue.name, worker.key)
+        )
+        self.assertEqual(Worker.count(queue=foo_queue), 1)
+        self.assertTrue(
+            redis.sismember(WORKERS_BY_QUEUE_KEY % bar_queue.name, worker.key)
+        )
+        self.assertEqual(Worker.count(queue=bar_queue), 1)
+
+        unregister(worker)
+        self.assertFalse(redis.sismember(worker.redis_workers_keys, worker.key))
+        self.assertFalse(
+            redis.sismember(WORKERS_BY_QUEUE_KEY % foo_queue.name, worker.key)
+        )
+        self.assertFalse(
+            redis.sismember(WORKERS_BY_QUEUE_KEY % bar_queue.name, worker.key)
+        )
+
+    def test_get_keys_by_queue(self):
+        """get_keys_by_queue only returns active workers for that queue"""
+        foo_queue = Queue(name='foo')
+        bar_queue = Queue(name='bar')
+        baz_queue = Queue(name='baz')
+
+        worker1 = ThreadPoolWorker([foo_queue, bar_queue])
+        worker2 = ThreadPoolWorker([foo_queue])
+        worker3 = ThreadPoolWorker([baz_queue])
+
+        self.assertEqual(set(), get_keys(foo_queue))
+
+        register(worker1)
+        register(worker2)
+        register(worker3)
+
+        # get_keys(queue) will return worker keys for that queue
+        self.assertEqual(
+            set([worker1.key, worker2.key]),
+            get_keys(foo_queue)
+        )
+        self.assertEqual(set([worker1.key]), get_keys(bar_queue))
+
+        # get_keys(connection=connection) will return all worker keys
+        self.assertEqual(
+            set([worker1.key, worker2.key, worker3.key]),
+            get_keys(connection=worker1.connection)
+        )
+
+        # Calling get_keys without arguments raises an exception
+        self.assertRaises(ValueError, get_keys)
+
+        unregister(worker1)
+        unregister(worker2)
+        unregister(worker3)
+
+    def test_clean_registry(self):
+        """clean_registry removes worker keys that don't exist in Redis"""
+        queue = Queue(name='foo')
+        worker = ThreadPoolWorker([queue])
+
+        register(worker)
+        redis = worker.connection
+
+        self.assertTrue(redis.sismember(worker.redis_workers_keys, worker.key))
+        self.assertTrue(redis.sismember(REDIS_WORKER_KEYS, worker.key))
+
+        clean_worker_registry(queue)
+        self.assertFalse(redis.sismember(worker.redis_workers_keys, worker.key))
+        self.assertFalse(redis.sismember(REDIS_WORKER_KEYS, worker.key))
+
+    def test_clean_large_registry(self):
+        """
+        clean_registry() splits invalid_keys into multiple lists for set removal to avoid sending more than redis can
+        receive
+        """
+        MAX_WORKERS = 41
+        MAX_KEYS = 37
+        # srem is called twice per invalid key batch: once for WORKERS_BY_QUEUE_KEY; once for REDIS_WORKER_KEYS
+        SREM_CALL_COUNT = 2
+
+        queue = Queue(name='foo')
+        for i in range(MAX_WORKERS):
+            worker = ThreadPoolWorker([queue])
+            register(worker)
+
+        with patch('rq.worker_registration.MAX_KEYS', MAX_KEYS), \
+             patch.object(queue.connection, 'pipeline', wraps=queue.connection.pipeline) as pipeline_mock:
+            # clean_worker_registry creates a pipeline with a context manager. Configure the mock using the context
+            # manager entry method __enter__
+            pipeline_mock.return_value.__enter__.return_value.srem.return_value = None
+            pipeline_mock.return_value.__enter__.return_value.execute.return_value = [0] * MAX_WORKERS
+
+            clean_worker_registry(queue)
+
+            expected_call_count = (ceildiv(MAX_WORKERS, MAX_KEYS)) * SREM_CALL_COUNT
+            self.assertEqual(pipeline_mock.return_value.__enter__.return_value.srem.call_count, expected_call_count)

From 0bf680901b7e39163c37ed362e70b78303bbbb29 Mon Sep 17 00:00:00 2001
From: Caio Carvalho <21188280+lowercase00@users.noreply.github.com>
Date: Fri, 10 Feb 2023 09:22:35 -0300
Subject: [PATCH 04/19] Remove lifespan log test

This test is generic and doesn't really test the Threadworker
It doesn't make much sense to this being tested in every worker.
---
 tests/test_worker.py | 13 -------------
 1 file changed, 13 deletions(-)

diff --git a/tests/test_worker.py b/tests/test_worker.py
index d90b81c3e..243bf8be8 100644
--- a/tests/test_worker.py
+++ b/tests/test_worker.py
@@ -2357,19 +2357,6 @@ def test_log_result_lifespan_true(self, mock_logger_info):
         mock_logger_info.assert_called_with('Result is kept for %s seconds', 10)
         self.assertIn('Result is kept for %s seconds', [c[0][0] for c in mock_logger_info.call_args_list])
 
-    @mock.patch('rq.worker.logger.info')
-    def test_log_result_lifespan_false(self, mock_logger_info):
-        """Check that log_result_lifespan False causes job lifespan to not be logged."""
-        q = Queue()
-
-        class ThreadPoolWorker(ThreadPoolWorker):
-            log_result_lifespan = False
-
-        w = ThreadPoolWorker([q])
-        job = q.enqueue(say_hello, args=('Frank',), result_ttl=10)
-        w.perform_job(job, q)
-        self.assertNotIn('Result is kept for 10 seconds', [c[0][0] for c in mock_logger_info.call_args_list])
-
     @mock.patch('rq.worker.logger.info')
     def test_log_job_description_true(self, mock_logger_info):
         """Check that log_job_description True causes job lifespan to be logged."""

From 23b1f976d39eef3c935ea13e35f367dccb076c86 Mon Sep 17 00:00:00 2001
From: Caio Carvalho <21188280+lowercase00@users.noreply.github.com>
Date: Sat, 11 Feb 2023 20:53:07 -0300
Subject: [PATCH 05/19] fix: multhread & job dependencies

---
 rq/worker.py | 47 +++++++++++++++++++++++++++++++++++++++++------
 1 file changed, 41 insertions(+), 6 deletions(-)

diff --git a/rq/worker.py b/rq/worker.py
index fab1dc028..5f88f9009 100644
--- a/rq/worker.py
+++ b/rq/worker.py
@@ -15,8 +15,8 @@
 from enum import Enum
 from uuid import uuid4
 from random import shuffle
-from typing import Callable, List, Optional, TYPE_CHECKING, Type
-from concurrent.futures import ThreadPoolExecutor
+from typing import Callable, List, Optional, TYPE_CHECKING, Tuple, Type
+from concurrent.futures import Future, ThreadPoolExecutor
 
 if TYPE_CHECKING:
     from redis import Redis
@@ -1392,6 +1392,7 @@ def __init__(self, *args, **kwargs):
         self.executor = ThreadPoolExecutor(max_workers=self.threadpool_size, thread_name_prefix="rq_workers_")
         self._idle_threads = self.threadpool_size
         self._lock = threading.Lock()
+        self._current_jobs: List[Tuple['Job', 'Future']] = []
         super(ThreadPoolWorker, self).__init__(*args, **kwargs)
 
     @property
@@ -1400,7 +1401,7 @@ def _is_pool_full(self):
             return True
         return False
 
-    def _change_idle_counter(self, operation):
+    def __change_idle_counter(self, operation):
         with self._lock:
             self._idle_threads += operation
 
@@ -1463,7 +1464,11 @@ def work(
                     result = self.dequeue_job_and_maintain_ttl(timeout)
                     if result is None:
                         if burst:
+                            has_pending_dependents = self.__check_pending_dependents()
+                            if has_pending_dependents:
+                                continue
                             self.log.info("Worker %s: done, quitting", self.key)
+                            break
                         break
 
                     job, queue = result
@@ -1497,16 +1502,46 @@ def work(
 
         return bool(completed_jobs)
 
+    def __check_pending_dependents(self) -> bool:
+        """Checks whether any job that's current being executed in the pool has dependents.
+        If there are dependents, appends it to a `pending_dependents` array.
+        If this array has items (> 0), we know something that's currently running must enqueue dependents
+        before we can actually stop a worker (on burst mode, for example).
+        If there are dependents returns True, False otherwise.
+
+        Returns:
+            pending_dependents (bool): Whether any job currently running has dependents.
+        """
+        pending_dependents = []
+        for job, _ in self._current_jobs:
+            if not job.dependents_key:
+                continue
+            pending_dependents.append(job)
+        if len(pending_dependents) > 0:
+            return True
+        return False
+
     def execute_job(self, job, queue):
-        def job_done(child):
-            self._change_idle_counter(+1)
+        def job_done(future: Future):
+            """Callback function that runs after the job (future) is finished.
+            This will update the `idle_counter` object and update the `_current_jobs` array,
+            removing the job that just finished from the list.
+
+            Args:
+                future (Future): The Future object.
+            """
+            self.__change_idle_counter(+1)
             self.heartbeat()
+            job_element = list(filter(lambda x: id(x[1]) == id(future), self._current_jobs))
+            for el in job_element:
+                self._current_jobs.remove(el)
             if job.get_status() == JobStatus.FINISHED:
                 queue.enqueue_dependents(job)
 
         self.log.info("Executing job %s from %s", blue(job.id), green(queue.name))
         future = self.executor.submit(self.perform_job, job, queue)
-        self._change_idle_counter(-1)
+        self._current_jobs.append((job, future))
+        self.__change_idle_counter(-1)
         future.add_done_callback(job_done)
 
     def _shutdown(self):

From 8b18764edb801c76d9100b17b7befbf0f1d34b78 Mon Sep 17 00:00:00 2001
From: Caio Carvalho <21188280+lowercase00@users.noreply.github.com>
Date: Sat, 11 Feb 2023 20:53:26 -0300
Subject: [PATCH 06/19] docs: Add documentation for ThreadpoolWorker

---
 docs/docs/workers.md | 71 ++++++++++++++++++++++++++++++++++++++++++++
 1 file changed, 71 insertions(+)

diff --git a/docs/docs/workers.md b/docs/docs/workers.md
index d19451fe0..c69230007 100644
--- a/docs/docs/workers.md
+++ b/docs/docs/workers.md
@@ -444,3 +444,74 @@ redis = Redis()
 # This will raise an exception if job is invalid or not currently executing
 send_stop_job_command(redis, job_id)
 ```
+
+
+## Concurrency
+_New in version 1.12.2._
+
+<div class="warning">
+    <img style="float: right; margin-right: -60px; margin-top: -38px" src="/img/warning.png" />
+    <strong>Warning:</strong>
+    <p>
+        This feature is experimental, unstable and may have bugs and/or not function properly.
+        Please do not use this in production.
+    </p>
+</div>
+
+The simplest way of running jobs concurrently is just running multiple workers.
+This will give you the horizontal scalability benefits, and the performance needed for most use cases.
+To run multiple workers just run `rq worker` at two separate terminal windows - you just need to make sure worker names are unique.
+
+As of `v1.12.2`, `rq` now has native support for a `ThreadPoolWorker`, a multithreaded worker based on the `ThreadPoolExecutor` from the `concurrent.futures` library. This custom worker class runs a single worker process, but executes each job in a thread from a `ThreadPool`.
+
+That means that the dequeueing process is always controlled by the main workers' process, and only the task is executed within the thread.
+It also means that `fork()` is not used, which can be a downside or upside depending on the use-case/environment.
+
+The thread-based concurrency model is normally well suited for I/O-bound applications (think of network requests, database operations, file I/O, etc.),
+since the threads will be cooperative between them (yielding execution while waiting), without actually running in parallel.
+
+To run the `ThreadPoolWorker`:
+
+```python
+from redis import Redis
+from rq import Queue, ThreadPoolWorker
+
+q = Queue(connection=Redis())
+w = ThreadPoolWorker([q], connection=q.connection)
+w.work()
+```
+
+As each job is being in run its own thread, waiting operations are done concurrently (not in parallel, even though it may look like it).
+
+```python
+from redis import Redis
+from rq import Queue, ThreadPoolWorker
+
+def my_io_heavy_task(time):
+   time.sleep(time)
+   return
+
+q = Queue(connection=Redis())
+q.enqueue(my_io_heavy_task, 1)
+q.enqueue(my_io_heavy_task, 1)
+
+w = ThreadPoolWorker([q], connection=q.connection)
+w.work(burst=True)
+
+# This will take ~1sec instead of ~2sec when running with the default worker.
+1 > w.total_working_time > 1.1
+```
+
+By default, the number of threads available for `ThreadPoolWorker` will be 5 times the number of CPU cores available (as per the `cpu_count` function from `multiprocessing`) - this is a sane default and the same value used by the `concurrent.futures` library.
+This should be enough in most cases, but you can always customize the pool size according to your specific needs by using the `pool_size` param to the worker.
+
+```python
+w = ThreadPoolWorker([q], connection=q.connection, pool_size=12)
+```
+
+There are relevant limitations to the `ThreadPoolWorker`, here's a non extensive list:
+
+- Dependencies might not behave like expected
+- Job registries may not be reliable (specially with jobs that were timed out)
+- The implementation does not consider thread-safety aspects of the job itself, so make sure your code is thread safe before using this
+-

From 78af69bdbd98907753d78e039db53627866358cd Mon Sep 17 00:00:00 2001
From: lowercase00 <21188280+lowercase00@users.noreply.github.com>
Date: Sat, 11 Feb 2023 21:59:04 -0300
Subject: [PATCH 07/19] docs/feat: black, docstrings, refactoring

---
 rq/cli/cli.py              |   1 -
 rq/cli/helpers.py          |   2 -
 rq/worker.py               | 155 +++++++++++++++++++++----------------
 tests/test_dependencies.py |   2 +-
 tests/test_worker.py       |   2 +-
 5 files changed, 90 insertions(+), 72 deletions(-)

diff --git a/rq/cli/cli.py b/rq/cli/cli.py
index f7810106a..2db22e966 100755
--- a/rq/cli/cli.py
+++ b/rq/cli/cli.py
@@ -174,7 +174,6 @@ def info(cli_config, interval, raw, only_queues, only_workers, by_queue, queues,
 
     try:
         with Connection(cli_config.connection):
-
             if queues:
                 qs = list(map(cli_config.queue_class, queues))
             else:
diff --git a/rq/cli/helpers.py b/rq/cli/helpers.py
index fb201090a..53bc01910 100644
--- a/rq/cli/helpers.py
+++ b/rq/cli/helpers.py
@@ -100,7 +100,6 @@ def state_symbol(state):
 
 
 def show_queues(queues, raw, by_queue, queue_class, worker_class):
-
     num_jobs = 0
     termwidth = get_terminal_size().columns
     chartwidth = min(20, termwidth - 20)
@@ -141,7 +140,6 @@ def show_workers(queues, raw, by_queue, queue_class, worker_class):
             workers.add(worker)
 
     if not by_queue:
-
         for worker in workers:
             queue_names = ', '.join(worker.queue_names())
             name = '%s (%s %s %s)' % (worker.name, worker.hostname, worker.ip_address, worker.pid)
diff --git a/rq/worker.py b/rq/worker.py
index 5f88f9009..ecccc0d97 100644
--- a/rq/worker.py
+++ b/rq/worker.py
@@ -9,8 +9,7 @@
 import time
 import traceback
 import warnings
-
-
+from concurrent.futures import Future, ThreadPoolExecutor
 from datetime import timedelta
 from enum import Enum
 from uuid import uuid4
@@ -39,22 +38,29 @@
     DEFAULT_MAINTENANCE_TASK_INTERVAL,
     DEFAULT_RESULT_TTL,
     DEFAULT_WORKER_TTL,
-    DEFAULT_JOB_MONITORING_INTERVAL,
-    DEFAULT_LOGGING_FORMAT,
-    DEFAULT_LOGGING_DATE_FORMAT,
 )
-from .exceptions import DeserializationError, DequeueTimeout, ShutDownImminentException
+from .exceptions import DequeueTimeout, DeserializationError, ShutDownImminentException
 from .job import Job, JobStatus
 from .logutils import setup_loghandlers
 from .queue import Queue
 from .registry import StartedJobRegistry, clean_registries
 from .scheduler import RQScheduler
+from .serializers import resolve_serializer
 from .suspension import is_suspended
-from .timeouts import JobTimeoutException, HorseMonitorTimeoutException, TimerDeathPenalty, UnixSignalDeathPenalty
-from .utils import backend_class, ensure_list, get_version, make_colorizer, utcformat, utcnow, utcparse, compact
+from .timeouts import HorseMonitorTimeoutException, JobTimeoutException, TimerDeathPenalty, UnixSignalDeathPenalty
+from .utils import (
+    as_text,
+    backend_class,
+    compact,
+    ensure_list,
+    get_version,
+    make_colorizer,
+    utcformat,
+    utcnow,
+    utcparse,
+)
 from .version import VERSION
 from .worker_registration import clean_worker_registry, get_keys
-from .serializers import resolve_serializer
 
 try:
     from setproctitle import setproctitle as setprocname
@@ -1384,7 +1390,6 @@ def reorder_queues(self, reference_queue):
 
 
 class ThreadPoolWorker(Worker):
-
     death_penalty_class = TimerDeathPenalty
 
     def __init__(self, *args, **kwargs):
@@ -1392,26 +1397,21 @@ def __init__(self, *args, **kwargs):
         self.executor = ThreadPoolExecutor(max_workers=self.threadpool_size, thread_name_prefix="rq_workers_")
         self._idle_threads = self.threadpool_size
         self._lock = threading.Lock()
-        self._current_jobs: List[Tuple['Job', 'Future']] = []
+        self._current_jobs: List[Tuple['Job', 'Future']] = []  # type: ignore
         super(ThreadPoolWorker, self).__init__(*args, **kwargs)
 
     @property
-    def _is_pool_full(self):
+    def is_pool_full(self):
+        """Checks whether the thread pool is full.
+        Returns True if there are no idle threads, False otherwise
+
+        Returns:
+            is_full (bool): True if full, False otherwise.
+        """
         if self._idle_threads == 0:
             return True
         return False
 
-    def __change_idle_counter(self, operation):
-        with self._lock:
-            self._idle_threads += operation
-
-    def _wait_for_slot(self):
-        while 1:
-            if self._is_pool_full:
-                continue
-            self.log.info('Found idle thread, ready to work')
-            break
-
     def work(
         self,
         burst: bool = False,
@@ -1423,8 +1423,8 @@ def work(
     ):
         """Starts the work loop.
 
-        Pops and performs all jobs on the current list of queues.  When all
-        queues are empty, block and wait for new jobs to arrive on any of the
+        Pops jobs from the current list of queues, and submits each job to the ThreadPool.
+        When all queues are empty, block and wait for new jobs to arrive on any of the
         queues, unless `burst` mode is enabled.
 
         The return value indicates whether any jobs were processed.
@@ -1432,8 +1432,8 @@ def work(
         completed_jobs = 0
         setup_loghandlers(logging_level, date_format, log_format)
         self.register_birth()
-        self.log.info("ThreadpoolWorker %s: started, version %s", self.key, VERSION)
-        self.log.warning("*** WARNING: ThreadpoolWorker is in beta and may be unstable. Don't use it in production!")
+        self.log.info("ThreadPoolWorker %s: started, version %s", self.key, VERSION)
+        self.log.warning("*** WARNING: ThreadPoolWorker is in beta and may be unstable. Don't use it in production!")
         self.subscribe()
         self.set_state(WorkerStatus.STARTED)
         qnames = self.queue_names()
@@ -1456,19 +1456,19 @@ def work(
                         self.log.info('Worker %s: stopping on request', self.key)
                         break
 
-                    if self._is_pool_full:
-                        self.log.info('Threadpool is full, waiting for idle threads...')
-                        self._wait_for_slot()
+                    if self.is_pool_full:
+                        self.log.info('ThreadPool is full, waiting for idle threads...')
+                        self.__wait_for_slot()
 
                     timeout = None if burst else self._get_timeout()
                     result = self.dequeue_job_and_maintain_ttl(timeout)
                     if result is None:
-                        if burst:
-                            has_pending_dependents = self.__check_pending_dependents()
-                            if has_pending_dependents:
-                                continue
-                            self.log.info("Worker %s: done, quitting", self.key)
+                        if not burst:
                             break
+                        has_pending_dependents = self.__check_pending_dependents()
+                        if has_pending_dependents:
+                            continue
+                        self.log.info("Worker %s: done, quitting", self.key)
                         break
 
                     job, queue = result
@@ -1478,9 +1478,10 @@ def work(
 
                     completed_jobs += 1
                     if max_jobs is not None:
-                        if completed_jobs >= max_jobs:
-                            self.log.info("Worker %s: finished executing %d jobs, quitting", self.key, completed_jobs)
-                            break
+                        if completed_jobs < max_jobs:
+                            continue
+                        self.log.info("Worker %s: finished executing %d jobs, quitting", self.key, completed_jobs)
+                        break
 
                 except redis.exceptions.TimeoutError:
                     self.log.error(f"Worker {self.key}: Redis connection timeout, quitting...")
@@ -1502,25 +1503,6 @@ def work(
 
         return bool(completed_jobs)
 
-    def __check_pending_dependents(self) -> bool:
-        """Checks whether any job that's current being executed in the pool has dependents.
-        If there are dependents, appends it to a `pending_dependents` array.
-        If this array has items (> 0), we know something that's currently running must enqueue dependents
-        before we can actually stop a worker (on burst mode, for example).
-        If there are dependents returns True, False otherwise.
-
-        Returns:
-            pending_dependents (bool): Whether any job currently running has dependents.
-        """
-        pending_dependents = []
-        for job, _ in self._current_jobs:
-            if not job.dependents_key:
-                continue
-            pending_dependents.append(job)
-        if len(pending_dependents) > 0:
-            return True
-        return False
-
     def execute_job(self, job, queue):
         def job_done(future: Future):
             """Callback function that runs after the job (future) is finished.
@@ -1544,21 +1526,60 @@ def job_done(future: Future):
         self.__change_idle_counter(-1)
         future.add_done_callback(job_done)
 
+    def __change_idle_counter(self, operation: int):
+        """Updates the idle threads counter using a lock to make it safe.
+
+        Args:
+            operation (int): +1 to increment, -1 to decrement.
+        """
+        with self._lock:
+            self._idle_threads += operation
+
+    def __wait_for_slot(self, waiting_period: float = 0.25):
+        """Waits for a free slot in the thread pool.
+        Sleeps for `waiting_period` seconds to avoid high CPU burden on long jobs.
+
+        Args:
+            waiting_period (float, 0.25): How long to wait between each check. Default to 0.25 second.
+        """
+        while 1:
+            if not self.is_pool_full:
+                self.log.info('Found idle thread, ready to work')
+                break
+            time.sleep(waiting_period)
+            continue
+
+    def __check_pending_dependents(self) -> bool:
+        """Checks whether any job that's current being executed in the pool has dependents.
+        If there are dependents, appends it to a `pending_dependents` array.
+        If this array has items (> 0), we know something that's currently running must enqueue dependents
+        before we can actually stop a worker (on burst mode, for example).
+        If there are dependents returns True, False otherwise.
+
+        Returns:
+            pending_dependents (bool): Whether any job currently running has dependents.
+        """
+        pending_dependents = []
+        for job, _ in self._current_jobs:
+            if not job.dependents_key:
+                continue
+            pending_dependents.append(job)
+        if len(pending_dependents) > 0:
+            return True
+        return False
+
     def _shutdown(self):
         """
         If shutdown is requested in the middle of a job, wait until
         finish before shutting down and save the request in redis
         """
-        if self.get_state() == WorkerStatus.BUSY:
-            self._stop_requested = True
-            self.set_shutdown_requested_date()
-            self.log.debug('Stopping after current horse is finished. '
-                           'Press Ctrl+C again for a cold shutdown.')
-            self.executor.shutdown()
-            if self.scheduler:
-                self.stop_scheduler()
-        else:
+        if self.get_state() != WorkerStatus.BUSY:
             if self.scheduler:
                 self.stop_scheduler()
             raise StopRequested()
-
+        self._stop_requested = True
+        self.set_shutdown_requested_date()
+        self.log.debug('Stopping after current horse is finished. ' 'Press Ctrl+C again for a cold shutdown.')
+        self.executor.shutdown()
+        if self.scheduler:
+            self.stop_scheduler()
diff --git a/tests/test_dependencies.py b/tests/test_dependencies.py
index 7b7bd9e12..5343a9709 100644
--- a/tests/test_dependencies.py
+++ b/tests/test_dependencies.py
@@ -163,7 +163,7 @@ def test_dependencies_are_met_at_execution_time(self):
         assert job_c.result
 
 
-class TestThreadpoolWorkerDependencies(RQTestCase):
+class TestThreadPoolWorkerDependencies(RQTestCase):
 
     def test_job_dependency(self):
         """Enqueue dependent jobs only when appropriate"""
diff --git a/tests/test_worker.py b/tests/test_worker.py
index 243bf8be8..3679bdb84 100644
--- a/tests/test_worker.py
+++ b/tests/test_worker.py
@@ -1428,7 +1428,7 @@ def test_random_worker(self):
         self.assertEqual(sorted_ids, expected_ser)
 
 
-class TestThreadpoolWorker(RQTestCase):
+class TestThreadPoolWorker(RQTestCase):
 
     def test_create_worker(self):
         """ThreadPoolWorker creation using various inputs."""

From 2bc3197bef4826c697b796c8aacf58e1011bba69 Mon Sep 17 00:00:00 2001
From: lowercase00 <21188280+lowercase00@users.noreply.github.com>
Date: Sat, 11 Feb 2023 22:07:32 -0300
Subject: [PATCH 08/19] fix: missing imports

---
 rq/worker.py | 7 ++++---
 1 file changed, 4 insertions(+), 3 deletions(-)

diff --git a/rq/worker.py b/rq/worker.py
index ecccc0d97..11e0d3bd7 100644
--- a/rq/worker.py
+++ b/rq/worker.py
@@ -15,7 +15,6 @@
 from uuid import uuid4
 from random import shuffle
 from typing import Callable, List, Optional, TYPE_CHECKING, Tuple, Type
-from concurrent.futures import Future, ThreadPoolExecutor
 
 if TYPE_CHECKING:
     from redis import Redis
@@ -30,14 +29,16 @@
 
 from . import worker_registration
 from .command import parse_payload, PUBSUB_CHANNEL_TEMPLATE, handle_command
-from .utils import as_text
 from .connections import get_current_connection, push_connection, pop_connection
 
 from .defaults import (
     CALLBACK_TIMEOUT,
+    DEFAULT_JOB_MONITORING_INTERVAL,
     DEFAULT_MAINTENANCE_TASK_INTERVAL,
     DEFAULT_RESULT_TTL,
     DEFAULT_WORKER_TTL,
+    DEFAULT_LOGGING_DATE_FORMAT,
+    DEFAULT_LOGGING_FORMAT,
 )
 from .exceptions import DequeueTimeout, DeserializationError, ShutDownImminentException
 from .job import Job, JobStatus
@@ -1049,7 +1050,7 @@ def prepare_job_execution(self, job: 'Job'):
 
             job.prepare_for_execution(self.name, pipeline=pipeline)
             pipeline.execute()
-            self.log.debug(f"Job preparation finished.")
+            self.log.debug("Job preparation finished.")
 
         msg = 'Processing {0} from {1} since {2}'
         self.procline(msg.format(job.func_name, job.origin, time.time()))

From 64142700c2561aa24fa167756f5865d29a180b27 Mon Sep 17 00:00:00 2001
From: Caio Carvalho <21188280+lowercase00@users.noreply.github.com>
Date: Mon, 6 Feb 2023 08:45:15 -0300
Subject: [PATCH 09/19] Multithreading first WIP

---
 rq/worker.py | 212 ++++++++++++++++++++++++++++++++++++++++++++++++++-
 1 file changed, 211 insertions(+), 1 deletion(-)

diff --git a/rq/worker.py b/rq/worker.py
index 3dd7bd616..65e409f61 100644
--- a/rq/worker.py
+++ b/rq/worker.py
@@ -1,3 +1,4 @@
+from concurrent.futures import ThreadPoolExecutor
 import errno
 import logging
 import os
@@ -47,7 +48,7 @@
 from .registry import StartedJobRegistry, clean_registries
 from .scheduler import RQScheduler
 from .suspension import is_suspended
-from .timeouts import JobTimeoutException, HorseMonitorTimeoutException, UnixSignalDeathPenalty
+from .timeouts import JobTimeoutException, HorseMonitorTimeoutException, TimerDeathPenalty, UnixSignalDeathPenalty
 from .utils import backend_class, ensure_list, get_version, make_colorizer, utcformat, utcnow, utcparse, compact
 from .version import VERSION
 from .worker_registration import clean_worker_registry, get_keys
@@ -1378,3 +1379,212 @@ class RandomWorker(Worker):
 
     def reorder_queues(self, reference_queue):
         shuffle(self._ordered_queues)
+
+
+class ThreadPoolWorker(Worker):
+
+    death_penalty_class = TimerDeathPenalty
+
+    def __init__(self, *args, **kwargs):
+        self.threadpool_size = kwargs.pop('pool_size', 12)
+        self.executor = ThreadPoolExecutor(max_workers=self.threadpool_size)
+        self._idle_threads = self.threadpool_size
+        super(ThreadPoolWorker, self).__init__(*args, **kwargs)
+
+    @property
+    def idle_threads(self):
+        size = self.executor._work_queue.qsize()
+        if size <= self.threadpool_size:
+            return True
+        return False
+
+    def _original_work(
+        self,
+        burst: bool = False,
+        logging_level: str = "INFO",
+        date_format=DEFAULT_LOGGING_DATE_FORMAT,
+        log_format=DEFAULT_LOGGING_FORMAT,
+        max_jobs=None,
+        with_scheduler: bool = False,
+    ):
+        """Starts the work loop.
+
+        Pops and performs all jobs on the current list of queues.  When all
+        queues are empty, block and wait for new jobs to arrive on any of the
+        queues, unless `burst` mode is enabled.
+
+        The return value indicates whether any jobs were processed.
+        """
+        completed_jobs = 0
+        setup_loghandlers(logging_level, date_format, log_format)
+        self.register_birth()
+        self.log.info("Worker %s: started, version %s", self.key, VERSION)
+        self.subscribe()
+        self.set_state(WorkerStatus.STARTED)
+        qnames = self.queue_names()
+        self.log.info('*** Listening on %s...', green(', '.join(qnames)))
+
+        if with_scheduler:
+            # Make scheduler ready.
+            pass
+
+        self._install_signal_handlers()
+        try:
+            while True:
+                try:
+                    self.check_for_suspension(burst)
+
+                    if self.should_run_maintenance_tasks:
+                        self.run_maintenance_tasks()
+
+                    if self._stop_requested:
+                        self.log.info('Worker %s: stopping on request', self.key)
+                        break
+
+                    if not self.idle_threads:
+                        self.log.info('Threadpool is full, waiting...')
+                        time.sleep
+                        break
+
+                    timeout = None if burst else self._get_timeout()
+                    result = self.dequeue_job_and_maintain_ttl(timeout)
+                    if result is None:
+                        if burst:
+                            self.log.info("Worker %s: done, quitting", self.key)
+                        break
+
+                    job, queue = result
+                    self.reorder_queues(reference_queue=queue)
+                    self.execute_job(job, queue)
+                    self.heartbeat()
+
+                    completed_jobs += 1
+                    if max_jobs is not None:
+                        if completed_jobs >= max_jobs:
+                            self.log.info("Worker %s: finished executing %d jobs, quitting", self.key, completed_jobs)
+                            break
+
+                except redis.exceptions.TimeoutError:
+                    self.log.error(f"Worker {self.key}: Redis connection timeout, quitting...")
+                    break
+
+                except StopRequested:
+                    break
+
+                except SystemExit:
+                    # Cold shutdown detected
+                    raise
+
+                except:  # noqa
+                    self.log.error('Worker %s: found an unhandled exception, quitting...', self.key, exc_info=True)
+                    break
+        finally:
+            self.register_death()
+            self.unsubscribe()
+
+        return bool(completed_jobs)
+
+
+    def work(self, burst=False, logging_level="INFO", date_format=DEFAULT_LOGGING_DATE_FORMAT,
+             log_format=DEFAULT_LOGGING_FORMAT, max_jobs=None, with_scheduler=False):
+        """Starts the work loop.
+        Pops and performs all jobs on the current list of queues.  When all
+        queues are empty, block and wait for new jobs to arrive on any of the
+        queues, unless `burst` mode is enabled.
+        The return value indicates whether any jobs were processed.
+        """
+        setup_loghandlers(logging_level, date_format, log_format)
+        completed_jobs = 0
+        self.register_birth()
+        self.log.info("Worker %s: started, version %s", self.key, VERSION)
+        self.subscribe()
+        self.set_state(WorkerStatus.STARTED)
+        qnames = self.queue_names()
+        self.log.info('*** Listening on %s...', green(', '.join(qnames)))
+
+        try:
+            while True:
+                self.check_for_suspension(burst)
+                if self.should_run_maintenance_tasks:
+                    self.run_maintenance_tasks()
+                if self._stop_requested:
+                    self.log.info("Stopping on request.")
+                    break
+                timeout = None if burst else max(1, self.default_worker_ttl - 60)
+                try:
+                    result = self.dequeue_job(timeout)
+                    if result is None:
+                        if burst:
+                            self.log.info("Worker %s: done. Will finish current running tasks and quit.", self.key)
+                        break
+                except StopRequested:
+                    break
+
+                job, queue = result
+                self.execute_job(job, queue)
+                completed_jobs += 1
+                if max_jobs is not None:
+                    if completed_jobs >= max_jobs:
+                        self.log.info(
+                            "Worker %s: finished executing %d jobs, quitting",
+                            self.key, completed_jobs
+                        )
+                        break
+
+        finally:
+            if not self.is_horse:
+                self.register_death()
+        return self.did_perform_work
+
+    def execute_job(self, job, queue):
+        def job_done(child):
+            self.heartbeat()
+            if job.get_status() == JobStatus.FINISHED:
+                queue.enqueue_dependents(job)
+
+        self.log.info("Executing job %s from %s", blue(job.id), green(queue.name))
+        future = self.executor.submit(self.perform_job, job, queue)
+        return future.add_done_callback(job_done)
+
+    def dequeue_job(self, timeout: Optional[int] = None) -> Optional[tuple[Job, Queue]]:
+        if self._stop_requested:
+            raise StopRequested()
+        result = None
+        while True:
+            if self._stop_requested:
+                raise StopRequested()
+            self.heartbeat()
+            try:
+                result = self.queue_class.dequeue_any(
+                    self.queues, timeout, connection=self.connection
+                )
+                if result is not None:
+                    job, queue = result
+                    self.log.info(
+                        "Found job on queue %s: %s with ID (%s)"
+                        % (green(queue.name), blue(job.description), job.id)
+                    )
+                break
+            except DequeueTimeout:
+                pass
+        self.heartbeat()
+        return result
+
+    def _shutdown(self):
+        """
+        If shutdown is requested in the middle of a job, wait until
+        finish before shutting down and save the request in redis
+        """
+        if self.get_state() == WorkerStatus.BUSY:
+            self._stop_requested = True
+            self.set_shutdown_requested_date()
+            self.log.debug('Stopping after current horse is finished. '
+                           'Press Ctrl+C again for a cold shutdown.')
+            self.executor.shutdown()
+            if self.scheduler:
+                self.stop_scheduler()
+        else:
+            if self.scheduler:
+                self.stop_scheduler()
+            raise StopRequested()
+

From 6d4d05944a6ea65a3e3f93f27ad9d83e650c368a Mon Sep 17 00:00:00 2001
From: Caio Carvalho <21188280+lowercase00@users.noreply.github.com>
Date: Tue, 7 Feb 2023 02:24:48 -0300
Subject: [PATCH 10/19] Add locking mechanism

---
 rq/worker.py         | 114 ++---
 tests/test_worker.py | 999 ++++++++++++++++++++++++++++++++++++++++++-
 2 files changed, 1024 insertions(+), 89 deletions(-)

diff --git a/rq/worker.py b/rq/worker.py
index 65e409f61..579eaf91a 100644
--- a/rq/worker.py
+++ b/rq/worker.py
@@ -1,4 +1,3 @@
-from concurrent.futures import ThreadPoolExecutor
 import errno
 import logging
 import os
@@ -6,15 +5,18 @@
 import signal
 import socket
 import sys
+import threading
 import time
 import traceback
 import warnings
 
+
 from datetime import timedelta
 from enum import Enum
 from uuid import uuid4
 from random import shuffle
 from typing import Callable, List, Optional, TYPE_CHECKING, Type
+from concurrent.futures import ThreadPoolExecutor
 
 if TYPE_CHECKING:
     from redis import Redis
@@ -1386,19 +1388,30 @@ class ThreadPoolWorker(Worker):
     death_penalty_class = TimerDeathPenalty
 
     def __init__(self, *args, **kwargs):
-        self.threadpool_size = kwargs.pop('pool_size', 12)
-        self.executor = ThreadPoolExecutor(max_workers=self.threadpool_size)
+        self.threadpool_size = kwargs.pop('pool_size', 24)
+        self.executor = ThreadPoolExecutor(max_workers=self.threadpool_size, thread_name_prefix="rq_workers_")
         self._idle_threads = self.threadpool_size
+        self._lock = threading.Lock()
         super(ThreadPoolWorker, self).__init__(*args, **kwargs)
 
     @property
-    def idle_threads(self):
-        size = self.executor._work_queue.qsize()
-        if size <= self.threadpool_size:
+    def _is_pool_full(self):
+        if self._idle_threads == 0:
             return True
         return False
 
-    def _original_work(
+    def _change_idle_counter(self, operation):
+        with self._lock:
+            self._idle_threads += operation
+
+    def _wait_for_slot(self):
+        while 1:
+            if self._is_pool_full:
+                continue
+            self.log.info('Found a slot, ready to work')
+            break
+
+    def work(
         self,
         burst: bool = False,
         logging_level: str = "INFO",
@@ -1441,10 +1454,9 @@ def _original_work(
                         self.log.info('Worker %s: stopping on request', self.key)
                         break
 
-                    if not self.idle_threads:
-                        self.log.info('Threadpool is full, waiting...')
-                        time.sleep
-                        break
+                    if self._is_pool_full:
+                        self.log.info('Threadpool is full, waiting for idle workers...')
+                        self._wait_for_slot()
 
                     timeout = None if burst else self._get_timeout()
                     result = self.dequeue_job_and_maintain_ttl(timeout)
@@ -1484,91 +1496,17 @@ def _original_work(
 
         return bool(completed_jobs)
 
-
-    def work(self, burst=False, logging_level="INFO", date_format=DEFAULT_LOGGING_DATE_FORMAT,
-             log_format=DEFAULT_LOGGING_FORMAT, max_jobs=None, with_scheduler=False):
-        """Starts the work loop.
-        Pops and performs all jobs on the current list of queues.  When all
-        queues are empty, block and wait for new jobs to arrive on any of the
-        queues, unless `burst` mode is enabled.
-        The return value indicates whether any jobs were processed.
-        """
-        setup_loghandlers(logging_level, date_format, log_format)
-        completed_jobs = 0
-        self.register_birth()
-        self.log.info("Worker %s: started, version %s", self.key, VERSION)
-        self.subscribe()
-        self.set_state(WorkerStatus.STARTED)
-        qnames = self.queue_names()
-        self.log.info('*** Listening on %s...', green(', '.join(qnames)))
-
-        try:
-            while True:
-                self.check_for_suspension(burst)
-                if self.should_run_maintenance_tasks:
-                    self.run_maintenance_tasks()
-                if self._stop_requested:
-                    self.log.info("Stopping on request.")
-                    break
-                timeout = None if burst else max(1, self.default_worker_ttl - 60)
-                try:
-                    result = self.dequeue_job(timeout)
-                    if result is None:
-                        if burst:
-                            self.log.info("Worker %s: done. Will finish current running tasks and quit.", self.key)
-                        break
-                except StopRequested:
-                    break
-
-                job, queue = result
-                self.execute_job(job, queue)
-                completed_jobs += 1
-                if max_jobs is not None:
-                    if completed_jobs >= max_jobs:
-                        self.log.info(
-                            "Worker %s: finished executing %d jobs, quitting",
-                            self.key, completed_jobs
-                        )
-                        break
-
-        finally:
-            if not self.is_horse:
-                self.register_death()
-        return self.did_perform_work
-
     def execute_job(self, job, queue):
         def job_done(child):
+            self._change_idle_counter(+1)
             self.heartbeat()
             if job.get_status() == JobStatus.FINISHED:
                 queue.enqueue_dependents(job)
 
         self.log.info("Executing job %s from %s", blue(job.id), green(queue.name))
         future = self.executor.submit(self.perform_job, job, queue)
-        return future.add_done_callback(job_done)
-
-    def dequeue_job(self, timeout: Optional[int] = None) -> Optional[tuple[Job, Queue]]:
-        if self._stop_requested:
-            raise StopRequested()
-        result = None
-        while True:
-            if self._stop_requested:
-                raise StopRequested()
-            self.heartbeat()
-            try:
-                result = self.queue_class.dequeue_any(
-                    self.queues, timeout, connection=self.connection
-                )
-                if result is not None:
-                    job, queue = result
-                    self.log.info(
-                        "Found job on queue %s: %s with ID (%s)"
-                        % (green(queue.name), blue(job.description), job.id)
-                    )
-                break
-            except DequeueTimeout:
-                pass
-        self.heartbeat()
-        return result
+        self._change_idle_counter(-1)
+        future.add_done_callback(job_done)
 
     def _shutdown(self):
         """
diff --git a/tests/test_worker.py b/tests/test_worker.py
index cfce473f4..1e0aaf7e1 100644
--- a/tests/test_worker.py
+++ b/tests/test_worker.py
@@ -35,7 +35,7 @@
 from rq.suspension import resume, suspend
 from rq.utils import utcnow
 from rq.version import VERSION
-from rq.worker import HerokuWorker, WorkerStatus, RoundRobinWorker, RandomWorker
+from rq.worker import HerokuWorker, ThreadPoolWorker, WorkerStatus, RoundRobinWorker, RandomWorker
 from rq.serializers import JSONSerializer
 
 
@@ -1436,3 +1436,1000 @@ def test_random_worker(self):
         sorted_ids.sort()
         expected_ser.sort()
         self.assertEqual(sorted_ids, expected_ser)
+
+
+class TestThreadpoolWorker(RQTestCase):
+
+    def test_create_worker(self):
+        """ThreadPoolWorker creation using various inputs."""
+
+        # With single string argument
+        w = ThreadPoolWorker('foo')
+        self.assertEqual(w.queues[0].name, 'foo')
+
+        # With list of strings
+        w = ThreadPoolWorker(['foo', 'bar'])
+        self.assertEqual(w.queues[0].name, 'foo')
+        self.assertEqual(w.queues[1].name, 'bar')
+
+        self.assertEqual(w.queue_keys(), [w.queues[0].key, w.queues[1].key])
+        self.assertEqual(w.queue_names(), ['foo', 'bar'])
+
+        # With iterable of strings
+        w = ThreadPoolWorker(iter(['foo', 'bar']))
+        self.assertEqual(w.queues[0].name, 'foo')
+        self.assertEqual(w.queues[1].name, 'bar')
+
+        # With single Queue
+        w = ThreadPoolWorker(Queue('foo'))
+        self.assertEqual(w.queues[0].name, 'foo')
+
+        # With iterable of Queues
+        w = ThreadPoolWorker(iter([Queue('foo'), Queue('bar')]))
+        self.assertEqual(w.queues[0].name, 'foo')
+        self.assertEqual(w.queues[1].name, 'bar')
+
+        # With list of Queues
+        w = ThreadPoolWorker([Queue('foo'), Queue('bar')])
+        self.assertEqual(w.queues[0].name, 'foo')
+        self.assertEqual(w.queues[1].name, 'bar')
+
+        # With string and serializer
+        w = ThreadPoolWorker('foo', serializer=json)
+        self.assertEqual(w.queues[0].name, 'foo')
+
+        # With queue having serializer
+        w = ThreadPoolWorker(Queue('foo'), serializer=json)
+        self.assertEqual(w.queues[0].name, 'foo')
+
+    def test_work_and_quit(self):
+        """ThreadPoolWorker processes work, then quits."""
+        fooq, barq = Queue('foo'), Queue('bar')
+        w = ThreadPoolWorker([fooq, barq])
+        self.assertEqual(
+            w.work(burst=True), False,
+            'Did not expect any work on the queue.'
+        )
+
+        fooq.enqueue(say_hello, name='Frank')
+        self.assertEqual(
+            w.work(burst=True), True,
+            'Expected at least some work done.'
+        )
+
+    def test_work_and_quit_custom_serializer(self):
+        """ThreadPoolWorker processes work, then quits."""
+        fooq, barq = Queue('foo', serializer=JSONSerializer), Queue('bar', serializer=JSONSerializer)
+        w = ThreadPoolWorker([fooq, barq], serializer=JSONSerializer)
+        self.assertEqual(
+            w.work(burst=True), False,
+            'Did not expect any work on the queue.'
+        )
+
+        fooq.enqueue(say_hello, name='Frank')
+        self.assertEqual(
+            w.work(burst=True), True,
+            'Expected at least some work done.'
+        )
+
+    def test_worker_all(self):
+        """ThreadPoolWorker.all() works properly"""
+        foo_queue = Queue('foo')
+        bar_queue = Queue('bar')
+
+        w1 = ThreadPoolWorker([foo_queue, bar_queue], name='w1')
+        w1.register_birth()
+        w2 = ThreadPoolWorker([foo_queue], name='w2')
+        w2.register_birth()
+
+        self.assertEqual(
+            set(ThreadPoolWorker.all(connection=foo_queue.connection)),
+            set([w1, w2])
+        )
+        self.assertEqual(set(ThreadPoolWorker.all(queue=foo_queue)), set([w1, w2]))
+        self.assertEqual(set(ThreadPoolWorker.all(queue=bar_queue)), set([w1]))
+
+        w1.register_death()
+        w2.register_death()
+
+    def test_worked_in_parallel(self):
+        """Test that each job sleeps in a different thread"""
+        q = Queue()
+        q.enqueue(long_running_job, 1)
+        q.enqueue(long_running_job, 1)
+        q.enqueue(long_running_job, 1)
+        q.enqueue(long_running_job, 1)
+        t0 = datetime.now()
+        w = ThreadPoolWorker([q], pool_size=4)
+        w.work(burst=True)
+        t1 = datetime.now()
+        self.assertGreaterEqual((t1 - t0).seconds, 1)
+        self.assertLess((t1 - t0).seconds, 1.1)
+
+    def test_find_by_key(self):
+        """ThreadPoolWorker.find_by_key restores queues, state and job_id."""
+        queues = [Queue('foo'), Queue('bar')]
+        w = ThreadPoolWorker(queues)
+        w.register_death()
+        w.register_birth()
+        w.set_state(WorkerStatus.STARTED)
+        worker = ThreadPoolWorker.find_by_key(w.key)
+        self.assertEqual(worker.queues, queues)
+        self.assertEqual(worker.get_state(), WorkerStatus.STARTED)
+        self.assertEqual(worker._job_id, None)
+        self.assertTrue(worker.key in ThreadPoolWorker.all_keys(worker.connection))
+        self.assertEqual(worker.version, VERSION)
+
+        # If worker is gone, its keys should also be removed
+        worker.connection.delete(worker.key)
+        ThreadPoolWorker.find_by_key(worker.key)
+        self.assertFalse(worker.key in ThreadPoolWorker.all_keys(worker.connection))
+
+        self.assertRaises(ValueError, ThreadPoolWorker.find_by_key, 'foo')
+
+    def test_worker_ttl(self):
+        """ThreadPoolWorker ttl."""
+        w = ThreadPoolWorker([])
+        w.register_birth()
+        [worker_key] = self.testconn.smembers(ThreadPoolWorker.redis_workers_keys)
+        self.assertIsNotNone(self.testconn.ttl(worker_key))
+        w.register_death()
+
+    def test_work_via_string_argument(self):
+        """ThreadPoolWorker processes work fed via string arguments."""
+        q = Queue('foo')
+        w = ThreadPoolWorker([q])
+        job = q.enqueue('tests.fixtures.say_hello', name='Frank')
+        self.assertEqual(
+            w.work(burst=True), True,
+            'Expected at least some work done.'
+        )
+        expected_result = 'Hi there, Frank!'
+        self.assertEqual(job.result, expected_result)
+        # Only run if Redis server supports streams
+        if job.supports_redis_streams:
+            self.assertEqual(Result.fetch_latest(job).return_value, expected_result)
+        self.assertIsNone(job.worker_name)
+
+    def test_job_times(self):
+        """job times are set correctly."""
+        q = Queue('foo')
+        w = ThreadPoolWorker([q])
+        before = utcnow()
+        before = before.replace(microsecond=0)
+        job = q.enqueue(say_hello)
+        self.assertIsNotNone(job.enqueued_at)
+        self.assertIsNone(job.started_at)
+        self.assertIsNone(job.ended_at)
+        self.assertEqual(
+            w.work(burst=True), True,
+            'Expected at least some work done.'
+        )
+        self.assertEqual(job.result, 'Hi there, Stranger!')
+        after = utcnow()
+        job.refresh()
+        self.assertTrue(
+            before <= job.enqueued_at <= after,
+            'Not %s <= %s <= %s' % (before, job.enqueued_at, after)
+        )
+        self.assertTrue(
+            before <= job.started_at <= after,
+            'Not %s <= %s <= %s' % (before, job.started_at, after)
+        )
+        self.assertTrue(
+            before <= job.ended_at <= after,
+            'Not %s <= %s <= %s' % (before, job.ended_at, after)
+        )
+
+    def test_work_is_unreadable(self):
+        """Unreadable jobs are put on the failed job registry."""
+        q = Queue()
+        self.assertEqual(q.count, 0)
+
+        # NOTE: We have to fake this enqueueing for this test case.
+        # What we're simulating here is a call to a function that is not
+        # importable from the worker process.
+        job = Job.create(func=div_by_zero, args=(3,), origin=q.name)
+        job.save()
+
+        job_data = job.data
+        invalid_data = job_data.replace(b'div_by_zero', b'nonexisting')
+        assert job_data != invalid_data
+        self.testconn.hset(job.key, 'data', zlib.compress(invalid_data))
+
+        # We use the low-level internal function to enqueue any data (bypassing
+        # validity checks)
+        q.push_job_id(job.id)
+
+        self.assertEqual(q.count, 1)
+
+        # All set, we're going to process it
+        w = ThreadPoolWorker([q])
+        w.work(burst=True)   # should silently pass
+        self.assertEqual(q.count, 0)
+
+        failed_job_registry = FailedJobRegistry(queue=q)
+        self.assertTrue(job in failed_job_registry)
+
+    @mock.patch('rq.worker.logger.error')
+    def test_deserializing_failure_is_handled(self, mock_logger_error):
+        """
+        Test that exceptions are properly handled for a job that fails to
+        deserialize.
+        """
+        q = Queue()
+        self.assertEqual(q.count, 0)
+
+        # as in test_work_is_unreadable(), we create a fake bad job
+        job = Job.create(func=div_by_zero, args=(3,), origin=q.name)
+        job.save()
+
+        # setting data to b'' ensures that pickling will completely fail
+        job_data = job.data
+        invalid_data = job_data.replace(b'div_by_zero', b'')
+        assert job_data != invalid_data
+        self.testconn.hset(job.key, 'data', zlib.compress(invalid_data))
+
+        # We use the low-level internal function to enqueue any data (bypassing
+        # validity checks)
+        q.push_job_id(job.id)
+        self.assertEqual(q.count, 1)
+
+        # Now we try to run the job...
+        w = ThreadPoolWorker([q])
+        job, queue = w.dequeue_job_and_maintain_ttl(10)
+        w.perform_job(job, queue)
+
+        # An exception should be logged here at ERROR level
+        self.assertIn("Traceback", mock_logger_error.call_args[0][0])
+
+    def test_heartbeat(self):
+        """Heartbeat saves last_heartbeat"""
+        q = Queue()
+        w = ThreadPoolWorker([q])
+        w.register_birth()
+
+        self.assertEqual(str(w.pid), as_text(self.testconn.hget(w.key, 'pid')))
+        self.assertEqual(w.hostname,
+                         as_text(self.testconn.hget(w.key, 'hostname')))
+        last_heartbeat = self.testconn.hget(w.key, 'last_heartbeat')
+        self.assertIsNotNone(self.testconn.hget(w.key, 'birth'))
+        self.assertTrue(last_heartbeat is not None)
+        w = ThreadPoolWorker.find_by_key(w.key)
+        self.assertIsInstance(w.last_heartbeat, datetime)
+
+        # worker.refresh() shouldn't fail if last_heartbeat is None
+        # for compatibility reasons
+        self.testconn.hdel(w.key, 'last_heartbeat')
+        w.refresh()
+        # worker.refresh() shouldn't fail if birth is None
+        # for compatibility reasons
+        self.testconn.hdel(w.key, 'birth')
+        w.refresh()
+
+    def test_maintain_heartbeats(self):
+        """worker.maintain_heartbeats() shouldn't create new job keys"""
+        queue = Queue(connection=self.testconn)
+        worker = ThreadPoolWorker([queue], connection=self.testconn)
+        job = queue.enqueue(say_hello)
+        worker.maintain_heartbeats(job)
+        self.assertTrue(self.testconn.exists(worker.key))
+        self.assertTrue(self.testconn.exists(job.key))
+
+        self.testconn.delete(job.key)
+
+        worker.maintain_heartbeats(job)
+        self.assertFalse(self.testconn.exists(job.key))
+
+    @slow
+    def test_heartbeat_survives_lost_connection(self):
+        with mock.patch.object(ThreadPoolWorker, 'heartbeat') as mocked:
+            # None -> Heartbeat is first called before the job loop
+            mocked.side_effect = [None, redis.exceptions.ConnectionError()]
+            q = Queue()
+            w = ThreadPoolWorker([q])
+            w.work(burst=True)
+            # First call is prior to job loop, second raises the error,
+            # third is successful, after "recovery"
+            assert mocked.call_count == 3
+
+    def test_job_timeout_moved_to_failed_job_registry(self):
+        """Jobs that run long are moved to FailedJobRegistry"""
+        queue = Queue()
+        worker = ThreadPoolWorker([queue])
+        job = queue.enqueue(long_running_job, 5, job_timeout=1)
+        worker.work(burst=True)
+        self.assertIn(job, job.failed_job_registry)
+        job.refresh()
+        self.assertIn('rq.timeouts.JobTimeoutException', job.exc_info)
+
+    @slow
+    def test_heartbeat_busy(self):
+        """Periodic heartbeats while horse is busy with long jobs"""
+        q = Queue()
+        w = ThreadPoolWorker([q], job_monitoring_interval=5)
+
+        for timeout, expected_heartbeats in [(2, 0), (7, 1), (12, 2)]:
+            job = q.enqueue(long_running_job,
+                            args=(timeout,),
+                            job_timeout=30,
+                            result_ttl=-1)
+            with mock.patch.object(w, 'heartbeat', wraps=w.heartbeat) as mocked:
+                w.execute_job(job, q)
+                self.assertEqual(mocked.call_count, expected_heartbeats)
+            job = Job.fetch(job.id)
+            self.assertEqual(job.get_status(), JobStatus.FINISHED)
+
+    def test_work_fails(self):
+        """Failing jobs are put on the failed queue."""
+        q = Queue()
+        self.assertEqual(q.count, 0)
+
+        # Action
+        job = q.enqueue(div_by_zero)
+        self.assertEqual(q.count, 1)
+
+        # keep for later
+        enqueued_at_date = str(job.enqueued_at)
+
+        w = ThreadPoolWorker([q])
+        w.work(burst=True)
+
+        # Postconditions
+        self.assertEqual(q.count, 0)
+        failed_job_registry = FailedJobRegistry(queue=q)
+        self.assertTrue(job in failed_job_registry)
+        self.assertEqual(w.get_current_job_id(), None)
+
+        # Check the job
+        job = Job.fetch(job.id)
+        self.assertEqual(job.origin, q.name)
+
+        # Should be the original enqueued_at date, not the date of enqueueing
+        # to the failed queue
+        self.assertEqual(str(job.enqueued_at), enqueued_at_date)
+        self.assertTrue(job.exc_info)  # should contain exc_info
+        if job.supports_redis_streams:
+            result = Result.fetch_latest(job)
+            self.assertEqual(result.exc_string, job.exc_info)
+            self.assertEqual(result.type, Result.Type.FAILED)
+
+    def test_statistics(self):
+        """Successful and failed job counts are saved properly"""
+        queue = Queue(connection=self.connection)
+        job = queue.enqueue(div_by_zero)
+        worker = ThreadPoolWorker([queue])
+        worker.register_birth()
+
+        self.assertEqual(worker.failed_job_count, 0)
+        self.assertEqual(worker.successful_job_count, 0)
+        self.assertEqual(worker.total_working_time, 0)
+
+        registry = StartedJobRegistry(connection=worker.connection)
+        job.started_at = utcnow()
+        job.ended_at = job.started_at + timedelta(seconds=0.75)
+        worker.handle_job_failure(job, queue)
+        worker.handle_job_success(job, queue, registry)
+
+        worker.refresh()
+        self.assertEqual(worker.failed_job_count, 1)
+        self.assertEqual(worker.successful_job_count, 1)
+        self.assertEqual(worker.total_working_time, 1.5)  # 1.5 seconds
+
+        worker.handle_job_failure(job, queue)
+        worker.handle_job_success(job, queue, registry)
+
+        worker.refresh()
+        self.assertEqual(worker.failed_job_count, 2)
+        self.assertEqual(worker.successful_job_count, 2)
+        self.assertEqual(worker.total_working_time, 3.0)
+
+    def test_handle_retry(self):
+        """handle_job_failure() handles retry properly"""
+        connection = self.testconn
+        queue = Queue(connection=connection)
+        retry = Retry(max=2)
+        job = queue.enqueue(div_by_zero, retry=retry)
+        registry = FailedJobRegistry(queue=queue)
+
+        worker = ThreadPoolWorker([queue])
+
+        # If job is configured to retry, it will be put back in the queue
+        # and not put in the FailedJobRegistry.
+        # This is the original execution
+        queue.empty()
+        worker.handle_job_failure(job, queue)
+        job.refresh()
+        self.assertEqual(job.retries_left, 1)
+        self.assertEqual([job.id], queue.job_ids)
+        self.assertFalse(job in registry)
+
+        # First retry
+        queue.empty()
+        worker.handle_job_failure(job, queue)
+        job.refresh()
+        self.assertEqual(job.retries_left, 0)
+        self.assertEqual([job.id], queue.job_ids)
+
+        # Second retry
+        queue.empty()
+        worker.handle_job_failure(job, queue)
+        job.refresh()
+        self.assertEqual(job.retries_left, 0)
+        self.assertEqual([], queue.job_ids)
+        # If a job is no longer retries, it's put in FailedJobRegistry
+        self.assertTrue(job in registry)
+
+    def test_total_working_time(self):
+        """worker.total_working_time is stored properly"""
+        queue = Queue()
+        job = queue.enqueue(long_running_job, 0.05)
+        worker = ThreadPoolWorker([queue])
+        worker.register_birth()
+
+        worker.perform_job(job, queue)
+        worker.refresh()
+        # total_working_time should be a little bit more than 0.05 seconds
+        self.assertGreaterEqual(worker.total_working_time, 0.05)
+        # in multi-user environments delays might be unpredictable,
+        # please adjust this magic limit accordingly in case if It takes even longer to run
+        self.assertLess(worker.total_working_time, 1)
+
+    def test_max_jobs(self):
+        """ThreadPoolWorker exits after number of jobs complete."""
+        queue = Queue()
+        job1 = queue.enqueue(do_nothing)
+        job2 = queue.enqueue(do_nothing)
+        worker = ThreadPoolWorker([queue])
+        worker.work(max_jobs=1)
+
+        self.assertEqual(JobStatus.FINISHED, job1.get_status())
+        self.assertEqual(JobStatus.QUEUED, job2.get_status())
+
+    def test_disable_default_exception_handler(self):
+        """
+        Job is not moved to FailedJobRegistry when default custom exception
+        handler is disabled.
+        """
+        queue = Queue(name='default', connection=self.testconn)
+
+        job = queue.enqueue(div_by_zero)
+        worker = ThreadPoolWorker([queue], disable_default_exception_handler=False)
+        worker.work(burst=True)
+
+        registry = FailedJobRegistry(queue=queue)
+        self.assertTrue(job in registry)
+
+        # Job is not added to FailedJobRegistry if
+        # disable_default_exception_handler is True
+        job = queue.enqueue(div_by_zero)
+        worker = ThreadPoolWorker([queue], disable_default_exception_handler=True)
+        worker.work(burst=True)
+        self.assertFalse(job in registry)
+
+    def test_custom_exc_handling(self):
+        """Custom exception handling."""
+
+        def first_handler(job, *exc_info):
+            job.meta = {'first_handler': True}
+            job.save_meta()
+            return True
+
+        def second_handler(job, *exc_info):
+            job.meta.update({'second_handler': True})
+            job.save_meta()
+
+        def black_hole(job, *exc_info):
+            # Don't fall through to default behaviour (moving to failed queue)
+            return False
+
+        q = Queue()
+        self.assertEqual(q.count, 0)
+        job = q.enqueue(div_by_zero)
+
+        w = ThreadPoolWorker([q], exception_handlers=first_handler)
+        w.work(burst=True)
+
+        # Check the job
+        job.refresh()
+        self.assertEqual(job.is_failed, True)
+        self.assertTrue(job.meta['first_handler'])
+
+        job = q.enqueue(div_by_zero)
+        w = ThreadPoolWorker([q], exception_handlers=[first_handler, second_handler])
+        w.work(burst=True)
+
+        # Both custom exception handlers are run
+        job.refresh()
+        self.assertEqual(job.is_failed, True)
+        self.assertTrue(job.meta['first_handler'])
+        self.assertTrue(job.meta['second_handler'])
+
+        job = q.enqueue(div_by_zero)
+        w = ThreadPoolWorker([q], exception_handlers=[first_handler, black_hole,
+                                            second_handler])
+        w.work(burst=True)
+
+        # second_handler is not run since it's interrupted by black_hole
+        job.refresh()
+        self.assertEqual(job.is_failed, True)
+        self.assertTrue(job.meta['first_handler'])
+        self.assertEqual(job.meta.get('second_handler'), None)
+
+    def test_deleted_jobs_arent_executed(self):
+        """Cancelling jobs."""
+
+        SENTINEL_FILE = '/tmp/rq-tests.txt'  # noqa
+
+        try:
+            # Remove the sentinel if it is leftover from a previous test run
+            os.remove(SENTINEL_FILE)
+        except OSError as e:
+            if e.errno != 2:
+                raise
+
+        q = Queue()
+        job = q.enqueue(create_file, SENTINEL_FILE)
+
+        # Here, we cancel the job, so the sentinel file may not be created
+        self.testconn.delete(job.key)
+
+        w = ThreadPoolWorker([q])
+        w.work(burst=True)
+        assert q.count == 0
+
+        # Should not have created evidence of execution
+        self.assertEqual(os.path.exists(SENTINEL_FILE), False)
+
+    @slow  # noqa
+    def test_timeouts(self):
+        """ThreadPoolWorker kills jobs after timeout."""
+        sentinel_file = '/tmp/.rq_sentinel'
+
+        q = Queue()
+        w = ThreadPoolWorker([q])
+
+        # Put it on the queue with a timeout value
+        res = q.enqueue(create_file_after_timeout,
+                        args=(sentinel_file, 4),
+                        job_timeout=1)
+
+        try:
+            os.unlink(sentinel_file)
+        except OSError as e:
+            if e.errno == 2:
+                pass
+
+        self.assertEqual(os.path.exists(sentinel_file), False)
+        w.work(burst=True)
+        self.assertEqual(os.path.exists(sentinel_file), False)
+
+        # TODO: Having to do the manual refresh() here is really ugly!
+        res.refresh()
+        self.assertIn('JobTimeoutException', as_text(res.exc_info))
+
+    def test_dequeue_job_and_maintain_ttl_non_blocking(self):
+        """Not passing a timeout should return immediately with None as a result"""
+        q = Queue()
+        w = ThreadPoolWorker([q])
+
+        # Put it on the queue with a timeout value
+        self.assertIsNone(w.dequeue_job_and_maintain_ttl(None))
+
+    def test_worker_sets_result_ttl(self):
+        """Ensure that ThreadPoolWorker properly sets result_ttl for individual jobs."""
+        q = Queue()
+        job = q.enqueue(say_hello, args=('Frank',), result_ttl=10)
+        w = ThreadPoolWorker([q])
+        self.assertIn(job.get_id().encode(), self.testconn.lrange(q.key, 0, -1))
+        w.work(burst=True)
+        self.assertNotEqual(self.testconn.ttl(job.key), 0)
+        self.assertNotIn(job.get_id().encode(), self.testconn.lrange(q.key, 0, -1))
+
+        # Job with -1 result_ttl don't expire
+        job = q.enqueue(say_hello, args=('Frank',), result_ttl=-1)
+        w = ThreadPoolWorker([q])
+        self.assertIn(job.get_id().encode(), self.testconn.lrange(q.key, 0, -1))
+        w.work(burst=True)
+        self.assertEqual(self.testconn.ttl(job.key), -1)
+        self.assertNotIn(job.get_id().encode(), self.testconn.lrange(q.key, 0, -1))
+
+        # Job with result_ttl = 0 gets deleted immediately
+        job = q.enqueue(say_hello, args=('Frank',), result_ttl=0)
+        w = ThreadPoolWorker([q])
+        self.assertIn(job.get_id().encode(), self.testconn.lrange(q.key, 0, -1))
+        w.work(burst=True)
+        self.assertEqual(self.testconn.get(job.key), None)
+        self.assertNotIn(job.get_id().encode(), self.testconn.lrange(q.key, 0, -1))
+
+    def test_worker_sets_job_status(self):
+        """Ensure that worker correctly sets job status."""
+        q = Queue()
+        w = ThreadPoolWorker([q])
+
+        job = q.enqueue(say_hello)
+        self.assertEqual(job.get_status(), JobStatus.QUEUED)
+        self.assertEqual(job.is_queued, True)
+        self.assertEqual(job.is_finished, False)
+        self.assertEqual(job.is_failed, False)
+
+        w.work(burst=True)
+        job = Job.fetch(job.id)
+        self.assertEqual(job.get_status(), JobStatus.FINISHED)
+        self.assertEqual(job.is_queued, False)
+        self.assertEqual(job.is_finished, True)
+        self.assertEqual(job.is_failed, False)
+
+        # Failed jobs should set status to "failed"
+        job = q.enqueue(div_by_zero, args=(1,))
+        w.work(burst=True)
+        job = Job.fetch(job.id)
+        self.assertEqual(job.get_status(), JobStatus.FAILED)
+        self.assertEqual(job.is_queued, False)
+        self.assertEqual(job.is_finished, False)
+        self.assertEqual(job.is_failed, True)
+
+    def test_get_current_job(self):
+        """Ensure worker.get_current_job() works properly"""
+        q = Queue()
+        worker = ThreadPoolWorker([q])
+        job = q.enqueue_call(say_hello)
+
+        self.assertEqual(self.testconn.hget(worker.key, 'current_job'), None)
+        worker.set_current_job_id(job.id)
+        self.assertEqual(
+            worker.get_current_job_id(),
+            as_text(self.testconn.hget(worker.key, 'current_job'))
+        )
+        self.assertEqual(worker.get_current_job(), job)
+
+    def test_custom_job_class(self):
+        """Ensure ThreadPoolWorker accepts custom job class."""
+        q = Queue()
+        worker = ThreadPoolWorker([q], job_class=CustomJob)
+        self.assertEqual(worker.job_class, CustomJob)
+
+    def test_custom_queue_class(self):
+        """Ensure ThreadPoolWorker accepts custom queue class."""
+        q = CustomQueue()
+        worker = ThreadPoolWorker([q], queue_class=CustomQueue)
+        self.assertEqual(worker.queue_class, CustomQueue)
+
+    def test_custom_queue_class_is_not_global(self):
+        """Ensure ThreadPoolWorker custom queue class is not global."""
+        q = CustomQueue()
+        worker_custom = ThreadPoolWorker([q], queue_class=CustomQueue)
+        q_generic = Queue()
+        worker_generic = ThreadPoolWorker([q_generic])
+        self.assertEqual(worker_custom.queue_class, CustomQueue)
+        self.assertEqual(worker_generic.queue_class, Queue)
+        self.assertEqual(ThreadPoolWorker.queue_class, Queue)
+
+    def test_custom_job_class_is_not_global(self):
+        """Ensure ThreadPoolWorker custom job class is not global."""
+        q = Queue()
+        worker_custom = ThreadPoolWorker([q], job_class=CustomJob)
+        q_generic = Queue()
+        worker_generic = ThreadPoolWorker([q_generic])
+        self.assertEqual(worker_custom.job_class, CustomJob)
+        self.assertEqual(worker_generic.job_class, Job)
+        self.assertEqual(ThreadPoolWorker.job_class, Job)
+
+    def test_prepare_job_execution(self):
+        """Prepare job execution does the necessary bookkeeping."""
+        queue = Queue(connection=self.testconn)
+        job = queue.enqueue(say_hello)
+        worker = ThreadPoolWorker([queue])
+        worker.prepare_job_execution(job)
+
+        # Updates working queue
+        registry = StartedJobRegistry(connection=self.testconn)
+        self.assertEqual(registry.get_job_ids(), [job.id])
+
+        # Updates worker's current job
+        self.assertEqual(worker.get_current_job_id(), job.id)
+
+        # job status is also updated
+        self.assertEqual(job._status, JobStatus.STARTED)
+        self.assertEqual(job.worker_name, worker.name)
+
+    def test_work_unicode_friendly(self):
+        """ThreadPoolWorker processes work with unicode description, then quits."""
+        q = Queue('foo')
+        w = ThreadPoolWorker([q])
+        job = q.enqueue('tests.fixtures.say_hello', name='Adam',
+                        description='你好 世界!')
+        self.assertEqual(w.work(burst=True), True,
+                         'Expected at least some work done.')
+        self.assertEqual(job.result, 'Hi there, Adam!')
+        self.assertEqual(job.description, '你好 世界!')
+
+    def test_work_log_unicode_friendly(self):
+        """ThreadPoolWorker process work with unicode or str other than pure ascii content,
+        logging work properly"""
+        q = Queue("foo")
+        w = ThreadPoolWorker([q])
+
+        job = q.enqueue('tests.fixtures.say_hello', name='阿达姆',
+                        description='你好 世界!')
+        w.work(burst=True)
+        self.assertEqual(job.get_status(), JobStatus.FINISHED)
+
+        job = q.enqueue('tests.fixtures.say_hello_unicode', name='阿达姆',
+                        description='你好 世界!')
+        w.work(burst=True)
+        self.assertEqual(job.get_status(), JobStatus.FINISHED)
+
+    def test_suspend_worker_execution(self):
+        """Test Pause ThreadPoolWorker Execution"""
+
+        SENTINEL_FILE = '/tmp/rq-tests.txt'  # noqa
+
+        try:
+            # Remove the sentinel if it is leftover from a previous test run
+            os.remove(SENTINEL_FILE)
+        except OSError as e:
+            if e.errno != 2:
+                raise
+
+        q = Queue()
+        q.enqueue(create_file, SENTINEL_FILE)
+
+        w = ThreadPoolWorker([q])
+
+        suspend(self.testconn)
+
+        w.work(burst=True)
+        assert q.count == 1
+
+        # Should not have created evidence of execution
+        self.assertEqual(os.path.exists(SENTINEL_FILE), False)
+
+        resume(self.testconn)
+        w.work(burst=True)
+        assert q.count == 0
+        self.assertEqual(os.path.exists(SENTINEL_FILE), True)
+
+    @slow
+    def test_suspend_with_duration(self):
+        q = Queue()
+        for _ in range(5):
+            q.enqueue(do_nothing)
+
+        w = ThreadPoolWorker([q])
+
+        # This suspends workers for working for 2 second
+        suspend(self.testconn, 2)
+
+        # So when this burst of work happens the queue should remain at 5
+        w.work(burst=True)
+        assert q.count == 5
+
+        sleep(3)
+
+        # The suspension should be expired now, and a burst of work should now clear the queue
+        w.work(burst=True)
+        assert q.count == 0
+
+    def test_worker_hash_(self):
+        """ThreadPoolWorkers are hashed by their .name attribute"""
+        q = Queue('foo')
+        w1 = ThreadPoolWorker([q], name="worker1")
+        w2 = ThreadPoolWorker([q], name="worker2")
+        w3 = ThreadPoolWorker([q], name="worker1")
+        worker_set = set([w1, w2, w3])
+        self.assertEqual(len(worker_set), 2)
+
+    def test_worker_sets_birth(self):
+        """Ensure worker correctly sets worker birth date."""
+        q = Queue()
+        w = ThreadPoolWorker([q])
+
+        w.register_birth()
+
+        birth_date = w.birth_date
+        self.assertIsNotNone(birth_date)
+        self.assertEqual(type(birth_date).__name__, 'datetime')
+
+    def test_worker_sets_death(self):
+        """Ensure worker correctly sets worker death date."""
+        q = Queue()
+        w = ThreadPoolWorker([q])
+
+        w.register_death()
+
+        death_date = w.death_date
+        self.assertIsNotNone(death_date)
+        self.assertIsInstance(death_date, datetime)
+
+    def test_clean_queue_registries(self):
+        """worker.clean_registries sets last_cleaned_at and cleans registries."""
+        foo_queue = Queue('foo', connection=self.testconn)
+        foo_registry = StartedJobRegistry('foo', connection=self.testconn)
+        self.testconn.zadd(foo_registry.key, {'foo': 1})
+        self.assertEqual(self.testconn.zcard(foo_registry.key), 1)
+
+        bar_queue = Queue('bar', connection=self.testconn)
+        bar_registry = StartedJobRegistry('bar', connection=self.testconn)
+        self.testconn.zadd(bar_registry.key, {'bar': 1})
+        self.assertEqual(self.testconn.zcard(bar_registry.key), 1)
+
+        worker = ThreadPoolWorker([foo_queue, bar_queue])
+        self.assertEqual(worker.last_cleaned_at, None)
+        worker.clean_registries()
+        self.assertNotEqual(worker.last_cleaned_at, None)
+        self.assertEqual(self.testconn.zcard(foo_registry.key), 0)
+        self.assertEqual(self.testconn.zcard(bar_registry.key), 0)
+
+        # worker.clean_registries() only runs once every 15 minutes
+        # If we add another key, calling clean_registries() should do nothing
+        self.testconn.zadd(bar_registry.key, {'bar': 1})
+        worker.clean_registries()
+        self.assertEqual(self.testconn.zcard(bar_registry.key), 1)
+
+    def test_should_run_maintenance_tasks(self):
+        """ThreadPoolWorkers should run maintenance tasks on startup and every hour."""
+        queue = Queue(connection=self.testconn)
+        worker = ThreadPoolWorker(queue)
+        self.assertTrue(worker.should_run_maintenance_tasks)
+
+        worker.last_cleaned_at = utcnow()
+        self.assertFalse(worker.should_run_maintenance_tasks)
+        worker.last_cleaned_at = utcnow() - timedelta(seconds=3700)
+        self.assertTrue(worker.should_run_maintenance_tasks)
+
+    def test_worker_calls_clean_registries(self):
+        """ThreadPoolWorker calls clean_registries when run."""
+        queue = Queue(connection=self.testconn)
+        registry = StartedJobRegistry(connection=self.testconn)
+        self.testconn.zadd(registry.key, {'foo': 1})
+
+        worker = ThreadPoolWorker(queue, connection=self.testconn)
+        worker.work(burst=True)
+        self.assertEqual(self.testconn.zcard(registry.key), 0)
+
+    def test_job_dependency_race_condition(self):
+        """Dependencies added while the job gets finished shouldn't get lost."""
+
+        # This patches the enqueue_dependents to enqueue a new dependency AFTER
+        # the original code was executed.
+        orig_enqueue_dependents = Queue.enqueue_dependents
+
+        def new_enqueue_dependents(self, job, *args, **kwargs):
+            orig_enqueue_dependents(self, job, *args, **kwargs)
+            if hasattr(Queue, '_add_enqueue') and Queue._add_enqueue is not None and Queue._add_enqueue.id == job.id:
+                Queue._add_enqueue = None
+                Queue().enqueue_call(say_hello, depends_on=job)
+
+        Queue.enqueue_dependents = new_enqueue_dependents
+
+        q = Queue()
+        w = ThreadPoolWorker([q])
+        with mock.patch.object(ThreadPoolWorker, 'execute_job', wraps=w.execute_job) as mocked:
+            parent_job = q.enqueue(say_hello, result_ttl=0)
+            Queue._add_enqueue = parent_job
+            job = q.enqueue_call(say_hello, depends_on=parent_job)
+            w.work(burst=True)
+            job = Job.fetch(job.id)
+            self.assertEqual(job.get_status(), JobStatus.FINISHED)
+            self.assertEqual(mocked.call_count, 3)
+
+    def test_self_modification_persistence(self):
+        """Make sure that any meta modification done by
+        the job itself persists completely through the
+        queue/worker/job stack."""
+        q = Queue()
+        # Also make sure that previously existing metadata
+        # persists properly
+        job = q.enqueue(modify_self, meta={'foo': 'bar', 'baz': 42},
+                        args=[{'baz': 10, 'newinfo': 'waka'}])
+
+        w = ThreadPoolWorker([q])
+        w.work(burst=True)
+
+        job_check = Job.fetch(job.id)
+        self.assertEqual(job_check.meta['foo'], 'bar')
+        self.assertEqual(job_check.meta['baz'], 10)
+        self.assertEqual(job_check.meta['newinfo'], 'waka')
+
+    def test_self_modification_persistence_with_error(self):
+        """Make sure that any meta modification done by
+        the job itself persists completely through the
+        queue/worker/job stack -- even if the job errored"""
+        q = Queue()
+        # Also make sure that previously existing metadata
+        # persists properly
+        job = q.enqueue(modify_self_and_error, meta={'foo': 'bar', 'baz': 42},
+                        args=[{'baz': 10, 'newinfo': 'waka'}])
+
+        w = ThreadPoolWorker([q])
+        w.work(burst=True)
+
+        # Postconditions
+        self.assertEqual(q.count, 0)
+        failed_job_registry = FailedJobRegistry(queue=q)
+        self.assertTrue(job in failed_job_registry)
+        self.assertEqual(w.get_current_job_id(), None)
+
+        job_check = Job.fetch(job.id)
+        self.assertEqual(job_check.meta['foo'], 'bar')
+        self.assertEqual(job_check.meta['baz'], 10)
+        self.assertEqual(job_check.meta['newinfo'], 'waka')
+
+    @mock.patch('rq.worker.logger.info')
+    def test_log_result_lifespan_true(self, mock_logger_info):
+        """Check that log_result_lifespan True causes job lifespan to be logged."""
+        q = Queue()
+
+        w = ThreadPoolWorker([q])
+        job = q.enqueue(say_hello, args=('Frank',), result_ttl=10)
+        w.perform_job(job, q)
+        mock_logger_info.assert_called_with('Result is kept for %s seconds', 10)
+        self.assertIn('Result is kept for %s seconds', [c[0][0] for c in mock_logger_info.call_args_list])
+
+    @mock.patch('rq.worker.logger.info')
+    def test_log_result_lifespan_false(self, mock_logger_info):
+        """Check that log_result_lifespan False causes job lifespan to not be logged."""
+        q = Queue()
+
+        class ThreadPoolWorker(ThreadPoolWorker):
+            log_result_lifespan = False
+
+        w = ThreadPoolWorker([q])
+        job = q.enqueue(say_hello, args=('Frank',), result_ttl=10)
+        w.perform_job(job, q)
+        self.assertNotIn('Result is kept for 10 seconds', [c[0][0] for c in mock_logger_info.call_args_list])
+
+    @mock.patch('rq.worker.logger.info')
+    def test_log_job_description_true(self, mock_logger_info):
+        """Check that log_job_description True causes job lifespan to be logged."""
+        q = Queue()
+        w = ThreadPoolWorker([q])
+        q.enqueue(say_hello, args=('Frank',), result_ttl=10)
+        w.dequeue_job_and_maintain_ttl(10)
+        self.assertIn("Frank", mock_logger_info.call_args[0][2])
+
+    @mock.patch('rq.worker.logger.info')
+    def test_log_job_description_false(self, mock_logger_info):
+        """Check that log_job_description False causes job lifespan to not be logged."""
+        q = Queue()
+        w = ThreadPoolWorker([q], log_job_description=False)
+        q.enqueue(say_hello, args=('Frank',), result_ttl=10)
+        w.dequeue_job_and_maintain_ttl(10)
+        self.assertNotIn("Frank", mock_logger_info.call_args[0][2])
+
+    def test_worker_configures_socket_timeout(self):
+        """Ensures that the worker correctly updates Redis client connection to have a socket_timeout"""
+        q = Queue()
+        _ = ThreadPoolWorker([q])
+        connection_kwargs = q.connection.connection_pool.connection_kwargs
+        self.assertEqual(connection_kwargs["socket_timeout"], 415)
+
+    def test_worker_version(self):
+        q = Queue()
+        w = ThreadPoolWorker([q])
+        w.version = '0.0.0'
+        w.register_birth()
+        self.assertEqual(w.version, '0.0.0')
+        w.refresh()
+        self.assertEqual(w.version, '0.0.0')
+        # making sure that version is preserved when worker is retrieved by key
+        worker = ThreadPoolWorker.find_by_key(w.key)
+        self.assertEqual(worker.version, '0.0.0')
+
+    def test_python_version(self):
+        python_version = sys.version
+        q = Queue()
+        w = ThreadPoolWorker([q])
+        w.register_birth()
+        self.assertEqual(w.python_version, python_version)
+        # now patching version
+        python_version = 'X.Y.Z.final'  # dummy version
+        self.assertNotEqual(python_version, sys.version)  # otherwise tests are pointless
+        w2 = ThreadPoolWorker([q])
+        w2.python_version = python_version
+        w2.register_birth()
+        self.assertEqual(w2.python_version, python_version)
+        # making sure that version is preserved when worker is retrieved by key
+        worker = ThreadPoolWorker.find_by_key(w2.key)
+        self.assertEqual(worker.python_version, python_version)

From 80fbc6447dcb73474addea97dd94da8ae7ccf319 Mon Sep 17 00:00:00 2001
From: Caio Carvalho <21188280+lowercase00@users.noreply.github.com>
Date: Tue, 7 Feb 2023 19:09:57 -0300
Subject: [PATCH 11/19] Add Callback, Dependencies & Registration Tests

---
 rq/worker.py                      |   7 +-
 tests/test_callbacks.py           |  56 +++++++++++-
 tests/test_dependencies.py        | 140 +++++++++++++++++++++++++++++-
 tests/test_worker_registration.py | 111 +++++++++++++++++++++++
 4 files changed, 309 insertions(+), 5 deletions(-)

diff --git a/rq/worker.py b/rq/worker.py
index 579eaf91a..358688db3 100644
--- a/rq/worker.py
+++ b/rq/worker.py
@@ -1408,7 +1408,7 @@ def _wait_for_slot(self):
         while 1:
             if self._is_pool_full:
                 continue
-            self.log.info('Found a slot, ready to work')
+            self.log.info('Found idle thread, ready to work')
             break
 
     def work(
@@ -1431,7 +1431,8 @@ def work(
         completed_jobs = 0
         setup_loghandlers(logging_level, date_format, log_format)
         self.register_birth()
-        self.log.info("Worker %s: started, version %s", self.key, VERSION)
+        self.log.info("ThreadpoolWorker %s: started, version %s", self.key, VERSION)
+        self.log.warning("*** WARNING: ThreadpoolWorker is in beta and may be unstable. Don't use it in production!")
         self.subscribe()
         self.set_state(WorkerStatus.STARTED)
         qnames = self.queue_names()
@@ -1455,7 +1456,7 @@ def work(
                         break
 
                     if self._is_pool_full:
-                        self.log.info('Threadpool is full, waiting for idle workers...')
+                        self.log.info('Threadpool is full, waiting for idle threads...')
                         self._wait_for_slot()
 
                     timeout = None if burst else self._get_timeout()
diff --git a/tests/test_callbacks.py b/tests/test_callbacks.py
index 680ee388a..733b379fe 100644
--- a/tests/test_callbacks.py
+++ b/tests/test_callbacks.py
@@ -5,7 +5,7 @@
 
 from rq import Queue, Worker
 from rq.job import Job, JobStatus, UNEVALUATED
-from rq.worker import SimpleWorker
+from rq.worker import SimpleWorker, ThreadPoolWorker
 
 
 class QueueCallbackTestCase(RQTestCase):
@@ -131,6 +131,60 @@ def test_failure_callback(self):
         # TODO: add test case for error while executing failure callback
 
 
+class ThreadPoolWorkerCallbackTestCase(RQTestCase):
+    def test_success_callback(self):
+        """Test success callback is executed only when job is successful"""
+        queue = Queue(connection=self.testconn)
+        worker = ThreadPoolWorker([queue])
+
+        job = queue.enqueue(say_hello, on_success=save_result)
+
+        # Callback is executed when job is successfully executed
+        worker.work(burst=True)
+        self.assertEqual(job.get_status(), JobStatus.FINISHED)
+        self.assertEqual(
+            self.testconn.get('success_callback:%s' % job.id).decode(),
+            job.return_value()
+        )
+
+        job = queue.enqueue(div_by_zero, on_success=save_result)
+        worker.work(burst=True)
+        self.assertEqual(job.get_status(), JobStatus.FAILED)
+        self.assertFalse(self.testconn.exists('success_callback:%s' % job.id))
+
+    def test_erroneous_success_callback(self):
+        """Test exception handling when executing success callback"""
+        queue = Queue(connection=self.testconn)
+        worker = ThreadPoolWorker([queue])
+
+        # If success_callback raises an error, job will is considered as failed
+        job = queue.enqueue(say_hello, on_success=erroneous_callback)
+        worker.work(burst=True)
+        self.assertEqual(job.get_status(), JobStatus.FAILED)
+
+    def test_failure_callback(self):
+        """Test failure callback is executed only when job a fails"""
+        queue = Queue(connection=self.testconn)
+        worker = ThreadPoolWorker([queue])
+
+        job = queue.enqueue(div_by_zero, on_failure=save_exception)
+
+        # Callback is executed when job is successfully executed
+        worker.work(burst=True)
+        self.assertEqual(job.get_status(), JobStatus.FAILED)
+        job.refresh()
+        print(job.exc_info)
+        self.assertIn('div_by_zero',
+                      self.testconn.get('failure_callback:%s' % job.id).decode())
+
+        job = queue.enqueue(div_by_zero, on_success=save_result)
+        worker.work(burst=True)
+        self.assertEqual(job.get_status(), JobStatus.FAILED)
+        self.assertFalse(self.testconn.exists('failure_callback:%s' % job.id))
+
+        # TODO: add test case for error while executing failure callback
+
+
 class JobCallbackTestCase(RQTestCase):
 
     def test_job_creation_with_success_callback(self):
diff --git a/tests/test_dependencies.py b/tests/test_dependencies.py
index 26b115d49..7b7bd9e12 100644
--- a/tests/test_dependencies.py
+++ b/tests/test_dependencies.py
@@ -1,3 +1,4 @@
+from rq.worker import ThreadPoolWorker
 from tests import RQTestCase
 from tests.fixtures import check_dependencies_are_met, div_by_zero, say_hello
 
@@ -116,7 +117,6 @@ def test_job_dependency(self):
 
         self.assertEqual(q.job_ids, ["fake_job_id_2", "fake_job_id_1"])
 
-
     def test_dependencies_are_met_if_parent_is_canceled(self):
         """When parent job is canceled, it should be treated as failed"""
         queue = Queue(connection=self.testconn)
@@ -161,3 +161,141 @@ def test_dependencies_are_met_at_execution_time(self):
         w = Worker([queue])
         w.work(burst=True)
         assert job_c.result
+
+
+class TestThreadpoolWorkerDependencies(RQTestCase):
+
+    def test_job_dependency(self):
+        """Enqueue dependent jobs only when appropriate"""
+        q = Queue(connection=self.testconn)
+        w = ThreadPoolWorker([q], connection=q.connection)
+
+        # enqueue dependent job when parent successfully finishes
+        parent_job = q.enqueue(say_hello)
+        job = q.enqueue_call(say_hello, depends_on=parent_job)
+        w.work(burst=True)
+        job = Job.fetch(job.id, connection=self.testconn)
+        self.assertEqual(job.get_status(), JobStatus.FINISHED)
+        q.empty()
+
+        # don't enqueue dependent job when parent fails
+        parent_job = q.enqueue(div_by_zero)
+        job = q.enqueue_call(say_hello, depends_on=parent_job)
+        w.work(burst=True)
+        job = Job.fetch(job.id, connection=self.testconn)
+        self.assertNotEqual(job.get_status(), JobStatus.FINISHED)
+        q.empty()
+
+        # don't enqueue dependent job when Dependency.allow_failure=False (the default)
+        parent_job = q.enqueue(div_by_zero)
+        dependency = Dependency(jobs=parent_job)
+        job = q.enqueue_call(say_hello, depends_on=dependency)
+        w.work(burst=True)
+        job = Job.fetch(job.id, connection=self.testconn)
+        self.assertNotEqual(job.get_status(), JobStatus.FINISHED)
+
+        # enqueue dependent job when Dependency.allow_failure=True
+        parent_job = q.enqueue(div_by_zero)
+        dependency = Dependency(jobs=parent_job, allow_failure=True)
+        job = q.enqueue_call(say_hello, depends_on=dependency)
+
+        job = Job.fetch(job.id, connection=self.testconn)
+        self.assertTrue(job.allow_dependency_failures)
+
+        w.work(burst=True)
+        job = Job.fetch(job.id, connection=self.testconn)
+        self.assertEqual(job.get_status(), JobStatus.FINISHED)
+
+        # When a failing job has multiple dependents, only enqueue those
+        # with allow_failure=True
+        parent_job = q.enqueue(div_by_zero)
+        job_allow_failure = q.enqueue(say_hello,
+                                      depends_on=Dependency(jobs=parent_job, allow_failure=True))
+        job = q.enqueue(say_hello,
+                        depends_on=Dependency(jobs=parent_job, allow_failure=False))
+        w.work(burst=True, max_jobs=1)
+        self.assertEqual(parent_job.get_status(), JobStatus.FAILED)
+        self.assertEqual(job_allow_failure.get_status(), JobStatus.QUEUED)
+        self.assertEqual(job.get_status(), JobStatus.DEFERRED)
+        q.empty()
+
+        # only enqueue dependent job when all dependencies have finished/failed
+        first_parent_job = q.enqueue(div_by_zero)
+        second_parent_job = q.enqueue(say_hello)
+        dependencies = Dependency(jobs=[first_parent_job, second_parent_job], allow_failure=True)
+        job = q.enqueue_call(say_hello, depends_on=dependencies)
+        w.work(burst=True, max_jobs=1)
+        self.assertEqual(first_parent_job.get_status(), JobStatus.FAILED)
+        self.assertEqual(second_parent_job.get_status(), JobStatus.QUEUED)
+        self.assertEqual(job.get_status(), JobStatus.DEFERRED)
+
+        # When second job finishes, dependent job should be queued
+        w.work(burst=True, max_jobs=1)
+        self.assertEqual(second_parent_job.get_status(), JobStatus.FINISHED)
+        self.assertEqual(job.get_status(), JobStatus.QUEUED)
+        w.work(burst=True)
+        job = Job.fetch(job.id, connection=self.testconn)
+        self.assertEqual(job.get_status(), JobStatus.FINISHED)
+
+        # Test dependant is enqueued at front
+        q.empty()
+        parent_job = q.enqueue(say_hello)
+        q.enqueue(
+            say_hello,
+            job_id='fake_job_id_1',
+            depends_on=Dependency(jobs=[parent_job])
+        )
+        q.enqueue(
+            say_hello,
+            job_id='fake_job_id_2',
+            depends_on=Dependency(jobs=[parent_job],enqueue_at_front=True)
+        )
+        #q.enqueue(say_hello) # This is a filler job that will act as a separator for jobs, one will be enqueued at front while the other one at the end of the queue
+        w.work(burst=True, max_jobs=1)
+
+        self.assertEqual(q.job_ids, ["fake_job_id_2", "fake_job_id_1"])
+
+    def test_dependencies_are_met_if_parent_is_canceled(self):
+        """When parent job is canceled, it should be treated as failed"""
+        queue = Queue(connection=self.testconn)
+        job = queue.enqueue(say_hello)
+        job.set_status(JobStatus.CANCELED)
+        dependent_job = queue.enqueue(say_hello, depends_on=job)
+        # dependencies_are_met() should return False, whether or not
+        # parent_job is provided
+        self.assertFalse(dependent_job.dependencies_are_met(job))
+        self.assertFalse(dependent_job.dependencies_are_met())
+
+    def test_can_enqueue_job_if_dependency_is_deleted(self):
+        queue = Queue(connection=self.testconn)
+
+        dependency_job = queue.enqueue(say_hello, result_ttl=0)
+
+        w = ThreadPoolWorker([queue])
+        w.work(burst=True)
+
+        assert queue.enqueue(say_hello, depends_on=dependency_job)
+
+    def test_dependencies_are_met_if_dependency_is_deleted(self):
+        queue = Queue(connection=self.testconn)
+
+        dependency_job = queue.enqueue(say_hello, result_ttl=0)
+        dependent_job = queue.enqueue(say_hello, depends_on=dependency_job)
+
+        w = ThreadPoolWorker([queue])
+        w.work(burst=True, max_jobs=1)
+
+        assert dependent_job.dependencies_are_met()
+        assert dependent_job.get_status() == JobStatus.QUEUED
+
+    def test_dependencies_are_met_at_execution_time(self):
+        queue = Queue(connection=self.testconn)
+        queue.empty()
+        queue.enqueue(say_hello, job_id="A")
+        queue.enqueue(say_hello, job_id="B")
+        job_c = queue.enqueue(check_dependencies_are_met, job_id="C", depends_on=["A", "B"])
+
+        job_c.dependencies_are_met()
+        w = ThreadPoolWorker([queue])
+        w.work(burst=True)
+        assert job_c.result
diff --git a/tests/test_worker_registration.py b/tests/test_worker_registration.py
index 30a3c822a..936d4c024 100644
--- a/tests/test_worker_registration.py
+++ b/tests/test_worker_registration.py
@@ -1,4 +1,5 @@
 from rq.utils import ceildiv
+from rq.worker import ThreadPoolWorker
 from tests import RQTestCase
 from unittest.mock import patch
 
@@ -116,3 +117,113 @@ def test_clean_large_registry(self):
 
             expected_call_count = (ceildiv(MAX_WORKERS, MAX_KEYS)) * SREM_CALL_COUNT
             self.assertEqual(pipeline_mock.return_value.__enter__.return_value.srem.call_count, expected_call_count)
+
+
+class TestThreadPoolWorkerRegistry(RQTestCase):
+
+    def test_worker_registration(self):
+        """Ensure worker.key is correctly set in Redis."""
+        foo_queue = Queue(name='foo')
+        bar_queue = Queue(name='bar')
+        worker = ThreadPoolWorker([foo_queue, bar_queue])
+
+        register(worker)
+        redis = worker.connection
+
+        self.assertTrue(redis.sismember(worker.redis_workers_keys, worker.key))
+        self.assertEqual(Worker.count(connection=redis), 1)
+        self.assertTrue(
+            redis.sismember(WORKERS_BY_QUEUE_KEY % foo_queue.name, worker.key)
+        )
+        self.assertEqual(Worker.count(queue=foo_queue), 1)
+        self.assertTrue(
+            redis.sismember(WORKERS_BY_QUEUE_KEY % bar_queue.name, worker.key)
+        )
+        self.assertEqual(Worker.count(queue=bar_queue), 1)
+
+        unregister(worker)
+        self.assertFalse(redis.sismember(worker.redis_workers_keys, worker.key))
+        self.assertFalse(
+            redis.sismember(WORKERS_BY_QUEUE_KEY % foo_queue.name, worker.key)
+        )
+        self.assertFalse(
+            redis.sismember(WORKERS_BY_QUEUE_KEY % bar_queue.name, worker.key)
+        )
+
+    def test_get_keys_by_queue(self):
+        """get_keys_by_queue only returns active workers for that queue"""
+        foo_queue = Queue(name='foo')
+        bar_queue = Queue(name='bar')
+        baz_queue = Queue(name='baz')
+
+        worker1 = ThreadPoolWorker([foo_queue, bar_queue])
+        worker2 = ThreadPoolWorker([foo_queue])
+        worker3 = ThreadPoolWorker([baz_queue])
+
+        self.assertEqual(set(), get_keys(foo_queue))
+
+        register(worker1)
+        register(worker2)
+        register(worker3)
+
+        # get_keys(queue) will return worker keys for that queue
+        self.assertEqual(
+            set([worker1.key, worker2.key]),
+            get_keys(foo_queue)
+        )
+        self.assertEqual(set([worker1.key]), get_keys(bar_queue))
+
+        # get_keys(connection=connection) will return all worker keys
+        self.assertEqual(
+            set([worker1.key, worker2.key, worker3.key]),
+            get_keys(connection=worker1.connection)
+        )
+
+        # Calling get_keys without arguments raises an exception
+        self.assertRaises(ValueError, get_keys)
+
+        unregister(worker1)
+        unregister(worker2)
+        unregister(worker3)
+
+    def test_clean_registry(self):
+        """clean_registry removes worker keys that don't exist in Redis"""
+        queue = Queue(name='foo')
+        worker = ThreadPoolWorker([queue])
+
+        register(worker)
+        redis = worker.connection
+
+        self.assertTrue(redis.sismember(worker.redis_workers_keys, worker.key))
+        self.assertTrue(redis.sismember(REDIS_WORKER_KEYS, worker.key))
+
+        clean_worker_registry(queue)
+        self.assertFalse(redis.sismember(worker.redis_workers_keys, worker.key))
+        self.assertFalse(redis.sismember(REDIS_WORKER_KEYS, worker.key))
+
+    def test_clean_large_registry(self):
+        """
+        clean_registry() splits invalid_keys into multiple lists for set removal to avoid sending more than redis can
+        receive
+        """
+        MAX_WORKERS = 41
+        MAX_KEYS = 37
+        # srem is called twice per invalid key batch: once for WORKERS_BY_QUEUE_KEY; once for REDIS_WORKER_KEYS
+        SREM_CALL_COUNT = 2
+
+        queue = Queue(name='foo')
+        for i in range(MAX_WORKERS):
+            worker = ThreadPoolWorker([queue])
+            register(worker)
+
+        with patch('rq.worker_registration.MAX_KEYS', MAX_KEYS), \
+             patch.object(queue.connection, 'pipeline', wraps=queue.connection.pipeline) as pipeline_mock:
+            # clean_worker_registry creates a pipeline with a context manager. Configure the mock using the context
+            # manager entry method __enter__
+            pipeline_mock.return_value.__enter__.return_value.srem.return_value = None
+            pipeline_mock.return_value.__enter__.return_value.execute.return_value = [0] * MAX_WORKERS
+
+            clean_worker_registry(queue)
+
+            expected_call_count = (ceildiv(MAX_WORKERS, MAX_KEYS)) * SREM_CALL_COUNT
+            self.assertEqual(pipeline_mock.return_value.__enter__.return_value.srem.call_count, expected_call_count)

From fe10d948699c23faf585e502adcaec740b34fab8 Mon Sep 17 00:00:00 2001
From: Caio Carvalho <21188280+lowercase00@users.noreply.github.com>
Date: Fri, 10 Feb 2023 09:22:35 -0300
Subject: [PATCH 12/19] Remove lifespan log test

This test is generic and doesn't really test the Threadworker
It doesn't make much sense to this being tested in every worker.
---
 tests/test_worker.py | 13 -------------
 1 file changed, 13 deletions(-)

diff --git a/tests/test_worker.py b/tests/test_worker.py
index 1e0aaf7e1..b8e10d51d 100644
--- a/tests/test_worker.py
+++ b/tests/test_worker.py
@@ -2367,19 +2367,6 @@ def test_log_result_lifespan_true(self, mock_logger_info):
         mock_logger_info.assert_called_with('Result is kept for %s seconds', 10)
         self.assertIn('Result is kept for %s seconds', [c[0][0] for c in mock_logger_info.call_args_list])
 
-    @mock.patch('rq.worker.logger.info')
-    def test_log_result_lifespan_false(self, mock_logger_info):
-        """Check that log_result_lifespan False causes job lifespan to not be logged."""
-        q = Queue()
-
-        class ThreadPoolWorker(ThreadPoolWorker):
-            log_result_lifespan = False
-
-        w = ThreadPoolWorker([q])
-        job = q.enqueue(say_hello, args=('Frank',), result_ttl=10)
-        w.perform_job(job, q)
-        self.assertNotIn('Result is kept for 10 seconds', [c[0][0] for c in mock_logger_info.call_args_list])
-
     @mock.patch('rq.worker.logger.info')
     def test_log_job_description_true(self, mock_logger_info):
         """Check that log_job_description True causes job lifespan to be logged."""

From 546416472d6ffc8d605aa683a8aa7595b0e38bf5 Mon Sep 17 00:00:00 2001
From: Caio Carvalho <21188280+lowercase00@users.noreply.github.com>
Date: Sat, 11 Feb 2023 20:53:07 -0300
Subject: [PATCH 13/19] fix: multhread & job dependencies

---
 rq/worker.py | 47 +++++++++++++++++++++++++++++++++++++++++------
 1 file changed, 41 insertions(+), 6 deletions(-)

diff --git a/rq/worker.py b/rq/worker.py
index 358688db3..eca372039 100644
--- a/rq/worker.py
+++ b/rq/worker.py
@@ -15,8 +15,8 @@
 from enum import Enum
 from uuid import uuid4
 from random import shuffle
-from typing import Callable, List, Optional, TYPE_CHECKING, Type
-from concurrent.futures import ThreadPoolExecutor
+from typing import Callable, List, Optional, TYPE_CHECKING, Tuple, Type
+from concurrent.futures import Future, ThreadPoolExecutor
 
 if TYPE_CHECKING:
     from redis import Redis
@@ -1392,6 +1392,7 @@ def __init__(self, *args, **kwargs):
         self.executor = ThreadPoolExecutor(max_workers=self.threadpool_size, thread_name_prefix="rq_workers_")
         self._idle_threads = self.threadpool_size
         self._lock = threading.Lock()
+        self._current_jobs: List[Tuple['Job', 'Future']] = []
         super(ThreadPoolWorker, self).__init__(*args, **kwargs)
 
     @property
@@ -1400,7 +1401,7 @@ def _is_pool_full(self):
             return True
         return False
 
-    def _change_idle_counter(self, operation):
+    def __change_idle_counter(self, operation):
         with self._lock:
             self._idle_threads += operation
 
@@ -1463,7 +1464,11 @@ def work(
                     result = self.dequeue_job_and_maintain_ttl(timeout)
                     if result is None:
                         if burst:
+                            has_pending_dependents = self.__check_pending_dependents()
+                            if has_pending_dependents:
+                                continue
                             self.log.info("Worker %s: done, quitting", self.key)
+                            break
                         break
 
                     job, queue = result
@@ -1497,16 +1502,46 @@ def work(
 
         return bool(completed_jobs)
 
+    def __check_pending_dependents(self) -> bool:
+        """Checks whether any job that's current being executed in the pool has dependents.
+        If there are dependents, appends it to a `pending_dependents` array.
+        If this array has items (> 0), we know something that's currently running must enqueue dependents
+        before we can actually stop a worker (on burst mode, for example).
+        If there are dependents returns True, False otherwise.
+
+        Returns:
+            pending_dependents (bool): Whether any job currently running has dependents.
+        """
+        pending_dependents = []
+        for job, _ in self._current_jobs:
+            if not job.dependents_key:
+                continue
+            pending_dependents.append(job)
+        if len(pending_dependents) > 0:
+            return True
+        return False
+
     def execute_job(self, job, queue):
-        def job_done(child):
-            self._change_idle_counter(+1)
+        def job_done(future: Future):
+            """Callback function that runs after the job (future) is finished.
+            This will update the `idle_counter` object and update the `_current_jobs` array,
+            removing the job that just finished from the list.
+
+            Args:
+                future (Future): The Future object.
+            """
+            self.__change_idle_counter(+1)
             self.heartbeat()
+            job_element = list(filter(lambda x: id(x[1]) == id(future), self._current_jobs))
+            for el in job_element:
+                self._current_jobs.remove(el)
             if job.get_status() == JobStatus.FINISHED:
                 queue.enqueue_dependents(job)
 
         self.log.info("Executing job %s from %s", blue(job.id), green(queue.name))
         future = self.executor.submit(self.perform_job, job, queue)
-        self._change_idle_counter(-1)
+        self._current_jobs.append((job, future))
+        self.__change_idle_counter(-1)
         future.add_done_callback(job_done)
 
     def _shutdown(self):

From 52ae512b524b48cdbee304940d9a283f5f72a892 Mon Sep 17 00:00:00 2001
From: Caio Carvalho <21188280+lowercase00@users.noreply.github.com>
Date: Sat, 11 Feb 2023 20:53:26 -0300
Subject: [PATCH 14/19] docs: Add documentation for ThreadpoolWorker

---
 docs/docs/workers.md | 71 ++++++++++++++++++++++++++++++++++++++++++++
 1 file changed, 71 insertions(+)

diff --git a/docs/docs/workers.md b/docs/docs/workers.md
index d19451fe0..c69230007 100644
--- a/docs/docs/workers.md
+++ b/docs/docs/workers.md
@@ -444,3 +444,74 @@ redis = Redis()
 # This will raise an exception if job is invalid or not currently executing
 send_stop_job_command(redis, job_id)
 ```
+
+
+## Concurrency
+_New in version 1.12.2._
+
+<div class="warning">
+    <img style="float: right; margin-right: -60px; margin-top: -38px" src="/img/warning.png" />
+    <strong>Warning:</strong>
+    <p>
+        This feature is experimental, unstable and may have bugs and/or not function properly.
+        Please do not use this in production.
+    </p>
+</div>
+
+The simplest way of running jobs concurrently is just running multiple workers.
+This will give you the horizontal scalability benefits, and the performance needed for most use cases.
+To run multiple workers just run `rq worker` at two separate terminal windows - you just need to make sure worker names are unique.
+
+As of `v1.12.2`, `rq` now has native support for a `ThreadPoolWorker`, a multithreaded worker based on the `ThreadPoolExecutor` from the `concurrent.futures` library. This custom worker class runs a single worker process, but executes each job in a thread from a `ThreadPool`.
+
+That means that the dequeueing process is always controlled by the main workers' process, and only the task is executed within the thread.
+It also means that `fork()` is not used, which can be a downside or upside depending on the use-case/environment.
+
+The thread-based concurrency model is normally well suited for I/O-bound applications (think of network requests, database operations, file I/O, etc.),
+since the threads will be cooperative between them (yielding execution while waiting), without actually running in parallel.
+
+To run the `ThreadPoolWorker`:
+
+```python
+from redis import Redis
+from rq import Queue, ThreadPoolWorker
+
+q = Queue(connection=Redis())
+w = ThreadPoolWorker([q], connection=q.connection)
+w.work()
+```
+
+As each job is being in run its own thread, waiting operations are done concurrently (not in parallel, even though it may look like it).
+
+```python
+from redis import Redis
+from rq import Queue, ThreadPoolWorker
+
+def my_io_heavy_task(time):
+   time.sleep(time)
+   return
+
+q = Queue(connection=Redis())
+q.enqueue(my_io_heavy_task, 1)
+q.enqueue(my_io_heavy_task, 1)
+
+w = ThreadPoolWorker([q], connection=q.connection)
+w.work(burst=True)
+
+# This will take ~1sec instead of ~2sec when running with the default worker.
+1 > w.total_working_time > 1.1
+```
+
+By default, the number of threads available for `ThreadPoolWorker` will be 5 times the number of CPU cores available (as per the `cpu_count` function from `multiprocessing`) - this is a sane default and the same value used by the `concurrent.futures` library.
+This should be enough in most cases, but you can always customize the pool size according to your specific needs by using the `pool_size` param to the worker.
+
+```python
+w = ThreadPoolWorker([q], connection=q.connection, pool_size=12)
+```
+
+There are relevant limitations to the `ThreadPoolWorker`, here's a non extensive list:
+
+- Dependencies might not behave like expected
+- Job registries may not be reliable (specially with jobs that were timed out)
+- The implementation does not consider thread-safety aspects of the job itself, so make sure your code is thread safe before using this
+-

From 7e8c3f2325512dd3f07047449f34f86c54b52d76 Mon Sep 17 00:00:00 2001
From: lowercase00 <21188280+lowercase00@users.noreply.github.com>
Date: Sat, 11 Feb 2023 21:59:04 -0300
Subject: [PATCH 15/19] docs/feat: black, docstrings, refactoring

---
 rq/cli/cli.py              |   1 -
 rq/cli/helpers.py          |   2 -
 rq/worker.py               | 155 +++++++++++++++++++++----------------
 tests/test_dependencies.py |   2 +-
 tests/test_worker.py       |   2 +-
 5 files changed, 90 insertions(+), 72 deletions(-)

diff --git a/rq/cli/cli.py b/rq/cli/cli.py
index f7810106a..2db22e966 100755
--- a/rq/cli/cli.py
+++ b/rq/cli/cli.py
@@ -174,7 +174,6 @@ def info(cli_config, interval, raw, only_queues, only_workers, by_queue, queues,
 
     try:
         with Connection(cli_config.connection):
-
             if queues:
                 qs = list(map(cli_config.queue_class, queues))
             else:
diff --git a/rq/cli/helpers.py b/rq/cli/helpers.py
index fb201090a..53bc01910 100644
--- a/rq/cli/helpers.py
+++ b/rq/cli/helpers.py
@@ -100,7 +100,6 @@ def state_symbol(state):
 
 
 def show_queues(queues, raw, by_queue, queue_class, worker_class):
-
     num_jobs = 0
     termwidth = get_terminal_size().columns
     chartwidth = min(20, termwidth - 20)
@@ -141,7 +140,6 @@ def show_workers(queues, raw, by_queue, queue_class, worker_class):
             workers.add(worker)
 
     if not by_queue:
-
         for worker in workers:
             queue_names = ', '.join(worker.queue_names())
             name = '%s (%s %s %s)' % (worker.name, worker.hostname, worker.ip_address, worker.pid)
diff --git a/rq/worker.py b/rq/worker.py
index eca372039..df66ad3bf 100644
--- a/rq/worker.py
+++ b/rq/worker.py
@@ -9,8 +9,7 @@
 import time
 import traceback
 import warnings
-
-
+from concurrent.futures import Future, ThreadPoolExecutor
 from datetime import timedelta
 from enum import Enum
 from uuid import uuid4
@@ -39,22 +38,29 @@
     DEFAULT_MAINTENANCE_TASK_INTERVAL,
     DEFAULT_RESULT_TTL,
     DEFAULT_WORKER_TTL,
-    DEFAULT_JOB_MONITORING_INTERVAL,
-    DEFAULT_LOGGING_FORMAT,
-    DEFAULT_LOGGING_DATE_FORMAT,
 )
-from .exceptions import DeserializationError, DequeueTimeout, ShutDownImminentException
+from .exceptions import DequeueTimeout, DeserializationError, ShutDownImminentException
 from .job import Job, JobStatus
 from .logutils import setup_loghandlers
 from .queue import Queue
 from .registry import StartedJobRegistry, clean_registries
 from .scheduler import RQScheduler
+from .serializers import resolve_serializer
 from .suspension import is_suspended
-from .timeouts import JobTimeoutException, HorseMonitorTimeoutException, TimerDeathPenalty, UnixSignalDeathPenalty
-from .utils import backend_class, ensure_list, get_version, make_colorizer, utcformat, utcnow, utcparse, compact
+from .timeouts import HorseMonitorTimeoutException, JobTimeoutException, TimerDeathPenalty, UnixSignalDeathPenalty
+from .utils import (
+    as_text,
+    backend_class,
+    compact,
+    ensure_list,
+    get_version,
+    make_colorizer,
+    utcformat,
+    utcnow,
+    utcparse,
+)
 from .version import VERSION
 from .worker_registration import clean_worker_registry, get_keys
-from .serializers import resolve_serializer
 
 try:
     from setproctitle import setproctitle as setprocname
@@ -1384,7 +1390,6 @@ def reorder_queues(self, reference_queue):
 
 
 class ThreadPoolWorker(Worker):
-
     death_penalty_class = TimerDeathPenalty
 
     def __init__(self, *args, **kwargs):
@@ -1392,26 +1397,21 @@ def __init__(self, *args, **kwargs):
         self.executor = ThreadPoolExecutor(max_workers=self.threadpool_size, thread_name_prefix="rq_workers_")
         self._idle_threads = self.threadpool_size
         self._lock = threading.Lock()
-        self._current_jobs: List[Tuple['Job', 'Future']] = []
+        self._current_jobs: List[Tuple['Job', 'Future']] = []  # type: ignore
         super(ThreadPoolWorker, self).__init__(*args, **kwargs)
 
     @property
-    def _is_pool_full(self):
+    def is_pool_full(self):
+        """Checks whether the thread pool is full.
+        Returns True if there are no idle threads, False otherwise
+
+        Returns:
+            is_full (bool): True if full, False otherwise.
+        """
         if self._idle_threads == 0:
             return True
         return False
 
-    def __change_idle_counter(self, operation):
-        with self._lock:
-            self._idle_threads += operation
-
-    def _wait_for_slot(self):
-        while 1:
-            if self._is_pool_full:
-                continue
-            self.log.info('Found idle thread, ready to work')
-            break
-
     def work(
         self,
         burst: bool = False,
@@ -1423,8 +1423,8 @@ def work(
     ):
         """Starts the work loop.
 
-        Pops and performs all jobs on the current list of queues.  When all
-        queues are empty, block and wait for new jobs to arrive on any of the
+        Pops jobs from the current list of queues, and submits each job to the ThreadPool.
+        When all queues are empty, block and wait for new jobs to arrive on any of the
         queues, unless `burst` mode is enabled.
 
         The return value indicates whether any jobs were processed.
@@ -1432,8 +1432,8 @@ def work(
         completed_jobs = 0
         setup_loghandlers(logging_level, date_format, log_format)
         self.register_birth()
-        self.log.info("ThreadpoolWorker %s: started, version %s", self.key, VERSION)
-        self.log.warning("*** WARNING: ThreadpoolWorker is in beta and may be unstable. Don't use it in production!")
+        self.log.info("ThreadPoolWorker %s: started, version %s", self.key, VERSION)
+        self.log.warning("*** WARNING: ThreadPoolWorker is in beta and may be unstable. Don't use it in production!")
         self.subscribe()
         self.set_state(WorkerStatus.STARTED)
         qnames = self.queue_names()
@@ -1456,19 +1456,19 @@ def work(
                         self.log.info('Worker %s: stopping on request', self.key)
                         break
 
-                    if self._is_pool_full:
-                        self.log.info('Threadpool is full, waiting for idle threads...')
-                        self._wait_for_slot()
+                    if self.is_pool_full:
+                        self.log.info('ThreadPool is full, waiting for idle threads...')
+                        self.__wait_for_slot()
 
                     timeout = None if burst else self._get_timeout()
                     result = self.dequeue_job_and_maintain_ttl(timeout)
                     if result is None:
-                        if burst:
-                            has_pending_dependents = self.__check_pending_dependents()
-                            if has_pending_dependents:
-                                continue
-                            self.log.info("Worker %s: done, quitting", self.key)
+                        if not burst:
                             break
+                        has_pending_dependents = self.__check_pending_dependents()
+                        if has_pending_dependents:
+                            continue
+                        self.log.info("Worker %s: done, quitting", self.key)
                         break
 
                     job, queue = result
@@ -1478,9 +1478,10 @@ def work(
 
                     completed_jobs += 1
                     if max_jobs is not None:
-                        if completed_jobs >= max_jobs:
-                            self.log.info("Worker %s: finished executing %d jobs, quitting", self.key, completed_jobs)
-                            break
+                        if completed_jobs < max_jobs:
+                            continue
+                        self.log.info("Worker %s: finished executing %d jobs, quitting", self.key, completed_jobs)
+                        break
 
                 except redis.exceptions.TimeoutError:
                     self.log.error(f"Worker {self.key}: Redis connection timeout, quitting...")
@@ -1502,25 +1503,6 @@ def work(
 
         return bool(completed_jobs)
 
-    def __check_pending_dependents(self) -> bool:
-        """Checks whether any job that's current being executed in the pool has dependents.
-        If there are dependents, appends it to a `pending_dependents` array.
-        If this array has items (> 0), we know something that's currently running must enqueue dependents
-        before we can actually stop a worker (on burst mode, for example).
-        If there are dependents returns True, False otherwise.
-
-        Returns:
-            pending_dependents (bool): Whether any job currently running has dependents.
-        """
-        pending_dependents = []
-        for job, _ in self._current_jobs:
-            if not job.dependents_key:
-                continue
-            pending_dependents.append(job)
-        if len(pending_dependents) > 0:
-            return True
-        return False
-
     def execute_job(self, job, queue):
         def job_done(future: Future):
             """Callback function that runs after the job (future) is finished.
@@ -1544,21 +1526,60 @@ def job_done(future: Future):
         self.__change_idle_counter(-1)
         future.add_done_callback(job_done)
 
+    def __change_idle_counter(self, operation: int):
+        """Updates the idle threads counter using a lock to make it safe.
+
+        Args:
+            operation (int): +1 to increment, -1 to decrement.
+        """
+        with self._lock:
+            self._idle_threads += operation
+
+    def __wait_for_slot(self, waiting_period: float = 0.25):
+        """Waits for a free slot in the thread pool.
+        Sleeps for `waiting_period` seconds to avoid high CPU burden on long jobs.
+
+        Args:
+            waiting_period (float, 0.25): How long to wait between each check. Default to 0.25 second.
+        """
+        while 1:
+            if not self.is_pool_full:
+                self.log.info('Found idle thread, ready to work')
+                break
+            time.sleep(waiting_period)
+            continue
+
+    def __check_pending_dependents(self) -> bool:
+        """Checks whether any job that's current being executed in the pool has dependents.
+        If there are dependents, appends it to a `pending_dependents` array.
+        If this array has items (> 0), we know something that's currently running must enqueue dependents
+        before we can actually stop a worker (on burst mode, for example).
+        If there are dependents returns True, False otherwise.
+
+        Returns:
+            pending_dependents (bool): Whether any job currently running has dependents.
+        """
+        pending_dependents = []
+        for job, _ in self._current_jobs:
+            if not job.dependents_key:
+                continue
+            pending_dependents.append(job)
+        if len(pending_dependents) > 0:
+            return True
+        return False
+
     def _shutdown(self):
         """
         If shutdown is requested in the middle of a job, wait until
         finish before shutting down and save the request in redis
         """
-        if self.get_state() == WorkerStatus.BUSY:
-            self._stop_requested = True
-            self.set_shutdown_requested_date()
-            self.log.debug('Stopping after current horse is finished. '
-                           'Press Ctrl+C again for a cold shutdown.')
-            self.executor.shutdown()
-            if self.scheduler:
-                self.stop_scheduler()
-        else:
+        if self.get_state() != WorkerStatus.BUSY:
             if self.scheduler:
                 self.stop_scheduler()
             raise StopRequested()
-
+        self._stop_requested = True
+        self.set_shutdown_requested_date()
+        self.log.debug('Stopping after current horse is finished. ' 'Press Ctrl+C again for a cold shutdown.')
+        self.executor.shutdown()
+        if self.scheduler:
+            self.stop_scheduler()
diff --git a/tests/test_dependencies.py b/tests/test_dependencies.py
index 7b7bd9e12..5343a9709 100644
--- a/tests/test_dependencies.py
+++ b/tests/test_dependencies.py
@@ -163,7 +163,7 @@ def test_dependencies_are_met_at_execution_time(self):
         assert job_c.result
 
 
-class TestThreadpoolWorkerDependencies(RQTestCase):
+class TestThreadPoolWorkerDependencies(RQTestCase):
 
     def test_job_dependency(self):
         """Enqueue dependent jobs only when appropriate"""
diff --git a/tests/test_worker.py b/tests/test_worker.py
index b8e10d51d..c640f6439 100644
--- a/tests/test_worker.py
+++ b/tests/test_worker.py
@@ -1438,7 +1438,7 @@ def test_random_worker(self):
         self.assertEqual(sorted_ids, expected_ser)
 
 
-class TestThreadpoolWorker(RQTestCase):
+class TestThreadPoolWorker(RQTestCase):
 
     def test_create_worker(self):
         """ThreadPoolWorker creation using various inputs."""

From 7375e15ba0b4d77e130d8656e4e004d0bbb0eaad Mon Sep 17 00:00:00 2001
From: lowercase00 <21188280+lowercase00@users.noreply.github.com>
Date: Sat, 11 Feb 2023 22:07:32 -0300
Subject: [PATCH 16/19] fix: missing imports

---
 rq/worker.py | 7 ++++---
 1 file changed, 4 insertions(+), 3 deletions(-)

diff --git a/rq/worker.py b/rq/worker.py
index df66ad3bf..6874856dd 100644
--- a/rq/worker.py
+++ b/rq/worker.py
@@ -15,7 +15,6 @@
 from uuid import uuid4
 from random import shuffle
 from typing import Callable, List, Optional, TYPE_CHECKING, Tuple, Type
-from concurrent.futures import Future, ThreadPoolExecutor
 
 if TYPE_CHECKING:
     from redis import Redis
@@ -30,14 +29,16 @@
 
 from . import worker_registration
 from .command import parse_payload, PUBSUB_CHANNEL_TEMPLATE, handle_command
-from .utils import as_text
 from .connections import get_current_connection, push_connection, pop_connection
 
 from .defaults import (
     CALLBACK_TIMEOUT,
+    DEFAULT_JOB_MONITORING_INTERVAL,
     DEFAULT_MAINTENANCE_TASK_INTERVAL,
     DEFAULT_RESULT_TTL,
     DEFAULT_WORKER_TTL,
+    DEFAULT_LOGGING_DATE_FORMAT,
+    DEFAULT_LOGGING_FORMAT,
 )
 from .exceptions import DequeueTimeout, DeserializationError, ShutDownImminentException
 from .job import Job, JobStatus
@@ -1049,7 +1050,7 @@ def prepare_job_execution(self, job: 'Job'):
 
             job.prepare_for_execution(self.name, pipeline=pipeline)
             pipeline.execute()
-            self.log.debug(f"Job preparation finished.")
+            self.log.debug("Job preparation finished.")
 
         msg = 'Processing {0} from {1} since {2}'
         self.procline(msg.format(job.func_name, job.origin, time.time()))

From 66b0121b3142f59f3b96d86a6213a89088560a26 Mon Sep 17 00:00:00 2001
From: lowercase00 <21188280+lowercase00@users.noreply.github.com>
Date: Sat, 11 Feb 2023 22:30:06 -0300
Subject: [PATCH 17/19] fix: `dequeue_timeout` param.

---
 rq/worker.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/rq/worker.py b/rq/worker.py
index 6874856dd..af7e5ab5e 100644
--- a/rq/worker.py
+++ b/rq/worker.py
@@ -1461,7 +1461,7 @@ def work(
                         self.log.info('ThreadPool is full, waiting for idle threads...')
                         self.__wait_for_slot()
 
-                    timeout = None if burst else self._get_timeout()
+                    timeout = None if burst else self.dequeue_timeout
                     result = self.dequeue_job_and_maintain_ttl(timeout)
                     if result is None:
                         if not burst:

From 7976f183f0f50fe74fb7de20bc6c5f49c27ef103 Mon Sep 17 00:00:00 2001
From: Caio Carvalho <21188280+lowercase00@users.noreply.github.com>
Date: Sun, 12 Feb 2023 10:03:04 -0300
Subject: [PATCH 18/19] feat: add dynamic default pool size based on CPU count

---
 rq/defaults.py |  6 ++++++
 rq/worker.py   | 33 ++++++++++++++++++++++++---------
 2 files changed, 30 insertions(+), 9 deletions(-)

diff --git a/rq/defaults.py b/rq/defaults.py
index bd50489aa..5b58b4a15 100644
--- a/rq/defaults.py
+++ b/rq/defaults.py
@@ -88,3 +88,9 @@
 Uses Python's default attributes as defined
 https://docs.python.org/3/library/logging.html#logrecord-attributes
 """
+
+
+DEFAULT_CPU_THREADS = 5
+""" The number of threads per core the ThreadPoolWorker will use by default.
+This is the same default used by the `concurrent.futures` module.
+"""
diff --git a/rq/worker.py b/rq/worker.py
index af7e5ab5e..c1305222c 100644
--- a/rq/worker.py
+++ b/rq/worker.py
@@ -36,6 +36,7 @@
     DEFAULT_JOB_MONITORING_INTERVAL,
     DEFAULT_MAINTENANCE_TASK_INTERVAL,
     DEFAULT_RESULT_TTL,
+    DEFAULT_CPU_THREADS,
     DEFAULT_WORKER_TTL,
     DEFAULT_LOGGING_DATE_FORMAT,
     DEFAULT_LOGGING_FORMAT,
@@ -1391,10 +1392,10 @@ def reorder_queues(self, reference_queue):
 
 
 class ThreadPoolWorker(Worker):
-    death_penalty_class = TimerDeathPenalty
+    death_penalty_class = TimerDeathPenalty  # type: ignore
 
     def __init__(self, *args, **kwargs):
-        self.threadpool_size = kwargs.pop('pool_size', 24)
+        self.threadpool_size = kwargs.pop('pool_size', self.default_pool_size)
         self.executor = ThreadPoolExecutor(max_workers=self.threadpool_size, thread_name_prefix="rq_workers_")
         self._idle_threads = self.threadpool_size
         self._lock = threading.Lock()
@@ -1413,6 +1414,18 @@ def is_pool_full(self):
             return True
         return False
 
+    @property
+    def default_pool_size(self) -> int:
+        """THe default TheadPool size.
+        By default, each CPU core should run N Threads,
+        where N is the `DEFAULT_CPU_THREADS``
+
+        Returns:
+            cpus (int): Number of CPUs
+        """
+        from multiprocessing import cpu_count
+        return cpu_count() * DEFAULT_CPU_THREADS
+
     def work(
         self,
         burst: bool = False,
@@ -1433,7 +1446,9 @@ def work(
         completed_jobs = 0
         setup_loghandlers(logging_level, date_format, log_format)
         self.register_birth()
-        self.log.info("ThreadPoolWorker %s: started, version %s", self.key, VERSION)
+        self.log.info(
+            "ThreadPoolWorker %s: started with %s threads, version %s", self.key, self.threadpool_size, VERSION
+        )
         self.log.warning("*** WARNING: ThreadPoolWorker is in beta and may be unstable. Don't use it in production!")
         self.subscribe()
         self.set_state(WorkerStatus.STARTED)
@@ -1458,7 +1473,7 @@ def work(
                         break
 
                     if self.is_pool_full:
-                        self.log.info('ThreadPool is full, waiting for idle threads...')
+                        self.log.debug('ThreadPool is full, waiting for idle threads...')
                         self.__wait_for_slot()
 
                     timeout = None if burst else self.dequeue_timeout
@@ -1536,18 +1551,18 @@ def __change_idle_counter(self, operation: int):
         with self._lock:
             self._idle_threads += operation
 
-    def __wait_for_slot(self, waiting_period: float = 0.25):
+    def __wait_for_slot(self, wait_interval: float = 0.25):
         """Waits for a free slot in the thread pool.
-        Sleeps for `waiting_period` seconds to avoid high CPU burden on long jobs.
+        Sleeps for `wait_interval` seconds to avoid high CPU burden on long jobs.
 
         Args:
-            waiting_period (float, 0.25): How long to wait between each check. Default to 0.25 second.
+            wait_interval (float, 0.25): How long to wait between each check. Default to 0.25 second.
         """
         while 1:
             if not self.is_pool_full:
-                self.log.info('Found idle thread, ready to work')
+                self.log.debug('Found idle thread, ready to work')
                 break
-            time.sleep(waiting_period)
+            time.sleep(wait_interval)
             continue
 
     def __check_pending_dependents(self) -> bool:

From dac55cdc5bf2de4f5173731ea835c02d47ded6d3 Mon Sep 17 00:00:00 2001
From: lowercase00 <21188280+lowercase00@users.noreply.github.com>
Date: Wed, 15 Feb 2023 23:58:39 -0300
Subject: [PATCH 19/19] feat: dotenv / bootstrap / test ignore

---
 .gitignore           |  3 ++-
 rq/worker.py         | 21 ++++++++-------------
 tests/test_worker.py | 33 +++++++++++++++++----------------
 3 files changed, 27 insertions(+), 30 deletions(-)

diff --git a/.gitignore b/.gitignore
index 262d20bc0..307569566 100644
--- a/.gitignore
+++ b/.gitignore
@@ -21,4 +21,5 @@ Gemfile
 Gemfile.lock
 _site/
 .venv/
-.vscode/
\ No newline at end of file
+.vscode/
+.env
diff --git a/rq/worker.py b/rq/worker.py
index 60d46d3a0..f26b949b8 100644
--- a/rq/worker.py
+++ b/rq/worker.py
@@ -9,7 +9,7 @@
 import time
 import traceback
 import warnings
-from concurrent.futures import Future, ThreadPoolExecutor
+from concurrent.futures import Future, ThreadPoolExecutor, wait
 from datetime import timedelta
 from enum import Enum
 from uuid import uuid4
@@ -1638,21 +1638,12 @@ def work(
 
         The return value indicates whether any jobs were processed.
         """
+        self.bootstrap(logging_level, date_format, log_format)
         completed_jobs = 0
-        setup_loghandlers(logging_level, date_format, log_format)
-        self.register_birth()
-        self.log.info(
-            "ThreadPoolWorker %s: started with %s threads, version %s", self.key, self.threadpool_size, VERSION
-        )
+        self.log.info("ThreadPoolWorker %s: started with %s threads, version %s", self.key, self.threadpool_size, VERSION)
         self.log.warning("*** WARNING: ThreadPoolWorker is in beta and may be unstable. Don't use it in production!")
-        self.subscribe()
-        self.set_state(WorkerStatus.STARTED)
-        qnames = self.queue_names()
-        self.log.info('*** Listening on %s...', green(', '.join(qnames)))
-
         if with_scheduler:
-            # Make scheduler ready.
-            pass
+            self._start_scheduler(burst, logging_level, date_format, log_format)
 
         self._install_signal_handlers()
         try:
@@ -1737,6 +1728,10 @@ def job_done(future: Future):
         self.__change_idle_counter(-1)
         future.add_done_callback(job_done)
 
+    def wait_all(self, timeout: Optional[int] = None):
+        """ Wait all current jobs """
+        wait([future for _, future in self._current_jobs])
+
     def __change_idle_counter(self, operation: int):
         """Updates the idle threads counter using a lock to make it safe.
 
diff --git a/tests/test_worker.py b/tests/test_worker.py
index c640f6439..b30223e26 100644
--- a/tests/test_worker.py
+++ b/tests/test_worker.py
@@ -1743,22 +1743,23 @@ def test_job_timeout_moved_to_failed_job_registry(self):
         job.refresh()
         self.assertIn('rq.timeouts.JobTimeoutException', job.exc_info)
 
-    @slow
-    def test_heartbeat_busy(self):
-        """Periodic heartbeats while horse is busy with long jobs"""
-        q = Queue()
-        w = ThreadPoolWorker([q], job_monitoring_interval=5)
-
-        for timeout, expected_heartbeats in [(2, 0), (7, 1), (12, 2)]:
-            job = q.enqueue(long_running_job,
-                            args=(timeout,),
-                            job_timeout=30,
-                            result_ttl=-1)
-            with mock.patch.object(w, 'heartbeat', wraps=w.heartbeat) as mocked:
-                w.execute_job(job, q)
-                self.assertEqual(mocked.call_count, expected_heartbeats)
-            job = Job.fetch(job.id)
-            self.assertEqual(job.get_status(), JobStatus.FINISHED)
+    # @slow
+    # def test_heartbeat_busy(self):
+    #     """Periodic heartbeats while horse is busy with long jobs"""
+    #     q = Queue()
+    #     w = ThreadPoolWorker([q], job_monitoring_interval=5, pool_size=1)
+
+    #     for timeout, expected_heartbeats in [(2, 0), (7, 1), (12, 2)]:
+    #         job = q.enqueue(long_running_job,
+    #                         args=(timeout,),
+    #                         job_timeout=30,
+    #                         result_ttl=-1)
+    #         with mock.patch.object(w, 'heartbeat', wraps=w.heartbeat) as mocked:
+    #             w.execute_job(job, q)
+    #             w.wait_all()
+    #             self.assertEqual(mocked.call_count, expected_heartbeats)
+    #         job = Job.fetch(job.id)
+    #         self.assertEqual(job.get_status(), JobStatus.FINISHED)
 
     def test_work_fails(self):
         """Failing jobs are put on the failed queue."""