Bug 1265503 - Move data cycling tests into their own file

mozilla · Dec 20, 2016 · 931865b · 931865b
1 parent 60f6c30
commit 931865b
Show file tree

Hide file tree

Showing 2 changed files with 210 additions and 199 deletions.
diff --git a/tests/model/derived/test_jobs_model.py b/tests/model/derived/test_jobs_model.py
@@ -15,16 +15,11 @@
                                      ExclusionProfile,
                                      FailureLine,
                                      Job,
-                                     JobDetail,
                                      JobDuration,
                                      JobExclusion,
                                      JobGroup,
                                      JobLog,
-                                     JobType,
-                                     Machine,
                                      Push)
-from treeherder.model.search import (TestFailureLine,
-                                     refresh_all)
 
 slow = pytest.mark.slow
 xfail = pytest.mark.xfail
@@ -321,200 +316,6 @@ def test_calculate_durations(jm, test_repository, failure_classifications,
     assert durations[0].average_duration == expected_duration
 
 
-def test_cycle_all_data(jm, failure_classifications, sample_data,
-                        sample_resultset, test_repository, mock_log_parser,
-                        failure_lines):
-    """
-    Test cycling the sample data
-    """
-    job_data = sample_data.job_data[:20]
-    test_utils.do_job_ingestion(jm, job_data, sample_resultset, False)
-
-    time_now = time.time()
-    cycle_date_ts = time_now - 7 * 24 * 3600
-
-    jm.execute(
-        proc="jobs_test.updates.set_jobs_submit_timestamp",
-        placeholders=[cycle_date_ts]
-    )
-
-    jobs_to_be_deleted = jm.execute(
-        proc="jobs_test.selects.get_jobs_for_cycling",
-        placeholders=[time_now - 24 * 3600]
-    )
-
-    jobs_before = jm.execute(proc="jobs_test.selects.jobs")
-
-    call_command('cycle_data', sleep_time=0, days=1)
-
-    refresh_all()
-
-    jobs_after = jm.execute(proc="jobs_test.selects.jobs")
-
-    assert len(jobs_after) == len(jobs_before) - len(jobs_to_be_deleted)
-
-    # There should be no jobs or failure lines after cycling
-    assert len(jobs_after) == 0
-    assert FailureLine.objects.count() == 0
-    assert Job.objects.count() == 0
-    assert JobDetail.objects.count() == 0
-    assert JobLog.objects.count() == 0
-
-    # There should be nothing in elastic search after cycling
-    assert TestFailureLine.search().params(search_type="count").execute().hits.total == 0
-
-
-def test_cycle_one_job(jm, failure_classifications, sample_data,
-                       sample_resultset, test_repository, mock_log_parser,
-                       elasticsearch, failure_lines):
-    """
-    Test cycling one job in a group of jobs to confirm there are no
-    unexpected deletions
-    """
-
-    job_data = sample_data.job_data[:20]
-    test_utils.do_job_ingestion(jm, job_data, sample_resultset, False)
-
-    job_not_deleted = jm.get_job(2)[0]
-
-    extra_objects = {
-        'failure_lines': (FailureLine,
-                          create_failure_lines(
-                              Job.objects.get(guid=job_not_deleted["job_guid"]),
-                              [(test_line, {}),
-                               (test_line, {"subtest": "subtest2"})])),
-        'job_details': (JobDetail, [JobDetail.objects.create(
-            job=Job.objects.get(guid=job_not_deleted["job_guid"]),
-            title='test',
-            value='testvalue')])
-    }
-
-    time_now = time.time()
-    cycle_date_ts = int(time_now - 7 * 24 * 3600)
-
-    jm.execute(
-        proc="jobs_test.updates.set_jobs_submit_timestamp",
-        placeholders=[time_now]
-    )
-
-    jm.execute(
-        proc="jobs_test.updates.set_one_job_submit_timestamp",
-        placeholders=[cycle_date_ts]
-    )
-
-    jobs_to_be_deleted = jm.execute(
-        proc="jobs_test.selects.get_one_job_for_cycling",
-        placeholders=[1]
-    )
-    num_job_logs_to_be_deleted = JobLog.objects.filter(
-        job__project_specific_id__in=[job['id'] for job in
-                                      jobs_to_be_deleted]).count()
-
-    jobs_before = jm.execute(proc="jobs_test.selects.jobs")
-    job_logs_before = JobLog.objects.count()
-
-    call_command('cycle_data', sleep_time=0, days=1, debug=True)
-    refresh_all()
-
-    jobs_after = jm.execute(proc="jobs_test.selects.jobs")
-
-    # Confirm that the target result set has no jobs in the
-    # jobs table
-    jobs_to_be_deleted_after = jm.execute(
-        proc="jobs_test.selects.get_one_job_for_cycling",
-        placeholders=[1]
-    )
-
-    assert len(jobs_to_be_deleted_after) == 0
-
-    assert len(jobs_after) == len(jobs_before) - len(jobs_to_be_deleted)
-    assert len(jobs_after) == Job.objects.count()
-
-    assert JobLog.objects.count() == (job_logs_before -
-                                      num_job_logs_to_be_deleted)
-
-    for (object_type, objects) in extra_objects.values():
-        assert (set(item.id for item in object_type.objects.all()) ==
-                set(item.id for item in objects))
-
-    assert set(int(item.meta.id) for item in TestFailureLine.search().execute()) == set(item.id for item in extra_objects["failure_lines"][1])
-
-
-def test_cycle_all_data_in_chunks(jm, failure_classifications, sample_data,
-                                  sample_resultset, test_repository, mock_log_parser):
-    """
-    Test cycling the sample data in chunks.
-    """
-    job_data = sample_data.job_data[:20]
-    test_utils.do_job_ingestion(jm, job_data, sample_resultset, False)
-
-    # build a date that will cause the data to be cycled
-    time_now = time.time()
-    cycle_date_ts = int(time_now - 7 * 24 * 3600)
-
-    jm.execute(
-        proc="jobs_test.updates.set_jobs_submit_timestamp",
-        placeholders=[cycle_date_ts]
-    )
-
-    jobs_to_be_deleted = jm.execute(
-        proc="jobs_test.selects.get_jobs_for_cycling",
-        placeholders=[time_now - 24 * 3600]
-    )
-
-    job = jm.get_job(jobs_to_be_deleted[0]['id'])[0]
-    create_failure_lines(Job.objects.get(guid=job["job_guid"]),
-                         [(test_line, {})] * 7)
-
-    jobs_before = jm.execute(proc="jobs_test.selects.jobs")
-
-    assert TestFailureLine.search().params(search_type="count").execute().hits.total > 0
-
-    call_command('cycle_data', sleep_time=0, days=1, chunk_size=3)
-    refresh_all()
-
-    jobs_after = jm.execute(proc="jobs_test.selects.jobs")
-
-    assert len(jobs_after) == len(jobs_before) - len(jobs_to_be_deleted)
-
-    # There should be no jobs after cycling
-    assert len(jobs_after) == 0
-    assert Job.objects.count() == 0
-    assert FailureLine.objects.count() == 0
-    assert JobDetail.objects.count() == 0
-    assert TestFailureLine.search().params(search_type="count").execute().hits.total == 0
-
-
-def test_cycle_job_model_reference_data(jm, failure_classifications,
-                                        sample_data, sample_resultset,
-                                        mock_log_parser):
-    job_data = sample_data.job_data[:20]
-    test_utils.do_job_ingestion(jm, job_data, sample_resultset, False)
-
-    # get a list of ids of original reference data
-    original_job_type_ids = JobType.objects.values_list('id', flat=True)
-    original_job_group_ids = JobGroup.objects.values_list('id', flat=True)
-    original_machine_ids = Machine.objects.values_list('id', flat=True)
-
-    # create a bunch of job model data that should be cycled, since they don't
-    # reference any current jobs
-    jg = JobGroup.objects.create(symbol='moo', name='moo')
-    jt = JobType.objects.create(job_group=jg, symbol='mu', name='mu')
-    m = Machine.objects.create(name='machine_with_no_job')
-    (jg_id, jt_id, m_id) = (jg.id, jt.id, m.id)
-    call_command('cycle_data', sleep_time=0, days=1, chunk_size=3)
-
-    # assert that reference data that should have been cycled, was cycled
-    assert JobGroup.objects.filter(id=jg_id).count() == 0
-    assert JobType.objects.filter(id=jt_id).count() == 0
-    assert Machine.objects.filter(id=m_id).count() == 0
-
-    # assert that we still have everything that shouldn't have been cycled
-    assert JobType.objects.filter(id__in=original_job_type_ids).count() == len(original_job_type_ids)
-    assert JobGroup.objects.filter(id__in=original_job_group_ids).count() == len(original_job_group_ids)
-    assert Machine.objects.filter(id__in=original_machine_ids).count() == len(original_machine_ids)
-
-
 def test_bad_date_value_ingestion(jm, failure_classifications, mock_log_parser):
     """
     Test ingesting an blob with bad date value