tests/test.py

#!/usr/bin/env python
#encoding:utf-8

import os
import unittest
import random
import string
from itertools import tee, izip

import scrappy.core as scrappy
# import scrappy.formatters as formatters


def pairwise(iterable):
    a, b = tee(iterable)
    next(b, None)
    return izip(a, b)


def get_utf8_panagram_data():
    with open(os.path.join(os.path.dirname(__file__), 'utf-8-panagrams.txt'), 'rb') as f:
        dat = f.readlines()

    return (map(lambda l: l.decode('utf-8'), pair) for pair in pairwise(dat))


def random_unicode(length=10):
    ru = lambda: unichr(random.randint(0, 0x10ffff))
    return ''.join([ru() for _ in xrange(length)])


def random_ascii(length=10):
    ascii = string.printable + string.whitespace
    return ''.join([random.choice(ascii) for _ in xrange(length)])


def test_compare_strings():
    """Test normalized Levenshtein distance."""
    for s1, s2 in get_utf8_panagram_data():
        ls1, ls2 = len(s1), len(s2)

        diff = scrappy.compare_strings(s1, s2)
        assert 0 <= diff <= 1
        if diff == 0:
            assert s1 == s2


def test_normalize():
    # ascii test
    for i in xrange(1000):
        scrappy.normalize(random_ascii(i))

    # unicode test
    for i in xrange(1000):
        scrappy.normalize(random_unicode(i))


class Test_Scrape(unittest.TestCase):
    def validate_output(self, scrp, id_):
        self.assertTrue(scrp.map_episode_info())
        self.assertEqual(str(scrp.id), str(id_))

    def test_basic(self):
        """Test simple scrape
        """
        s = scrappy.Scrape('its always sunny in philadelphia 1x2.mkv')
        self.validate_output(s, '75805')

    def test_glob(self):
        s = scrappy.Scrape('*phil*')
        self.validate_output(s, '75805')

    def test_list(self):
        s = scrappy.Scrape(['its always sunny i n philadelphia 101.mkv',
                            'its always sunny in philadelphia 1x2.mkv',
                            'its always sunny in phil s03e04.avi'])
        self.validate_output(s, '75805')

    def test_iter(self):
        s = scrappy.Scrape((f for f in os.listdir(os.getcwd()) if 'phil' in f))
        self.validate_output(s, '75805')

    def test_tvdbid(self):
        # typo should be ignored bc of tvdbid
        s = scrappy.Scrape('its always sunny i n philadelphia 101.mkv',
                           tvdbid=75805)
        self.validate_output(s, '75805')

    def test_abstract(self):
        s = scrappy.Scrape(['its always sunny i n philadelphia 101.mkv',
                            'its always sunny in philadelphia 1x2.mkv',
                            'its always sunny in phil s03e04.avi'],
                           interface=scrappy.AbstractMediaInterface)
        self.validate_output(s, '75805')


# class Test_Rename(unittest.TestCase):
#     def test_rename(self):
#         s = scrappy.Scrape([f for f in os.listdir(os.getcwd()) if 'phil' in f])
#         files = s.files
#         self.assertTrue(s.map_episode_info())
#         s.rename_files()
#         self.assertEqual(files, s.files)

#     def test_formatters(self):
#         forms = (formatters.formatter_default,
#                  formatters.formatter_X0X,
#                  formatters.formatter_longname)

#         for form in forms:
#             s = scrappy.Scrape([f for f in os.listdir(os.getcwd()) if 'phil' in f],
#                                formatter=form)
#             self.assertTrue(s.map_episode_info())