Skip to content

Commit

Permalink
test & other adjustments for Windows compat improvement
Browse files Browse the repository at this point in the history
  • Loading branch information
chrislit committed May 21, 2019
1 parent bc1bf08 commit 853d0f1
Show file tree
Hide file tree
Showing 4 changed files with 47 additions and 44 deletions.
2 changes: 1 addition & 1 deletion abydos/distance/_minhash.py
Original file line number Diff line number Diff line change
Expand Up @@ -130,7 +130,7 @@ def sim(self, src, tar):
k = self._k if self._k else max(len(src_tokens), len(tar_tokens))

masks = np.random.RandomState(seed=self._seed).randint(
_MININT, _MAXINT, k
_MININT, _MAXINT, k, dtype=np.int64
)

hashes_src = np.full(k, _MAXINT, dtype=np.int64)
Expand Down
11 changes: 6 additions & 5 deletions tests/corpus/test_corpus_unigram_corpus.py
Original file line number Diff line number Diff line change
Expand Up @@ -162,12 +162,13 @@ def test_unigram_corpus_gng_importer(self):

def test_unigram_corpus_save_load_corpus(self):
"""Test abydos.corpus.UnigramCorpus.save_corpus & .load_corpus."""
fn = tempfile.mkstemp('.dat')[1]
self.sotu2015_corpus.save_corpus(fn)
self.sotu2015_corpus.load_corpus(fn)
statinfo = os.stat(fn)
handle, path = tempfile.mkstemp('.dat')
self.sotu2015_corpus.save_corpus(path)
self.sotu2015_corpus.load_corpus(path)
statinfo = os.stat(path)
self.assertGreater(statinfo.st_size, 0)
os.remove(fn)
os.close(handle)
os.remove(path)

def test_unigram_corpus_idf(self):
"""Test abydos.corpus.UnigramCorpus.idf."""
Expand Down
66 changes: 33 additions & 33 deletions tests/distance/test_distance_dennis.py
Original file line number Diff line number Diff line change
Expand Up @@ -45,13 +45,13 @@ class DennisTestCases(unittest.TestCase):
def test_dennis_sim(self):
"""Test abydos.distance.Dennis.sim."""
# Base cases
self.assertEqual(self.cmp.sim('', ''), 0.3333333333333333)
self.assertEqual(self.cmp.sim('a', ''), 0.3333333333333333)
self.assertEqual(self.cmp.sim('', 'a'), 0.3333333333333333)
self.assertEqual(self.cmp.sim('abc', ''), 0.3333333333333333)
self.assertEqual(self.cmp.sim('', 'abc'), 0.3333333333333333)
self.assertEqual(self.cmp.sim('abc', 'abc'), 0.9965986394557826)
self.assertEqual(self.cmp.sim('abcd', 'efgh'), 0.32908163265306134)
self.assertAlmostEqual(self.cmp.sim('', ''), 0.3333333333333333)
self.assertAlmostEqual(self.cmp.sim('a', ''), 0.3333333333333333)
self.assertAlmostEqual(self.cmp.sim('', 'a'), 0.3333333333333333)
self.assertAlmostEqual(self.cmp.sim('abc', ''), 0.3333333333333333)
self.assertAlmostEqual(self.cmp.sim('', 'abc'), 0.3333333333333333)
self.assertAlmostEqual(self.cmp.sim('abc', 'abc'), 0.9965986394557826)
self.assertAlmostEqual(self.cmp.sim('abcd', 'efgh'), 0.32908163265306134)

self.assertAlmostEqual(self.cmp.sim('Nigel', 'Niall'), 0.6615646259)
self.assertAlmostEqual(self.cmp.sim('Niall', 'Nigel'), 0.6615646259)
Expand All @@ -62,13 +62,13 @@ def test_dennis_sim(self):
)

# Tests with alphabet=0 (no d factor)
self.assertEqual(self.cmp_no_d.sim('', ''), 0.3333333333333333)
self.assertEqual(self.cmp_no_d.sim('a', ''), 0.3333333333333333)
self.assertEqual(self.cmp_no_d.sim('', 'a'), 0.3333333333333333)
self.assertEqual(self.cmp_no_d.sim('abc', ''), 0.3333333333333333)
self.assertEqual(self.cmp_no_d.sim('', 'abc'), 0.3333333333333333)
self.assertEqual(self.cmp_no_d.sim('abc', 'abc'), 0.3333333333333333)
self.assertEqual(self.cmp_no_d.sim('abcd', 'efgh'), 0.0)
self.assertAlmostEqual(self.cmp_no_d.sim('', ''), 0.3333333333333333)
self.assertAlmostEqual(self.cmp_no_d.sim('a', ''), 0.3333333333333333)
self.assertAlmostEqual(self.cmp_no_d.sim('', 'a'), 0.3333333333333333)
self.assertAlmostEqual(self.cmp_no_d.sim('abc', ''), 0.3333333333333333)
self.assertAlmostEqual(self.cmp_no_d.sim('', 'abc'), 0.3333333333333333)
self.assertAlmostEqual(self.cmp_no_d.sim('abc', 'abc'), 0.3333333333333333)
self.assertAlmostEqual(self.cmp_no_d.sim('abcd', 'efgh'), 0.0)

self.assertAlmostEqual(
self.cmp_no_d.sim('Nigel', 'Niall'), 0.2222222222
Expand All @@ -89,13 +89,13 @@ def test_dennis_sim(self):
def test_dennis_dist(self):
"""Test abydos.distance.Dennis.dist."""
# Base cases
self.assertEqual(self.cmp.dist('', ''), 0.6666666666666667)
self.assertEqual(self.cmp.dist('a', ''), 0.6666666666666667)
self.assertEqual(self.cmp.dist('', 'a'), 0.6666666666666667)
self.assertEqual(self.cmp.dist('abc', ''), 0.6666666666666667)
self.assertEqual(self.cmp.dist('', 'abc'), 0.6666666666666667)
self.assertEqual(self.cmp.dist('abc', 'abc'), 0.003401360544217358)
self.assertEqual(self.cmp.dist('abcd', 'efgh'), 0.6709183673469387)
self.assertAlmostEqual(self.cmp.dist('', ''), 0.6666666666666667)
self.assertAlmostEqual(self.cmp.dist('a', ''), 0.6666666666666667)
self.assertAlmostEqual(self.cmp.dist('', 'a'), 0.6666666666666667)
self.assertAlmostEqual(self.cmp.dist('abc', ''), 0.6666666666666667)
self.assertAlmostEqual(self.cmp.dist('', 'abc'), 0.6666666666666667)
self.assertAlmostEqual(self.cmp.dist('abc', 'abc'), 0.003401360544217358)
self.assertAlmostEqual(self.cmp.dist('abcd', 'efgh'), 0.6709183673469387)

self.assertAlmostEqual(self.cmp.dist('Nigel', 'Niall'), 0.3384353741)
self.assertAlmostEqual(self.cmp.dist('Niall', 'Nigel'), 0.3384353741)
Expand All @@ -106,13 +106,13 @@ def test_dennis_dist(self):
)

# Tests with alphabet=0 (no d factor)
self.assertEqual(self.cmp_no_d.dist('', ''), 0.6666666666666667)
self.assertEqual(self.cmp_no_d.dist('a', ''), 0.6666666666666667)
self.assertEqual(self.cmp_no_d.dist('', 'a'), 0.6666666666666667)
self.assertEqual(self.cmp_no_d.dist('abc', ''), 0.6666666666666667)
self.assertEqual(self.cmp_no_d.dist('', 'abc'), 0.6666666666666667)
self.assertEqual(self.cmp_no_d.dist('abc', 'abc'), 0.6666666666666667)
self.assertEqual(self.cmp_no_d.dist('abcd', 'efgh'), 1.0)
self.assertAlmostEqual(self.cmp_no_d.dist('', ''), 0.6666666666666667)
self.assertAlmostEqual(self.cmp_no_d.dist('a', ''), 0.6666666666666667)
self.assertAlmostEqual(self.cmp_no_d.dist('', 'a'), 0.6666666666666667)
self.assertAlmostEqual(self.cmp_no_d.dist('abc', ''), 0.6666666666666667)
self.assertAlmostEqual(self.cmp_no_d.dist('', 'abc'), 0.6666666666666667)
self.assertAlmostEqual(self.cmp_no_d.dist('abc', 'abc'), 0.6666666666666667)
self.assertAlmostEqual(self.cmp_no_d.dist('abcd', 'efgh'), 1.0)

self.assertAlmostEqual(
self.cmp_no_d.dist('Nigel', 'Niall'), 0.7777777778
Expand All @@ -138,8 +138,8 @@ def test_dennis_sim_score(self):
self.assertEqual(self.cmp.sim_score('', 'a'), 0.0)
self.assertEqual(self.cmp.sim_score('abc', ''), 0.0)
self.assertEqual(self.cmp.sim_score('', 'abc'), 0.0)
self.assertEqual(self.cmp.sim_score('abc', 'abc'), 27.85714285714286)
self.assertEqual(
self.assertAlmostEqual(self.cmp.sim_score('abc', 'abc'), 27.85714285714286)
self.assertAlmostEqual(
self.cmp.sim_score('abcd', 'efgh'), -0.17857142857142858
)

Expand All @@ -166,7 +166,7 @@ def test_dennis_sim_score(self):
self.assertEqual(self.cmp_no_d.sim_score('abc', ''), 0.0)
self.assertEqual(self.cmp_no_d.sim_score('', 'abc'), 0.0)
self.assertEqual(self.cmp_no_d.sim_score('abc', 'abc'), 0.0)
self.assertEqual(
self.assertAlmostEqual(
self.cmp_no_d.sim_score('abcd', 'efgh'), -1.5811388300841895
)

Expand All @@ -186,8 +186,8 @@ def test_dennis_corr(self):
self.assertEqual(self.cmp.corr('', 'a'), 0.0)
self.assertEqual(self.cmp.corr('abc', ''), 0.0)
self.assertEqual(self.cmp.corr('', 'abc'), 0.0)
self.assertEqual(self.cmp.corr('abc', 'abc'), 0.994897959183674)
self.assertEqual(self.cmp.corr('abcd', 'efgh'), -0.006377551020408)
self.assertAlmostEqual(self.cmp.corr('abc', 'abc'), 0.994897959183674)
self.assertAlmostEqual(self.cmp.corr('abcd', 'efgh'), -0.006377551020408)

self.assertAlmostEqual(self.cmp.corr('Nigel', 'Niall'), 0.4923469388)
self.assertAlmostEqual(self.cmp.corr('Niall', 'Nigel'), 0.4923469388)
Expand Down
12 changes: 7 additions & 5 deletions tests/tokenizer/test_tokenizer_q_grams.py
Original file line number Diff line number Diff line change
Expand Up @@ -336,9 +336,8 @@ def test_qgrams_counts(self):
}
),
)
self.assertEqual(
QGrams(scaler=log1p).tokenize('ACAACACCTAG').get_counter(),
Counter(

gold_standard = Counter(
{
'$A': 0.6931471805599453,
'AC': 1.3862943611198906,
Expand All @@ -350,8 +349,11 @@ def test_qgrams_counts(self):
'AG': 0.6931471805599453,
'G#': 0.6931471805599453,
}
),
)
)
test_counter = QGrams(scaler=log1p).tokenize('ACAACACCTAG').get_counter()
for key in test_counter:
self.assertAlmostEqual(test_counter[key], gold_standard[key])

self.assertEqual(
QGrams(scaler=log1p).tokenize('ACAACACCTAG').count_unique(), 9
)
Expand Down

0 comments on commit 853d0f1

Please sign in to comment.