chinese_name_similarity

Calculating the similarity between Chinese names.

Requirements

pip install python-Levenshtein

pip install opencc-python-reimplemented

Usage

Basic

chinese_name_similarity("name1", "name2")

Example Case

字串比對方法 function 計算方式備註是否使用 Levenshtein Ratio r = (sum - ldist) / sum O Levenshtein Distance 由一個字串轉為另一字串的最少操作次數，包含插入、刪除、替換 O Levenshtein Hamming 兩個等長字串之間對應位置上不同字符的個數兩字串需相等 X Levenshtein jaro_winkler 起始部分就相同的字串給更高的分數 X Levenshtein Jaro 原用途為人口普查姓名比對 O FuzzyWuzzy partial_ratio 若一字串全部包含在另一字串中，則=100 X FuzzyWuzzy token_sort_ratio 與Levenshtein Ratio類似忽略單辭順序對標點符號敏感 O FuzzyWuzzy token_set_ratio 忽略重複的單詞 X

Name		Name	Last commit message	Last commit date
Latest commit History 35 Commits
chinese_name_similarity		chinese_name_similarity
LICENSE.txt		LICENSE.txt
README.md		README.md
README2.md		README2.md
setup.cfg		setup.cfg
setup.py		setup.py
testcase.JPG		testcase.JPG

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

chinese_name_similarity

chinese_name_similarity

LICENSE.txt

LICENSE.txt

README.md

README.md

README2.md

README2.md

setup.cfg

setup.cfg

setup.py

setup.py

testcase.JPG

testcase.JPG

Repository files navigation

chinese_name_similarity

Requirements

Usage

Basic

Example Case

About

Releases 1

Packages

Languages

License

jasminehung/chinese_name_similarity

Folders and files

Latest commit

History

Repository files navigation

chinese_name_similarity

Requirements

Usage

Basic

Example Case

About

Resources

License

Stars

Watchers

Forks

Languages