# 参考答案

## 问题描述：实现一个算法判断字符串是否包含唯一字符。

## 条件
* 是否可以假设字符串是 ASCⅡ？
    * 可以
    * Notes：基于你的语言，Unicode 字符串可能需要特殊处理
* 可以假定这是区分大小写的？
    * 可以
* 是否可以使用额外的数据结构？
    * 可以
* 是否可以假定内存合适？
    * 可以

## 测试用例
* None -> Flase
* '' -> True
* 'foo' -> False
* 'bar' -> True

## 算法1：集合长度与字符串长度比较
集合中的元素是唯一的。
* If 集合`set(string)`的长度与字符串长度相等
  * Return True
* Else
  * Return False
  
复杂度：
* 时间：O(n)
* 空间：O(n)

## 代码：

In [2]:
class UniqueCharsSet:
    
    def has_unique_chars(self, string):
        if string is None:
            return False
        return len(set(string)) == len(string)
    

## 算法2：Hash Map 查找
维持一个 hash map (set) 来记录遍历到的唯一字符

步骤：
* 遍历字符串
* 对每一个字符：
  * If 字符未在 hash map 中
    * 将其加入
  * Else
    * return False
    
* return True

Notes：
* 我们可以用 `dict`，但由于集合中的元素是唯一的，所以用 `set` 更加合理
* 由于字符串是 ASCⅡ 格式的，还可以使用128大小的数组（扩展 ASCⅡ 为 256）

复杂度：
* 时间：O(n)
* 空间：O(n)

## 代码：

In [1]:
class UniqueChars:
    
    def has_unique_chars(self, string):
        if string is None:
            return False
        chars_set = set()
        for char in string:
            if char in chars_set:
                return False
            chars_set.add(char)
        return True
    

## 算法3：In-Place
假设不能使用额外的数据结构，这样的话我们就失去了 hash map 提供的 O(1) 的快速查找
* 便利字符串
* 对每个字符：
  * 统计它在字符串中出现的次数
  * If 重复出现
    * return False
* return True

复杂度：
* 时间：O($n^2$)
* 空间：O(1)

## 代码：

In [3]:
class UniquecharsInPlace:
    
    def has_unique_chars(self, string):
        if string is None:
            return False
        for char in string:
            if string.count(char) > 1:
                return False
        return True
    

## 单元测试

In [4]:
%%writefile test_unique_chars.py
from nose.tools import assert_equal

class TestUniqueChars:
    
    def test_unique_chars(self, func):
        assert_equal(func(None), False)
        assert_equal(func(''), True)
        assert_equal(func('foo'), False)
        assert_equal(func('bar'), True)
        print('Success: test_unique_chars!')
        
def main():
    test = TestUniqueChars()
    unique_chars = UniqueChars()
    test.test_unique_chars(unique_chars.has_unique_chars)
    try:
        unique_chars_set = UniqueCharsSet()
        unique_chars_in_place = UniquecharsInPlace()
        test.test_unique_chars(unique_chars_set.has_unique_chars)
        test.test_unique_chars(unique_chars_in_place.has_unique_chars)
    except NameError:
        pass
    
if __name__ == '__main__':
    main()
    

Writing test_unique_chars.py


In [5]:
%run -i test_unique_chars.py

Success: test_unique_chars!
Success: test_unique_chars!
Success: test_unique_chars!


In [6]:
%%writefile?

