## leetcode 461 Hamming Distance

The Hamming distance between two integers is the number of positions at which the corresponding bits are different.
Given two integers x and y, calculate the Hamming distance.
Note:
0 ≤ x, y < 231.
Example:
Input: x = 1, y = 4

Output: 2

Explanation:
1   (0 0 0 1)
4   (0 1 0 0)
       ↑   ↑

The above arrows point to positions where the corresponding bits are different.

**难度**：简单， **通过率**：69%

## 读题

计算输入的两个整形数的**汉明距离**，即他们的二进制数表示中对应位不同的个数。
>**汉明距离** 是以理查德·衛斯里·漢明的名字命名的，汉明在误差检测与校正码的基础性论文中首次引入这个概念。在通信中累计定长二进制字中发生翻转的错误数据位，所以它也被称为信号距离。汉明距离要求两个相比较的“串”是等长的，

本题的输入是两个整形数，他们在同一个机器上的二进制形式一定是等长

## 解题

本题解决方法可以说是直接了当，根据异或的性质，相同为0， 不同为1，所以按位分别取出两个数字对应位上的数并异或，计算结果中1的个数就是汉明距离了。
Python3中我们只需要一行代码即可实现

In [26]:
class Solution1:
    def hammingDistance(self, x, y):
        """
        :type x: int
        :type y: int
        :rtype: int
        """
        # bin(x ^ y) 将两个数异或并转换成二进制格式
        # count('1') 计算二进制格式中1的个数
        return bin(x ^ y).count('1')

固然string的count()函数非常方便，但是从执行效率来看，简洁的代码并不意味着是最优解，利用**汉明重量**的概念，能够实现比count()有更优效率的解
>**汉明重量** 是字符串相对于同样长度的零字符串的汉明距离，也就是说，它是字符串中非零的元素个数：对于二进制字符串来说，就是1的个数，所以11101的汉明重量是4）

如何计算二进制数中1的个数？最简单的方法是位移和计数:

In [13]:
def countInBin(x):
    """
    :type x: int
    """
    res = 0
    while x:
        res += x & 1
        x >>= 1
        
    return res

但还有一种更快速的方法
不断利用**x&(x-1)**清除x的二进制表示中最右边1，同时累加计数，直至x为0

In [20]:
#例如
#x         0 1 1 0
#x - 1     0 1 0 0
#x&(x-1)   0 1 0 0

我们利用这种思想实现Solution2

In [25]:
class Solution2(object):
    def hammingDistance(self, x, y):
        """
        :type x: int
        :type y: int
        :rtype: int
        """
        x = x ^ y
        y = 0
        while x:
            y += 1
            x = x & (x - 1)
        return y

## 性能分析

**Solution1**使用string的系统函数count()对单个字符计数，通过native实现能够达到线性时间，但**Solution2**比线性时间更优，他只依赖于x二进制表示中1的个数，而不是其总长度

测量Solution1执行效率：

In [28]:
s1 = Solution1()
%timeit s1.hammingDistance(19873948, 29836574)

715 ns ± 7 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


然后使用Solution2来测量执行时间

In [29]:
s2 = Solution2()
%timeit s2.hammingDistance(19873948, 29836574)

1.75 µs ± 78.2 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


结果证明，**Solution2** 显著优于 **Solution1**

## Python3语法温习

**进制转换为字符串**

In [8]:
# convert integer number to binary string
print(bin(9))
# convert integer number to oct string
print(oct(9))
# convert integer number to hex string
print(hex(10))

0b1001
0o11
0xa


在对转换后的字符串做任何操作时，不要忘记它们有0b, 0o或者0xa前缀。

倘若传入这些转换函数的参数是自定义对象，需要为对象实现__index__函数并且返回整数

In [12]:
# pass self-defined object to bin()
class A(object):
    def __index__(self):
        return 9

t = A()
print(bin(t))
print(oct(t))
print(hex(t))

0b1001
0o11
0x9


In [21]:
# convert numbers to strings
str(12)       # '12'

'12'

**字符串count()函数**

In [22]:
str = "this is string example for python3"
str2 = "aaaaaaaa"
sub = 'i'
print ("str.count('t') : ", str.count(sub))
sub = 'exam'
print ("str.count('exam', 10, 40) : ", str.count(sub,10,40))
#切记count计算时不会有重叠区域!
sub = 'aa'
print ("str3.count('aa') : ", str2.count(sub))

str.count('t') :  3
str.count('exam', 10, 40) :  1
str3.count('aa') :  4
