In [1]:
# python用的是缩进，不是大括号控制代码块。
less = []
greater = []

for x in [1, 2, 3, 4, 5, 6]:
    if x < 4:
        less.append(x)
    else:
        greater.append(x)

print(less, greater)

([1, 2, 3], [4, 5, 6])


In [2]:
# python万物皆对象
    # 1.python解释器中的任何数值，字符串，数据结构，函数，类，某块等。
    # 2.每个对象都有一个相关类型以及内部数据。
    
# 函数调用。
result = f(x, y, z)
g()

# 几乎所有的python对象都有一些附属属性函数。
obj.some_method(x, y, z)

# 函数既可以接受位置参数，也可以接受关键字参数。
result = f(a, b, c, d=5, e='foo')

NameError: name 'f' is not defined

In [3]:
# python对变量副值时，其实是对右侧对象的一个引用，就是指针。
a = [1, 2, 3]
b = a
a.append(4)
print(b)

# 当你将对象以参数的形式传入函数的时候，其实只是传入了一个引用而已。
def append_element(alist, element):
    alist.append(element)
    
data = [2, 3]
append_element(data, 5)
print(data)

[1, 2, 3, 4]
[2, 3, 5]


In [8]:
# 动态引用，强类型。
    # 1.python中的对象引用没有与之关联类型的信息。
    # 2.变量只是对象在特定命名空间的名称，对象的类型信息是保存在自己内部的。
a = 5
t1 = type(a)

a = 'foo'
type(a)
t2 = type(a)

print(t1, t2)

(<type 'int'>, <type 'str'>)


In [9]:
# 然而python是强类型语言，不可以类型间混用，隐式转换只在很明显的情况下才进行。
a = '5' + 5
b = 5 + 0.5

# isinstance可以接受由类型组成的元组，来判断对象是否是某一类。
isinstance(a, (int, float))
isinstance(b, float)

TypeError: cannot concatenate 'str' and 'int' objects

In [15]:
# python对象通常既有属性，又有方法，可以类似于obj.attribute_name这样的语法访问。
a = 'foo'
a.<Tab>

SyntaxError: invalid syntax (<ipython-input-15-e8de417dfe0a>, line 3)

In [16]:
# 属性和方法还可以利用getattr函数通过名称进行访问。
getattr(a, 'split')

<function split>

In [18]:
# 如果你不关心对象的类型，而只想确认它到底有没有某些方法或行为。
    # 比如确认是否可以迭代，可以尝试使用iter函数。
def isiterable(obj):
    try:
        iter(obj)
        return True
    except TypeError: # 不可迭代
        return False

# 判断对象是不是列表，如不是则转换成列表。
if not isinstance(x, list) and isiterable(x):
    x = list(x)
    
isiterable('a string') 

True

In [20]:
# 可以用import来引用其他文件中的元素，或者API。
import numpy as np
import tensorflow as tf

In [4]:
# 要判断两个引用是否是指向同一个对象，可以用is关键字，反之用is not。
a = [1, 2, 3]
b = a
c = list(a)

print(a is b)
print(a is not c)

# is和is not常常用于判断是否为None，因为None实例只有一个。
a = None
print(a is True)

True
True
False


In [None]:
# python是一种非延迟（非懒惰）的，严格语言。
    # 1.严格意思是：python的相关计算是在被赋值的时候，就被执行的（急性子）。
    # 2.相应的，有的语言是在被使用之前，不会被计算的懒惰。
    # 3.但是python仍然是支持函数式编程的，比如迭代器和生成器也是延迟计算的。

In [6]:
# 大部分的python对象是可变的，如列表，字典，NumPy数组和大部分自定义类。所包含的对象或值是可以被修改的。
list = ['foo', 2, [2, 4]]
list[2] = (3, 4)
print(list)

# 字符串和元组等是不可变对象。
tuple = (3, 5, (4, 5))
tuple[1] = 'four'

# 即使大部分对象可变，也不推荐这么做。

['foo', 2, (3, 4)]


TypeError: 'tuple' object does not support item assignment

In [10]:
# 数值类型：python主要用的是int和float，python会将非常大的整数转换成long，所以可以存任意大小的整数。
ival = 747389
print(type(ival))
ival6 = ival ** 6
print(type(ival6))

# 显式的将坟墓转换成浮点数。
a = 3 / float(2)
print(a)

# 除不尽则丢掉小数部分的除法。
b = 3 // 2
print(b)

<type 'int'>
<type 'long'>
1.5
1


In [13]:
# 可用‘’号，和“”号，作用相同。
a = 'abcd'
b = 'this is a abcd'
print(a, b)

# 有换行符的多行字符串，可用三重'''abcd'''。
c = '''
This is a longer
    longer 
        longger
            string that sth.
'''
print(c)

# 字符串是不可变的，要修改就只能创建一个新的。
a[2] = 'e'

('abcd', 'this is a abcd')

This is a longer
    longer 
        longger
            string that sth.



TypeError: 'str' object does not support item assignment

In [15]:
# 在字符串前加上r可以不用指定，原样解释
s = r'this\is\a\book'
print(s)

# string,bool,int,float之间的转换
s = '3.12159'
s_float = float(s)
print(s_float)

this\is\a\book
3.12159


In [18]:
# 日期和时间，datetime，date，time
from datetime import datetime, date, time

dt = datetime(2011, 10, 29, 20, 30, 21)
dt.day
dt.minute

30

In [20]:
# 控制流if,elif,else 程序员的话，应该不用多说吧。
x = 10
if x < 0:
    print('x < 0')
elif x == 0:
    print('x == 0')
elif 0 < x < 10:
    print('0 < x < 10')
else:
    print('x >= 10')

x >= 10


In [None]:
# for循环
for value in collection:
    continue # 跳过剩余部分
    break # 让for循环完全退出
    
# while循环
while x > 0:
    # 只要x大于0一直做某事

# pass，不做任何事，但是在python这个以格式来占位的语言，pass可以先占位
if x < 0:
    print('x < 0')
elif x == 0:
    # TODO
    pass
else:
    print('x > 0')

In [23]:
# 错误处理，如果我们想优雅的处理错误而不是程序崩溃可以用到：异常处理
    # ValueError
    # TypeError之类的

def attempt_float(x):
    try:  # 成功时
        return float(x)
    except:  # 失败时
        return x

attempt_float('abc')
attempt_float('1.234')

# 如果你只希望处理某一种类型的错误
def attempt_float(x):
    try:  # 成功时
        return float(x)
    except ValueError:  # 失败时
        return x

# 比如此时，我们希望这个bug能够产生，从而避免隐形更严重的bug
attempt_float((1, 2))

# 如果你不想处理任何异常，而为了无论成功与否都执行某一部分代码
f = open(path, 'w')
try:
    write_to_file(f)
finally:
    f.close()

# 让有些代码只在尝试成功时执行
f = open(path, 'W')
try: # 尝试某操作
    write_to_file(f)
except: # 失败的时候
    print('Failed')
else: # 成功的时候
    print('Scceeded')
finally: # 无论怎样都执行
    f.close()

TypeError: float() argument must be a string or a number

In [26]:
# range和xrange

# range函数用于产生一组间隔平均的整数
a = range(10)
print(a)

# range函数产生不包括末端值
b = range(0, 20, 2)
print(b)

# range常用语按照索引对序列迭代
seq = [1, 2, 3, 4]
for i in range(len(seq)):
    val = seq[i]
    print(val)

# range 返回的是迭代器，和xrange一样，也就是说函数式的，非严格的懒惰计算

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[0, 2, 4, 6, 8, 10, 12, 14, 16, 18]
1
2
3
4


In [None]:
# 三元表达式
value = true-expr if condition else false-expr
# 和下面的表达式是一样的
if condition:
    value = true-expr
else:
    value = false-expr

In [33]:
# 元组：一维，定长，不可变对象
tup = 4, 5, 6
print(tup)

tup = (5, 6, 7)
print(tup)

# 创建完成的元组不能更改位置上的元素，但是可以增加元组本身的长度
# 元组可以拆包使用，可以很轻松的交换变量名
a, b, c = tup
a, b = b, a

# 元组的方法，count用于产生计算有多少个此元素
tup.count(5)

(4, 5, 6)
(5, 6, 7)


1

In [41]:
# 和元组比起来，list列表是变长的，内容也是可以修改的。
a_list = [2, 3, 4, None]
tup = ('foo', 'bar', 'baz')
# b_list = list(tup)

a_list.append('dwarf')
print(a_list)

# insert的计算量要比append大，在很大的数据里不建议这么操作
a_list.insert(1, 'red')
print(a_list)

a_list.remove('dwarf')
print(a_list)

# 用+可以完成列表的结合，列表的结合十分消耗资源，它要用心得列表去接受组成列表内部元素的复制
c_list = [4, None, 'foo'] + [7, 8, (2, 3)]
print(c_list)



[2, 3, 4, None, 'dwarf']
[2, 'red', 3, 4, None, 'dwarf']
[2, 'red', 3, 4, None]
[4, None, 'foo', 7, 8, (2, 3)]


In [43]:
# 排序
a = [7,3,5,8,4,2]
a.sort()
print(a)

[2, 3, 4, 5, 7, 8]


In [48]:
# 终于到了切片了！python对列表数据的强大处理方式
    # 可以用在数组，元组，，Numpy数组等，基本形式[start：stop]
    # start索引包含在内，stop索引不包含在内，元素数=stop-start

seq = [3,2,5,8,9,0]
print(seq[1:5])

# start和stop都是可以省略的，此时他们分别默认序列的起始和结尾
print(seq[:])

# [开始：结尾：步长]
print(seq[::2])

# -1表示反向步长，是个巧妙的反序方法
print(seq[::-1])

[2, 5, 8, 9]
[3, 2, 5, 8, 9, 0]
[3, 5, 9]
[0, 9, 8, 5, 2, 3]


In [62]:
# python内置了一些很不错的序列函数

# enumerate函数可以逐个返回序列的(i, value)元组
collection = ['a', 'asdf a', 1, 2, 3, 4]
for i, value in enumerate(collection):
    print('0', i, value)
    
# enumerate还可以求取一个将序列值映射到其所在位置的字典
b_list = ['foo', 'bar', 'baz']
mapping = dict((v, i) for i, v in enumerate(b_list)) # 这里是函数式的
print('1:', mapping)

# sorted可以将任何序列返回为一个新的有序列表
seq = [3,2,5,8,9,0]
sorted(seq)
print('2:',seq)

# zip用于将多个序列（元组，列表等）元素配对，从而产生一个新的元组列表
seq1 = ['foo', 'bar', 'baz']
seq2 = ['one', 'two', 'three', 'four']
tuple1 = zip(seq1, seq2)
print('3:', tuple1)

for i, (a, b) in enumerate(zip(seq1, seq2)):
    print('4:', i, a, b)
    
# reversed用于按照逆序迭代序列中的元素
c_list = reversed(xrange(10))
print('5:', c_list)

('0', 0, 'a')
('0', 1, 'asdf a')
('0', 2, 1)
('0', 3, 2)
('0', 4, 3)
('0', 5, 4)
('1:', {'baz': 2, 'foo': 0, 'bar': 1})
('2:', [3, 2, 5, 8, 9, 0])
('3:', [('foo', 'one'), ('bar', 'two'), ('baz', 'three')])
('4:', 0, 'foo', 'one')
('4:', 1, 'bar', 'two')
('4:', 2, 'baz', 'three')
('5:', <rangeiterator object at 0x107e47bd0>)


In [73]:
# 字典：{key: value} ,key一定要可哈希的
d1 = {'a': (1, 2), 'b': [1, 2, 3]}
print(d1['b'])

# 判断字典中存在某个健
'b' in d1

# del和pop可以删除值
d1[5] = 'some value'
d1['dummy'] = 'anuther value'
del d1[5]

# keys和values用于获取键和值的列表迭代器
print('keys:', d1.keys())
print('values:', d1.values())

# 用update方法，一个字典可以被合并到另一个字典中，同时相同的key将被覆盖
d1.update({'b': 1, 'c': 3})
print('update d1:', d1)

# 从序列类型创建字典
mapping = dict(zip(range(5), reversed(range(5))))
print('mapping:', mapping)

# 字典自己可以返回默认值 value = some_dic.get(key, default_value)
value1 = d1.get('c', 100)
value2 = d1.get('d', 100)
print('value1:', value1, '; value2:', value2)

# 字典的值可以是任何python对象，但是键必须是不可变对象如：标量类型，元组，既可哈希性hash

[1, 2, 3]
('keys:', ['a', 'dummy', 'b'])
('values:', [(1, 2), 'anuther value', [1, 2, 3]])
('update d1:', {'a': (1, 2), 'dummy': 'anuther value', 'c': 3, 'b': 1})
('mapping:', {0: 4, 1: 3, 2: 2, 3: 1, 4: 0})
('value1:', 3, '; value2:', 100)


In [78]:
# 集合set是由唯一的元素组陈的无序集合

# 创建
set([2, 3, 2, 1, 4, 4])
{2, 1, 3, 4, 7}

# 并，交，差，异或
a = {1, 2, 3, 4, 5, 6}
b = {3, 4, 5, 6, 7, 8, 9}
c = {1, 2, 3}
print('|&-:', a|b, a&b, a-b)

# 判断一个集合是否是另一个的子集
c.issubset(a), c.issubset(b)



('|&-:', set([1, 2, 3, 4, 5, 6, 7, 8, 9]), set([3, 4, 5, 6]), set([1, 2]))


(True, False)

In [85]:
# 列表，集合以及字典的推导式，酷酷的东西来了
strings = ['a', 'aa', 'aab', 'ab', 'abbcdd', 'baac']

# 列表基本推导式：[expr for val in collection if condition]。仍然是函数式的吧。
a_list = [x.upper() for x in strings if len(x) > 2]
print('a_list:', a_list)

# 字典基本推导式：{key-expr: value-expr for value in collection if condition}。
a_dic = {len(value): value for value in strings if len(x) > 2}
print('a_dic:', a_dic)

# 嵌套列表推导式，更酷的来了！
data = [strings, strings]

# [word for ((words in data) for (word in words)) if word.count('a') >= 2]
result = [word for words in data for word in words if word.count('a') >= 2]

('a_list:', ['AAB', 'ABBCDD', 'BAAC'])
('a_dic:', {1: 'a', 2: 'ab', 3: 'aab', 4: 'baac', 6: 'abbcdd'})
