##### 问题
你想将几个小的字符串合并为大的字符串

##### 解决方案
如果你想要合并的字符串是在一个序列或者iterable中，那么最快的方式就是使用join()方法。比如：

In [2]:
parts = ['Is', 'Chicago', 'Not', 'Chicago?']
' '.join(parts)

'Is Chicago Not Chicago?'

In [3]:
','.join(parts)

'Is,Chicago,Not,Chicago?'

join()被指定为字符串的一个方法。这样做的部分原因是想连接的对象可能来自不同的数据序列（列表，字典等），如果在所有对象上都定义一个join()方法明显是冗余的。  
如果仅仅只是合并少数几个字符串，使用加号通常已经足够了：

In [4]:
a = 'Is Chaicago'
b = 'Not Chicago'
a + ' ' + b

'Is Chaicago Not Chicago'

如果你想在源码中将两个字面字符串合并起来，你字需要简单的将它们放到一起，不需要用加号。

In [5]:
a = 'Hello' 'World'
a

'HelloWorld'

##### 讨论
字符串合并可能看上去不需要一整节来讨论。但是不应该小看这个问题，程序员通常在字符串格式化的时候因为选择不当而给应用程序带来严重性能损失。  
最重要的需要注意的是，当我们使用加号（+）操作符去连接大量的字符串时是非常低效率的，因为加号连接会引起内存复制以及垃圾回收操作。特别的，你永远不要像下面这样写字符串连接代码：

In [None]:
s = ''
for p in parts:
    s += p

这种写法会比使用join()方法运行要慢一些，因为每一次执行`+=`操作的时候会创建一个新的字符串对象。你最好先收集所有的字符串片段再将它们连接起来。  
一个相对比较聪明的技巧是利用生成器表达式转换数据为字符串的同时合并字符串，比如：

In [7]:
data = ['ACME', 50, 91.1]
','.join(str(d) for d in data)

'ACME,50,91.1'

同样还得注意不必要的字符串连接操作。有时候程序员在没有必要做连接操作的时候仍然多次一举。比如在打印的时候：

In [None]:
print(a + ':' + b + ':' + c) # Ugly
print(':'.join([a, b, c])) # still ugly
print(a, b, c, sep=':') # Better

当混合使用I/O操作和字符串连接操作的时候，有时候需要仔细研究你的程序。比如，考虑下面的两段代码片段：

f.write(chunk1 + chunk2)

f.write(chunk1)
f.write(chunk2)

如果两个字符串很小，那么第一个版本性能会更好些，因为I/O系统调用天生就慢。另外，如果两个字符串很大，那么第二版本可能更加高效。因为它避免了创建一个很大的临时结果并且要复制大量的内存块数据。  
最后，如果你准备编写构建大量小字符串的输出代码，最好考虑下使用生成器函数，利用yield语句产生输出片段。比如：

In [1]:
def sample():
    yield 'Is'
    yield 'Chicago'
    yield 'Not'
    yield 'Chicago?'

这种方法一个有趣的方面是它并没有对输出片段到底要怎样组织作出假设。例如，你可以简单的使用join()方法将这些片段合并起来：

In [2]:
''.join(sample())

'IsChicagoNotChicago?'

或者你也可以将字符串片段重定向到I/O：

In [None]:
for part in sample():
    f.write(part)

再或者还可以写一些结合I/O操作的混合方案：

In [None]:
def combine(source, maxsize):
    parts = []
    size = 0
    for part in source:
        parts.append(part)
        size += len(part)
        if size > maxsize:
            yield ''.join(parts)
            parts = []
            size = 0
        yield ''.join(parse)
        
# 结合文件操作
with open('filename', 'w') as f:
    for part in combine(sample(), 32768):
        f.write(part)

这里的关键点在于原始的生成器含糊并不需要知道使用细节，它只负责生成字符串片段就行了。