## 问题
你想在不关闭一个已打开的文件前提下增加或改变它的Unicode编码。
## 解决方案
如果你想给一个以二进制模式打开的文件添加Unicode编码/解码方式， 可以使用 **io.TextIOWrapper()** 对象包装它。比如：

In [1]:
import urllib.request
import os

In [2]:
u = urllib.request.urlopen('http://www.python.org')

In [3]:
import io

In [4]:
f = io.TextIOWrapper(u,encoding='utf-8')

In [5]:
text = f.read()

In [6]:
print(text)

<!doctype html>
<!--[if lt IE 7]>   <html class="no-js ie6 lt-ie7 lt-ie8 lt-ie9">   <![endif]-->
<!--[if IE 7]>      <html class="no-js ie7 lt-ie8 lt-ie9">          <![endif]-->
<!--[if IE 8]>      <html class="no-js ie8 lt-ie9">                 <![endif]-->
<!--[if gt IE 8]><!--><html class="no-js" lang="en" dir="ltr">  <!--<![endif]-->

<head>
    <meta charset="utf-8">
    <meta http-equiv="X-UA-Compatible" content="IE=edge">

    <link rel="prefetch" href="//ajax.googleapis.com/ajax/libs/jquery/1.8.2/jquery.min.js">

    <meta name="application-name" content="Python.org">
    <meta name="msapplication-tooltip" content="The official home of the Python Programming Language">
    <meta name="apple-mobile-web-app-title" content="Python.org">
    <meta name="apple-mobile-web-app-capable" content="yes">
    <meta name="apple-mobile-web-app-status-bar-style" content="black">

    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <meta name="HandheldFriendly" conte

如果你想修改一个已经打开的文本模式的文件的编码方式，可以先使用 **detach()** 方法移除掉已存在的文本编码层， 并使用新的编码方式代替。下面是一个在 sys.stdout 上修改编码方式的例子
```python
>>> import sys
>>> sys.stdout.encoding
'UTF-8'
>>> sys.stdout = io.TextIOWrapper(sys.stdout.detach(), encoding='latin-1')
>>> sys.stdout.encoding
'latin-1'
>>>
```

## 讨论
I/O系统由一系列的层次构建而成。你可以试着运行下面这个操作一个文本文件的例子来查看这种层次：

In [10]:
f = open('sample.txt','w')

In [11]:
f

<_io.TextIOWrapper name='sample.txt' mode='w' encoding='cp936'>

In [12]:
f.buffer

<_io.BufferedWriter name='sample.txt'>

In [13]:
f.buffer.raw

<_io.FileIO name='sample.txt' mode='wb' closefd=True>

在这个例子中，io.TextIOWrapper 是一个**编码和解码Unicode的文本处理层**， io.BufferedWriter 是一个**处理二进制数据的带缓冲**的I/O层， io.FileIO 是一个表示**操作系统底层文件描述符**的原始文件。 增加或改变文本编码会涉及增加或改变最上面的 io.TextIOWrapper 层。

一般来讲，像上面例子这样通过访问属性值来直接操作不同的层是很不安全的。 例如，如果你试着使用下面这样的技术改变编码看看会发生什么：
```python
>>> f
<_io.TextIOWrapper name='sample.txt' mode='w' encoding='UTF-8'>
>>> f = io.TextIOWrapper(f.buffer, encoding='latin-1')
>>> f
<_io.TextIOWrapper name='sample.txt' encoding='latin-1'>
>>> f.write('Hello')
Traceback (most recent call last):
    File "<stdin>", line 1, in <module>
ValueError: I/O operation on closed file.
>>>
```

结果出错了，因为f的原始值已经被破坏了并关闭了底层的文件。

detach() 方法会**断开文件的最顶层并返回第二层**，之后最顶层就没什么用了。例如：

In [19]:
f = open('sample.txt','w')

In [20]:
f

<_io.TextIOWrapper name='sample.txt' mode='w' encoding='cp936'>

In [21]:
b = f.detach()

In [22]:
b

<_io.BufferedWriter name='sample.txt'>

In [23]:
f.write('hello')

ValueError: underlying buffer has been detached

一旦断开最顶层后，你就可以给返回结果添加一个新的最顶层。比如：

In [25]:
f = io.TextIOWrapper(b,encoding='latin-1')

f

尽管已经向你演示了**改变编码**的方法， 但是你还可以利用这种技术来改变文件行处理、错误机制以及文件处理的其他方面。例如：
```python
>>> sys.stdout = io.TextIOWrapper(sys.stdout.detach(), encoding='ascii',
...                             errors='xmlcharrefreplace')
>>> print('Jalape\u00f1o')
Jalape&#241;o
>>>
```

注意下最后输出中的非ASCII字符 ñ 是如何被 (&#24 1;) 取代的。