<center><font size=5>第17章 二进制I/O</font></center>

二进制I/O不涉及编码和节码，因此比文本I/O更加高效

计算机并不区分二进制文件和文本文件，所有的文件都是以二进制形式来存储的，因此，从本质上说所有的文件都是二进制文件

文本I/O建立在二进制I/O的基础上，它能提供一层抽象，用于字符层次的编码和解码

![text_binary_io.png](attachment:text_binary_io.png)

<font color='dd0000'>使用二进制I/O向文件写入一个数值，就是将内存中的那个值复制到文件中

二进制文件与主机的编码方案无关，因此，它是可移植的。任何机器上的Java程序都可以读取Java程序创建的二进制文件。

<center><font size=4>17.4 二进制I/O类</font></center>

<font color='dd0000'>抽象类</font>```InputStream```是读取二进制数据的根类，<font color='dd0000'>抽象类</font>```OutputStream```是写入二进制数据的根类

![input_output_stream_heritage.jpg](attachment:input_output_stream_heritage.jpg)

**InputStream类的方法**

![InputStream.png](attachment:InputStream.png)

**OutputStream类的方法**

![OutputStream.png](attachment:OutputStream.png)

二进制I/O类中的所有方法都声明为抛出```java.io.IOException```或其子类

<font size=3>17.4.1 FileInputStream 和 FileOutputStream

```FileInputStream```和```FileOutputStream```用于从/向文件读取/写入**字节**

构造方法：

![FileInputStream.png](attachment:FileInputStream.png)

![FileOutputStream.png](attachment:FileOutputStream.png)

构造```FileOutputStream```对象时，如果文件不存在，则会创建一个新文件；如果文件已经存在，则会删除文件的当前内容。通过设置```append```参数为```true```，可以保留文件内容在后面追加新数据。

其他所有方法都从```InputStream```和```OutputStream```继承

几乎所有的I/O类中的方法都会抛出异常```java.io.IOException```，因此必须在方法中声明会抛出，或者将代码放在```try-catch```中

In [1]:
public static void main(String args[]) throws IOException{

}

In [6]:
public static void main(String args[]){
    try{
    
    }
    catch(IOException ex){
    
    }
}

In [8]:
// 将1~10的10个字节写入名为temp.dat的文件中

try(FileOutputStream output = new FileOutputStream("temp.dat");){    // try-with-resources声明创建资源对象，可以自动关闭
    for(int i = 1; i <= 10; i++){
        output.write(i);
    }
}

In [9]:
// 读取temp.dat

try(FileInputStream input = new FileInputStream("temp.dat");){
    int value;
    while((value = input.read()) != -1)
        System.out.print(value + " ");
}

1 2 3 4 5 6 7 8 9 10 

<font color='dd0000'>任何实现了```AutoClosable```接口的对象可以用于```try-with-resources```语法中实现自动关闭</font>

```FileInputStream```类的实例可以作为参数去构造一个```Scanner```对象，```FileOutputStream```类的实例可以作为参数构造一个```PrintWriter```对象

可以创建一个```PrintWriter```对象来向文件中追加文本

In [15]:
// 如果temp.txt不存在，将会创建这个文件；如果已经存在，将新数据追加到文件中

new PrintWriter(new FileOutputStream("temp.txt", true));

java.io.PrintWriter@2438aca7

<font size=3>17.4.2 FilterInputStream 和 FilterOutputStream

**过滤器数据流(filter stream)**是为某种目的过滤字节的数据流

基本字节输入流提供的读取方法```read```只能用来读取字节，如果要读取整数值、双精度值或字符串，那就需要一个过滤器类来**包装字节输入流**

```FilterInputStream```和```FilterOutputStream```是过滤数据的基类

<font size=3>17.4.3 DataInputStream 和 DataOutputStream

```DataInputStream```从数据流读取字节，并且将它们转换为合适的基本类型值或字符串

```DataOutputStream```将基本类型的值或字符串转换为字节，并且将字节输出到字节流

![DataInputStream.png](attachment:DataInputStream.png)

![DataOutputStream.png](attachment:DataOutputStream.png)

⭐```writeUTF(String s)```：<font color='dd0000'>先用**2**个字节写入字符串的长度，再接上字符串的UTF-8编码

构造方法：<font color='dd0000'>参数类型为 InputStream 和 OutputStream</font>

In [11]:
DataInputStream input = new DataInputStream(new FileInputStream("temp.dat"));
DataOutputStream output = new DataOutputStream(new FileOutputStream("temp.dat"));

<font color='dd0000'>可以将```DataInputStream```/```FileInputStream```和```DataOutputStream```/```FileOutputStream```看作工作在一个管道中：

![pipe.png](attachment:pipe.png)

<font size=3>17.4.4 BufferedInputStream 和 BufferedOutputStream

```BufferedInputStream```类和```BufferedOutputStream```类可以通过减少磁盘读写次数来提高输入和输出的速度

![Buffered.png](attachment:Buffered.png)

```BufferedInputStream```类和```BufferedOutputStream```类在后台管理了一个缓冲区，根据要求自动从磁盘读取数据和写入数据

![BufferedInput.png](attachment:BufferedInput.png)

![BufferedOutput.png](attachment:BufferedOutput.png)

如果没有指定缓冲区大小，默认大小是<font color='dd0000'>512字节</font>

总是应该使用缓冲区I/O来加速输入和输出：

In [12]:
DataOutputStream output = new DataOutputStream(new BufferedOutputStream(new FileOutputStream("temp.dat")));

In [13]:
DataInputStream input = new DataInputStream(new BufferedInputStream(new FileInputStream("temp.dat")));

<center><font size=4>17.6 对象I/O</font></center>

```ObjectInputStream```类和```ObjectOutputStream```类可以用于读写<font color='dd0000'>**可序列化的对象**</font>

```ObjectInputStream```类和```ObjectOutputStream```类除了可以实现<font color='dd0000'>基本数据类型</font>与<font color='dd0000'>字符串</font>的输入和输出之外，还可以实现<font color='dd0000'>对象</font>的输入和输出

即，包含了```DataInputStream```和```DataOutputStream```的全部功能

![ObjectInputOutput.png](attachment:ObjectInputOutput.png)

In [2]:
// 写入文件

try(ObjectOutputStream output = new ObjectOutputStream(new FileOutputStream("object.dat"))){
    output.writeUTF("John");
    output.writeDouble(85.4);
    output.writeObject(new java.util.Date());
}

In [20]:
// 用Buffered提高性能

ObjectOutputStream output = new ObjectOutputStream(new BufferedOutputStream((new FileOutputStream("object.dat"))));

In [26]:
// 读取文件

try(ObjectInputStream input = new ObjectInputStream(new FileInputStream("object.dat"))){
    // 保证读取时类型与写入时一致
    String name = input.readUTF();
    double score = input.readDouble();
    // 必须使用Java安全的类型转换，读进来的类型默认为Object
    java.util.Date date = (java.util.Date)(input.readObject());
    System.out.println(name + " " + score + " " + date);
}

John 85.4 Mon Aug 05 21:44:11 CST 2019


```readObject()```方法可能会抛出异常```java.lang.ClassNotFoundException```，这是因为Java虚拟机恢复一个对象时，如果没有加载该对象所在的类，应该先加载这个类

<center><font size=3>17.6.1 Serializable接口

并不是每一个对象都可以写入到输出流。可以写入输出流的对象称为<font colot='dd0000'>可序列化的(serializable)</font>

可序列化的对象都是java.io.Serializable接口的实例，所以可序列化对象的类必须实现Serializable接口

Serializable接口是一种**标记接口**，因为它没有方法，所以不需要在类中为实现Serializable接口增加额外代码

实现这个接口可以启动Java的序列化机制，自动完成存储对象和数组的过程

⭐[<font color='dd00dd'>**序列化机制**</font>](https://juejin.im/post/5b56f7b75188256256697281)

⭐[<font color='dd00dd'>**对象序列化 & 反序列化实例**</font>](https://blog.csdn.net/qq_27093465/article/details/78544505)

当存储一个可序列化对象时，会对该对象的类进行编码

编码包括<font color='dd0000'>类名 类的签名 对象实例变量的值</font>以及<font color='dd0000'>该对象引用的任何其他对象的闭包</font>，但是不存储<font color='dd0000'>对象静态变量的值</font>

如果一个对象是Serializable的实例，但是它包含了非序列化的实例数据域，那么该对象不可以序列化

为了使该对象可序列化，需要给这些数据域加上关键字<font color='dd0000'>**transient**</font>，告诉Java虚拟机将对象写入对象流时忽略这些数据域

In [3]:
class A{

}

public class C implements java.io.Serializable{
    private int v1;
    private static double v2;
    private transient A v3 = new A();
}

当C类的一个对象进行实例化时，只需序列化变量```v1```，因为```v2```是一个静态变量，```v3```被标记为```transient```。

如果```v3```没有标记，将会发生异常```java.io.NotSerializableException```，因为类A没有实现Serializable接口

<font color='dd0000'>如果一个对象不止一次写入对象流，并不会存储对象的多个副本</font>

第一次写入一个对象时，就会为它创建一个<font color='dd0000'>序列号</font>，Java虚拟机将对象的所有内容和序列号一起写入对象流

以后每次存储时，如果再写入相同的对象，就只存储序列号，读出这些对象时，它们的引用相同。

In [5]:
// 如果数组中的所有元素都是可序列化的，这个数组就是可序列化的

int[] numbers = {1, 2, 3, 4, 5};
String[] strings = {"John", "Susan", "Kim"};

try(ObjectOutputStream output = new ObjectOutputStream(new FileOutputStream("array.dat", true))){
    output.writeObject(numbers);
    output.writeObject(strings);
}

try(ObjectInputStream input = new ObjectInputStream(new FileInputStream("array.dat"))){
    int[] newNumbers = (int []) (input.readObject());
    String[] newStrings = (String[]) (input.readObject());
    
    for(int i = 0; i < newNumbers.length; i++){
    System.out.print(newNumbers[i] + " ");
}
System.out.println();
for(int i = 0; i < newStrings.length; i++){
    System.out.print(newStrings[i] + " ");
}
}

1 2 3 4 5 
John Susan Kim 

<center><font size=4>17.7 随机访问文件</font></center>

Java提供了```RandomAccessFile```类，允许从文件的任何位置进行数据的读写

到现在为止，使用的所有流都是**只读**的或**只写**的，这些流称为**顺序流**，使用顺序流打开的文件称为**顺序访问文件**

顺序访问文件的内容不能更新，然而经常需要修改文件

Java提供了```RandomAccessFile```类，允许在文件的任意位置上进行读写，使用```RandomAccessFile```类打开的文件称为**随机访问文件**

![RandomAccessFile.png](attachment:RandomAccessFile.png)

当创建一个```RandomAccessFile```对象时，可以指定两种模式(```r```或```rw```)之一。```r```表示这个数据流是只读的，```rw```表示既允许读也允许写。

In [6]:
// 创建一个数据流raf，允许程序对文件test.dat进行读取和写入

RandomAccessFile raf = new RandomAccessFile("test.dat", "rw");

随机访问文件是由字节序列组成的。一个称为**文件指针**的特殊标记定位在这些字节中的某个字节的位置，文件的读写操作就是在文件指针所指的位置上进行的

打开文件时，指针置于文件的起始位置，在文件中进行读写数据后，指针向前移动到下一个数据项

![pointer.png](attachment:pointer.png)