# Java IO

## 1. 流的概念和作用
> 流：代表任何有能力产出数据的数据源对象或者是有能力接受数据的接收端对象    
> 流的本质:数据传输，根据数据传输特性将流抽象为各种类，方便更直观的进行数据操作。 
> 流的作用：为数据源和目的地建立一个输送通道。


Java中将输入输出抽象称为流，就好像水管，将两个容器连接起来。流是一组有顺序的，有起点和终点的字节集合，是对数据传输的总称或抽象。即数据在两设备间的传输称为流.

流(stream)的概念源于UNIX中管道(pipe)的概念。在UNIX中，管道是一条不间断的字节流，用来实现程序或进程间的通信，或读写外围设备、外部文件等。    
一个流，必有源端和目的端，它们可以是计算机内存的某些区域，也可以是磁盘文件，甚至可以是Internet上的某个URL。

## 2. Java IO所采用的模型  
Java的IO模型设计非常优秀，它使用Decorator(装饰者)模式，按功能划分Stream，您可以动态装配这些Stream，以便获得您需要的功能。    
例如，您需要一个具有缓冲的文件输入流，则应当组合使用FileInputStream和BufferedInputStream。 
       
在整个Java.io包中最重要的就是5个类和一个接口。  
- 5个类指的是File、OutputStream、InputStream、Writer、Reader；  
- 一个接口指的是Serializable    

掌握了这些IO的核心操作那么对于Java中的IO体系也就有了一个初步的认识了

#### 流的两个分类，一个桥接

## 流的分类
### 1. 按输入、输出分
根据流的方向，流可分：
- 输入流(InputStream, Reader)
- 输出流(OutputStream, Writer)

用户可以从输入流中读取信息，但不能写它。相反，对输出流，只能往输入流写，而不能读它。    
流的源端和目的端可简单地看成是字节的生产者和消费者，对输入流，可不必关心它的源端是什么，只要简单地从流中读数据，而对输出流，也可不知道它的目的端，只是简单地往流中写数据。

### 2. 按操作数据分
按操作数据分为：
- 字节流（InputStream、OutputStream）: 数据流中最小的数据单元是字节, 可以看作未经加工的原始二进制数据。
- 字符流（Reader、Writer）:数据流中最小的数据单元是字符，经一定编码处理后符合某种格式规定的特定数据，Java内部的字符是Unicode编码，在输入、输出时需要做编码转换。

### 一个桥接
是字节流通向字符流的桥梁：它使用指定的 charset 读取/写入字节并将其解码为字符。把字节流桥接未字符流。一般在网络通信或文件读写中，得到的是字节流，用桥接把字节流转换为字符流。
- InputStreamReader
- OutputStreamWriter

![javaio](io_img/java_io.png)

# 3. 输入字节流InputStream

![input_stream](io_img/input_stream.png)

IO 中输入字节流的继承图可见上图，可以看出：
1. InputStream是所有的输入字节流的父类，它是一个抽象类。
2. ByteArrayInputStream、StringBufferInputStream(上图的StreamBufferInputStream)、FileInputStream是三种基本的介质流，它们分别从Byte数组、StringBuffer、和本地文件中读取数据。
3. PipedInputStream是从与其它线程共用的管道中读取数据.
4. ObjectInputStream和所有FilterInputStream的子类都是装饰流（装饰器模式的主角）。

InputStream中的三个基本的读方法    
```abstract int read()``` ：读取一个字节数据，并返回读到的数据，如果返回-1，表示读到了输入流的末尾。    
```intread(byte[]?b)``` ：将数据读入一个字节数组，同时返回实际读取的字节数。如果返回-1，表示读到了输入流的末尾。    
```intread(byte[]?b, int?off, int?len)``` ：将数据读入一个字节数组，同时返回实际读取的字节数。如果返回-1，表示读到了输入流的末尾。off指定在数组b中存放数据的起始偏移位置；len指定读取的最大字节数。    

# 4. 输出字节流

![output_stream](io_img/output_stream.png)
IO 中输出字节流的继承图可见上图，可以看出：
1. OutputStream是所有的输出字节流的父类，它是一个抽象类。
2. ByteArrayOutputStream、FileOutputStream是两种基本的介质流，它们分别向Byte数组、和本地文件中写入数据。PipedOutputStream是向与其它线程共用的管道中写入数据。
3. ObjectOutputStream和所有FilterOutputStream的子类都是装饰流。

outputStream中的三个基本的写方法 \
```abstract void write(int?b)```：往输出流中写入一个字节。    
```void write(byte[]?b)``` ：往输出流中写入数组b中的所有字节。    
```void write(byte[]?b, int?off, int?len)``` ：往输出流中写入数组b中从偏移量off开始的len个字节的数据。    
其它方法  
```void flush()``` ：刷新输出流，强制缓冲区中的输出字节被写出。  
```void close()``` ：关闭输出流，释放和这个流相关的系统资源。  


In [8]:
// 例1：生成10个随机数，写入流中
public ByteArrayOutputStream generage10Random() throws IOException {
    ByteArrayOutputStream bos = new ByteArrayOutputStream();
    ObjectOutputStream oos = new ObjectOutputStream(bos);
    for (int i=0; i<10; i++) {
        int r = (int)(Math.random() * 100);
        oos.writeInt(r);
    }
    oos.flush();
    oos.close();
    return bos;
}
public void printBytes(byte[] data) {
    for (int i=0; i<data.length; i++) {
        System.out.printf("%02X, ", (data[i] & 0xff));
        if ((i+1) % 10 == 0) System.out.println();
    }
    System.out.println();
}
// 写入流，流中的数据如下（按16进制显示）
ByteArrayOutputStream bos = generage10Random();
byte[] data = bos.toByteArray();
bos.close();
printBytes(data);

AC, ED, 00, 05, 77, 28, 00, 00, 00, 2B, 
00, 00, 00, 3E, 00, 00, 00, 4B, 00, 00, 
00, 38, 00, 00, 00, 12, 00, 00, 00, 2D, 
00, 00, 00, 23, 00, 00, 00, 62, 00, 00, 
00, 22, 00, 00, 00, 61, 


前6个字节```(AC, ED, 00, 05, 77, 28)```，是OjbectStream的头部, 后面的每4个字节存储一个int型数据

In [9]:
// 例2，从输入流中读取例1中写入的数
public ArrayList<Integer> readInt(InputStream is) throws IOException {
    ObjectInputStream ois = new ObjectInputStream(is);
    ArrayList<Integer> values = new ArrayList<Integer>();
    while (ois.available() > 0) {
        int v = ois.readInt();
        values.add(v);
    }
    return values;
}
ByteArrayInputStream bis = new ByteArrayInputStream(data);
List<Integer> values = readInt(bis);
bis.close();
System.out.println(values);

[43, 62, 75, 56, 18, 45, 35, 98, 34, 97]


# 5. 字符输入流Reader

![reader](io_img/reader.png)
在上面的继承关系图中可以看出：
1. ```Reader```是所有的输入字符流的父类，它是一个抽象类。
2. ```CharReader、StringReader```是两种基本的介质流，它们分别将```Char```数组、```String```中读取数据。`PipedReader`是从与其它线程共用的管道中读取数据。
3. `BufferedReader`很明显就是一个装饰器，它和其子类负责装饰其它`Reader`对象。
4. `FilterReader`是所有自定义具体装饰流的父类，其子类`PushbackReader`对`Reader`对象进行装饰，会增加一个行号。
5. `InputStreamReader`是一个连接字节流和字符流的桥梁，它将字节流转变为字符流。`FileReader`可以说是一个达到此功能、常用的工具类，在其源代码中明显使用了将`FileInputStream`转变为`Reader`的方法。我们可以从这个类中得到一定的技巧。`Reader`中各个类的用途和使用方法基本和`InputStream`中的类使用一致。后面会有`Reader`与`InputStream`的对应关系。

主要方法：\
1) `public int read() throws IOException`; 读取一个字符，返回值为读取的字符 \
2) `public int read(char cbuf[]) throws IOException`; 读取一系列字符到数组`cbuf[]`中，返回值为实际读取的字符的数量 \
3) `public abstract int read(char cbuf[],int off,int len) throws IOException`; 
读取`len`个字符，从数组`cbuf[]`的下标`off`处开始存放，返回值为实际读取的字符数量，该方法必须由子类实现 

# 6. 字符输出流Writer

![writer](io_img/writer.png)
在上面的关系图中可以看出：
1. `Writer`是所有的输出字符流的父类，它是一个抽象类。
2. `CharArrayWriter、StringWriter`是两种基本的介质流，它们分别向`Char`数组、`String`中写入数据。`PipedWriter`是向与其它线程共用的管道中写入数据，
3. `BufferedWriter`是一个装饰器为Writer提供缓冲功能。
4. `PrintWriter`和`PrintStream`极其类似，功能和使用也非常相似。
5. `OutputStreamWriter`是`OutputStream`到`Writer`转换的桥梁，它的子类`FileWriter`其实就是一个实现此功能的具体类（具体可以研究一`SourceCode`）。功能和使用和`OutputStream`极其类似.

In [27]:
// 例3: 键盘输入字符串，写入tmp.txt文件中
File f = new File("tmp.txt");
FileWriter fw = new FileWriter(f);
Scanner input = new Scanner(System.in); 
String s = input.next();
fw.write(s);
fw.close();
System.out.println("已把[" + s + "], 写入文件:" + f.getAbsolutePath());

如果输入了汉字你会看到乱
已把[濡傛灉杈撳叆浜嗘眽瀛椾綘浼氱湅鍒颁贡], 写入文件:D:\Work\JavaNotebook\network\tmp.txt


如果输入了汉字你会看到乱码，这是因为字符转换错误的原因
你用
```Java
Scanner input = new Scanner(System.in, "UTF-8");
```
替换上面的
```Java
Scanner input = new Scanner(System.in);
```
再执行试试，尝试分析乱码出现的原因

In [28]:
// 例4，读取刚才写入的文件tmp.txt
import java.nio.charset.Charset;

FileReader fr = new FileReader(f); 
BufferedReader br = new BufferedReader(fr);
String rs = br.readLine();
fr.close();
System.out.println(rs);

濡傛灉杈撳叆浜嗘眽瀛椾綘浼氱湅鍒颁贡


In [31]:
// 例5，把流包在try catch块中，保证流能正确关闭
// 一般流都需要显示的close, 即调用close()方法，若出现异常，流可能不会被正常关闭
// 这是，需要把流放在try catch 块中，以保证正确关闭
// 这是对 例4 的重写, 注意try的用法

try (BufferedReader br = new BufferedReader(new FileReader(f))) {
    String rs = br.readLine();
    System.out.println(rs);
}
// 注意: 这里结束try后，br能正常的被关闭

濡傛灉杈撳叆浜嗘眽瀛椾綘浼氱湅鍒颁贡


### 作业1
编写代码，读取并显示`io_img/GBK.txt, io_img/UTF8.txt`文件内容，文件使用的编码方式如文件名所示。

# 7. 非流式文件类--File类

从定义看，File类是Object的直接子类，同时它继承了Comparable接口可以进行数组的排序。  
File类的操作包括文件的创建、删除、重命名、得到路径、创建时间等  
File类是对文件系统中文件以及文件夹进行封装的对象，可以通过对象的思想来操作文件和文件夹。File类保存文件或目录的各种元数据信息，包括文件名、文件长度、最后修改时间、是否可读、获取当前文件的路径名，判断指定文件是否存在、获得当前目录中的文件列表，创建、删除文件和目录等方法。 
  
File类共提供了三个不同的构造函数，以不同的参数形式灵活地接收文件和目录名信息。  

构造函数：  
1）`File (String   pathname) `    
     例:`File  f1=new File("FileTest1.txt");` //创建文件对象f1，f1所指的文件是在当前目录下创建的FileTest1.txt  
2）`File (String  parent  ,  String child)`  
     例:`File f2=new  File(“D:\\dir1","FileTest2.txt");` 注意：D:\\dir1目录事先必须存在，否则异常  
3）`File (File    parent  , String child)`  
     例:`File  f4=new File("\\dir3");`  
          `File  f5=new File(f4,"FileTest5.txt");`  //在如果 \\dir3目录不存在使用f4.mkdir()先创建 

一个对应于某磁盘文件或目录的File对象一经创建， 就可以通过调用它的方法来获得文件或目录的属性。      
1）`public boolean exists()` 判断文件或目录是否存在  
2）`public boolean isFile()` 判断是文件还是目录   
3）`public boolean isDirectory()` 判断是文件还是目录  
4）`public String getName()` 返回文件名或目录名  
5）`public String getPath()` 返回文件或目录的路径。  
6）`public long length()` 获取文件的长度   
7）`public String[] list ()` 将目录中所有文件名保存在字符串数组中返回。   
`File`类中还定义了一些对文件或目录进行管理、操作的方法，常用的方法有：  
1）`public boolean renameTo(File newFile);`    重命名文件  
2）`public void delete();`   删除文件  
3）`public boolean mkdir();` 创建目录  

In [29]:
// 例6：列出当前文件夹中的所有文件
File currentFolder = new File(".");
File[] fs = currentFolder.listFiles();
for (File f : fs) {
    System.out.println(f.getName());
}

.ipynb_checkpoints
1、Java 容器，数据处理.ipynb
2、Lambda表达式.ipynb
3、Stream.ipynb
4、Java 容器，数据处理(Stream).ipynb
5、IO.ipynb
io_img
stream_img
tmp.txt


# 8. RandomAccessFile类
该对象并不是流体系中的一员，其封装了字节流，同时还封装了一个缓冲区（字符数组），通过内部的指针来操作字符数组中的数据。该对象特点：  
1. 该对象只能操作文件，所以构造函数接收两种类型的参数：a.字符串文件路径；b.File对象。
2. 该对象既可以对文件进行读操作，也能进行写操作，在进行对象实例化时可指定操作模式(r,rw)  
注意：该对象在实例化时，如果要操作的文件不存在，会自动创建；如果文件存在，写数据未指定位置，会从头开始写，即覆盖原有的内容。 

# 9. System类对IO的支持

针对一些频繁的设备交互，Java语言系统预定了3个可以直接使用的流对象，分别是：

- `System.in`（标准输入），通常代表键盘输入。
- `System.out`（标准输出）：通常写往显示器。
- `System.err`（标准错误输出）：通常写往显示器。

1) 标准输出流 `System.out`  
   `System.out`向标准输出设备输出数据，其数据类型为`PrintStream`。方法：  
   `Void print(参数)`  
   `Void println(参数)`  
2)标准输入流 `System.in`  
   `System.in`读取标准输入设备数据（从标准输入获取数据，一般是键盘），其数 据类型为`InputStream`。  
3)标准错误流  
   `System.err`输出标准错误，其数据类型为`PrintStream`。

# 10. 附加：

IOException异常类的子类
1. `public class EOFException` ：   非正常到达文件尾或输入流尾时，抛出这种类型的异常。    
2. `public class FileNotFoundException`：   当文件找不到时，抛出的异常。
3. `public class InterruptedIOException`： 当I/O操作被中断时，抛出这种类型的异常。

# 11. 总结上面几种流的应用场景：

- `FileInputStream/FileOutputStream`  需要逐个字节处理原始二进制流的时候使用，效率低下
- `FileReader/FileWriter` 需要组个字符处理的时候使用
- `StringReader/StringWriter` 需要处理字符串的时候，可以将字符串保存为字符数组
- `PrintStream/PrintWriter` 用来包装`FileOutputStream` 对象，方便直接将`String`字符串写入文件 
- `Scanner`用来包装`System.in`流，很方便地将输入的`String`字符串转换成需要的数据类型
- `InputStreamReader/OutputStreamReader` ,  字节和字符的转换桥梁，在网络通信或者处理键盘输入的时候用
- `BufferedReader/BufferedWriter ， BufferedInputStream/BufferedOutputStream` ， 缓冲流用来包装字节流后者字符流，提升IO性能，`BufferedReader`还可以方便地读取一行，简化编程。
