CS-Notes/docs/notes/Java IO.md

627 lines
22 KiB
Markdown
Raw Normal View History

2019-04-21 10:36:08 +08:00
<!-- GFM-TOC -->
2019-03-27 20:57:37 +08:00
* [一、概览](#一概览)
* [二、磁盘操作](#二磁盘操作)
* [三、字节操作](#三字节操作)
* [实现文件复制](#实现文件复制)
* [装饰者模式](#装饰者模式)
* [四、字符操作](#四字符操作)
* [编码与解码](#编码与解码)
* [String 的编码方式](#string-的编码方式)
* [Reader 与 Writer](#reader-与-writer)
* [实现逐行输出文本文件的内容](#实现逐行输出文本文件的内容)
* [五、对象操作](#五对象操作)
* [序列化](#序列化)
* [Serializable](#serializable)
* [transient](#transient)
* [六、网络操作](#六网络操作)
* [InetAddress](#inetaddress)
* [URL](#url)
* [Sockets](#sockets)
* [Datagram](#datagram)
* [七、NIO](#七nio)
* [流与块](#流与块)
* [通道与缓冲区](#通道与缓冲区)
* [缓冲区状态变量](#缓冲区状态变量)
* [文件 NIO 实例](#文件-nio-实例)
* [选择器](#选择器)
* [套接字 NIO 实例](#套接字-nio-实例)
* [内存映射文件](#内存映射文件)
* [对比](#对比)
* [八、参考资料](#八参考资料)
2019-04-21 10:36:08 +08:00
<!-- GFM-TOC -->
2019-03-27 20:57:37 +08:00
# 一、概览
Java 的 I/O 大概可以分成以下几类:
- 磁盘操作File
- 字节操作InputStream 和 OutputStream
- 字符操作Reader 和 Writer
- 对象操作Serializable
- 网络操作Socket
- 新的输入/输出NIO
# 二、磁盘操作
File 类可以用于表示文件和目录的信息,但是它不表示文件的内容。
2018-04-06 22:46:59 +08:00
2018-08-13 22:22:55 +08:00
递归地列出一个目录下所有文件:
2018-06-10 14:16:53 +08:00
```java
2019-03-27 20:57:37 +08:00
public static void listAllFiles(File dir) {
if (dir == null || !dir.exists()) {
return;
}
if (dir.isFile()) {
System.out.println(dir.getName());
return;
}
for (File file : dir.listFiles()) {
listAllFiles(file);
}
2018-06-10 14:16:53 +08:00
}
```
2019-03-27 20:57:37 +08:00
从 Java7 开始,可以使用 Paths 和 Files 代替 File。
2018-11-28 16:29:57 +08:00
2019-03-27 20:57:37 +08:00
# 三、字节操作
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
## 实现文件复制
2018-06-10 14:16:53 +08:00
```java
2019-03-27 20:57:37 +08:00
public static void copyFile(String src, String dist) throws IOException {
FileInputStream in = new FileInputStream(src);
FileOutputStream out = new FileOutputStream(dist);
byte[] buffer = new byte[20 * 1024];
int cnt;
// read() 最多读取 buffer.length 个字节
// 返回的是实际读取的个数
// 返回 -1 的时候表示读到 eof即文件尾
while ((cnt = in.read(buffer, 0, buffer.length)) != -1) {
out.write(buffer, 0, cnt);
}
in.close();
out.close();
2018-06-10 14:16:53 +08:00
}
```
2019-03-27 20:57:37 +08:00
## 装饰者模式
2018-06-04 14:29:04 +08:00
2019-03-27 20:57:37 +08:00
Java I/O 使用了装饰者模式来实现。以 InputStream 为例,
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
- InputStream 是抽象组件;
- FileInputStream 是 InputStream 的子类,属于具体组件,提供了字节流的输入操作;
- FilterInputStream 属于抽象装饰者,装饰者用于装饰组件,为组件提供额外的功能。例如 BufferedInputStream 为 FileInputStream 提供缓存的功能。
2018-08-13 22:22:55 +08:00
2019-04-25 18:43:33 +08:00
<div align="center"> <img src="https://cs-notes-1256109796.cos.ap-guangzhou.myqcloud.com/9709694b-db05-4cce-8d2f-1c8b09f4d921.png" width="650px"> </div><br>
2018-06-04 14:29:04 +08:00
2019-03-27 20:57:37 +08:00
实例化一个具有缓存功能的字节流对象时,只需要在 FileInputStream 对象上再套一层 BufferedInputStream 对象即可。
2018-04-06 22:46:59 +08:00
```java
2019-03-27 20:57:37 +08:00
FileInputStream fileInputStream = new FileInputStream(filePath);
BufferedInputStream bufferedInputStream = new BufferedInputStream(fileInputStream);
2018-04-06 22:46:59 +08:00
```
2019-03-27 20:57:37 +08:00
DataInputStream 装饰者提供了对更多数据类型进行输入的操作,比如 int、double 等基本类型。
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
# 四、字符操作
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
## 编码与解码
2018-04-06 22:46:59 +08:00
2018-06-09 23:03:31 +08:00
编码就是把字符转换为字节,而解码是把字节重新组合成字符。
2018-04-06 22:46:59 +08:00
如果编码和解码过程使用不同的编码方式那么就出现了乱码。
2019-03-27 20:57:37 +08:00
- GBK 编码中,中文字符占 2 个字节,英文字符占 1 个字节;
- UTF-8 编码中,中文字符占 3 个字节,英文字符占 1 个字节;
- UTF-16be 编码中,中文字符和英文字符都占 2 个字节。
2018-05-19 16:14:02 +08:00
2019-03-27 20:57:37 +08:00
UTF-16be 中的 be 指的是 Big Endian也就是大端。相应地也有 UTF-16lele 指的是 Little Endian也就是小端。
2018-05-19 16:14:02 +08:00
2019-03-27 20:57:37 +08:00
Java 的内存编码使用双字节编码 UTF-16be这不是指 Java 只支持这一种编码方式,而是说 char 这种类型使用 UTF-16be 进行编码。char 类型占 16 位也就是两个字节Java 使用这种双字节编码是为了让一个中文或者一个英文都能使用一个 char 来存储。
2018-06-09 23:03:31 +08:00
2019-03-27 20:57:37 +08:00
## String 的编码方式
2018-08-13 22:22:55 +08:00
2019-03-27 20:57:37 +08:00
String 可以看成一个字符序列,可以指定一个编码方式将它编码为字节序列,也可以指定一个编码方式将一个字节序列解码为 String。
2018-06-09 23:03:31 +08:00
```java
2019-03-27 20:57:37 +08:00
String str1 = "中文";
byte[] bytes = str1.getBytes("UTF-8");
String str2 = new String(bytes, "UTF-8");
2018-06-09 23:03:31 +08:00
System.out.println(str2);
```
2019-03-27 20:57:37 +08:00
在调用无参数 getBytes() 方法时,默认的编码方式不是 UTF-16be。双字节编码的好处是可以使用一个 char 存储中文和英文,而将 String 转为 bytes[] 字节数组就不再需要这个好处因此也就不再需要双字节编码。getBytes() 的默认编码方式与平台有关,一般为 UTF-8。
2018-06-09 23:03:31 +08:00
```java
2019-03-27 20:57:37 +08:00
byte[] bytes = str1.getBytes();
2018-06-09 23:03:31 +08:00
```
2018-05-19 16:14:02 +08:00
2019-03-27 20:57:37 +08:00
## Reader 与 Writer
2018-08-13 22:22:55 +08:00
不管是磁盘还是网络传输,最小的存储单元都是字节,而不是字符。但是在程序中操作的通常是字符形式的数据,因此需要提供对字符进行操作的方法。
2019-03-27 20:57:37 +08:00
- InputStreamReader 实现从字节流解码成字符流;
- OutputStreamWriter 实现字符流编码成为字节流。
2018-08-13 22:22:55 +08:00
2019-03-27 20:57:37 +08:00
## 实现逐行输出文本文件的内容
2018-08-13 22:22:55 +08:00
```java
2019-03-27 20:57:37 +08:00
public static void readFileContent(String filePath) throws IOException {
2018-08-13 22:22:55 +08:00
2019-03-27 20:57:37 +08:00
FileReader fileReader = new FileReader(filePath);
BufferedReader bufferedReader = new BufferedReader(fileReader);
2018-08-13 22:22:55 +08:00
2019-03-27 20:57:37 +08:00
String line;
while ((line = bufferedReader.readLine()) != null) {
System.out.println(line);
}
2018-08-13 22:22:55 +08:00
2019-03-27 20:57:37 +08:00
// 装饰者模式使得 BufferedReader 组合了一个 Reader 对象
// 在调用 BufferedReader 的 close() 方法时会去调用 Reader 的 close() 方法
// 因此只要一个 close() 调用即可
bufferedReader.close();
2018-08-13 22:22:55 +08:00
}
```
2019-03-27 20:57:37 +08:00
# 五、对象操作
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
## 序列化
2018-08-13 22:22:55 +08:00
2018-04-06 22:46:59 +08:00
序列化就是将一个对象转换成字节序列,方便存储和传输。
2019-03-27 20:57:37 +08:00
- 序列化ObjectOutputStream.writeObject()
- 反序列化ObjectInputStream.readObject()
2018-06-10 14:16:53 +08:00
2018-08-13 22:22:55 +08:00
不会对静态变量进行序列化,因为序列化只是保存对象的状态,静态变量属于类的状态。
2019-03-27 20:57:37 +08:00
## Serializable
2018-08-13 22:22:55 +08:00
2019-03-27 20:57:37 +08:00
序列化的类需要实现 Serializable 接口,它只是一个标准,没有任何方法需要实现,但是如果不去实现它的话而进行序列化,会抛出异常。
2018-04-06 22:46:59 +08:00
2018-06-10 14:16:53 +08:00
```java
2019-03-27 20:57:37 +08:00
public static void main(String[] args) throws IOException, ClassNotFoundException {
2018-09-05 17:22:45 +08:00
2019-03-27 20:57:37 +08:00
A a1 = new A(123, "abc");
String objectFile = "file/a1";
2018-09-05 17:22:45 +08:00
2019-03-27 20:57:37 +08:00
ObjectOutputStream objectOutputStream = new ObjectOutputStream(new FileOutputStream(objectFile));
objectOutputStream.writeObject(a1);
objectOutputStream.close();
2018-06-26 17:25:44 +08:00
2019-03-27 20:57:37 +08:00
ObjectInputStream objectInputStream = new ObjectInputStream(new FileInputStream(objectFile));
A a2 = (A) objectInputStream.readObject();
objectInputStream.close();
System.out.println(a2);
2018-06-10 14:16:53 +08:00
}
2019-03-27 20:57:37 +08:00
private static class A implements Serializable {
2018-09-05 17:22:45 +08:00
2019-03-27 20:57:37 +08:00
private int x;
private String y;
2018-06-10 14:16:53 +08:00
2019-03-27 20:57:37 +08:00
A(int x, String y) {
this.x = x;
this.y = y;
}
2018-06-10 14:16:53 +08:00
2019-03-27 20:57:37 +08:00
@Override
public String toString() {
return "x = " + x + " " + "y = " + y;
}
2018-06-10 14:16:53 +08:00
}
```
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
## transient
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
transient 关键字可以使一些属性不会被序列化。
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
ArrayList 中存储数据的数组 elementData 是用 transient 修饰的,因为这个数组是动态扩展的,并不是所有的空间都被使用,因此就不需要所有的内容都被序列化。通过重写序列化和反序列化方法,使得可以只序列化数组中有内容的那部分数据。
2018-04-06 22:46:59 +08:00
```java
2019-03-27 20:57:37 +08:00
private transient Object[] elementData;
2018-04-06 22:46:59 +08:00
```
2019-03-27 20:57:37 +08:00
# 六、网络操作
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
Java 中的网络支持:
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
- InetAddress用于表示网络上的硬件资源即 IP 地址;
- URL统一资源定位符
- Sockets使用 TCP 协议实现网络通信;
- Datagram使用 UDP 协议实现网络通信。
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
## InetAddress
2018-04-06 22:46:59 +08:00
2018-08-05 16:35:58 +08:00
没有公有的构造函数,只能通过静态方法来创建实例。
2018-04-06 22:46:59 +08:00
```java
2019-03-27 20:57:37 +08:00
InetAddress.getByName(String host);
InetAddress.getByAddress(byte[] address);
2018-04-06 22:46:59 +08:00
```
2019-03-27 20:57:37 +08:00
## URL
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
可以直接从 URL 中读取字节流数据。
2018-04-06 22:46:59 +08:00
```java
2019-03-27 20:57:37 +08:00
public static void main(String[] args) throws IOException {
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
URL url = new URL("http://www.baidu.com");
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
/* 字节流 */
InputStream is = url.openStream();
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
/* 字符流 */
InputStreamReader isr = new InputStreamReader(is, "utf-8");
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
/* 提供缓存功能 */
BufferedReader br = new BufferedReader(isr);
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
String line;
while ((line = br.readLine()) != null) {
System.out.println(line);
}
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
br.close();
2018-04-06 22:46:59 +08:00
}
```
2019-03-27 20:57:37 +08:00
## Sockets
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
- ServerSocket服务器端类
- Socket客户端类
- 服务器和客户端通过 InputStream 和 OutputStream 进行输入输出。
2018-04-06 22:46:59 +08:00
2019-05-14 16:57:43 +08:00
<div align="center"> <img src="https://cs-notes-1256109796.cos.ap-guangzhou.myqcloud.com/1e6affc4-18e5-4596-96ef-fb84c63bf88a.png" width="550px"> </div><br>
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
## Datagram
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
- DatagramSocket通信类
- DatagramPacket数据包类
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
# 七、NIO
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
新的输入/输出 (NIO) 库是在 JDK 1.4 中引入的,弥补了原来的 I/O 的不足,提供了高速的、面向块的 I/O。
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
## 流与块
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
I/O 与 NIO 最重要的区别是数据打包和传输的方式I/O 以流的方式处理数据,而 NIO 以块的方式处理数据。
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
面向流的 I/O 一次处理一个字节数据:一个输入流产生一个字节数据,一个输出流消费一个字节数据。为流式数据创建过滤器非常容易,链接几个过滤器,以便每个过滤器只负责复杂处理机制的一部分。不利的一面是,面向流的 I/O 通常相当慢。
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
面向块的 I/O 一次处理一个数据块,按块处理数据比按流处理数据要快得多。但是面向块的 I/O 缺少一些面向流的 I/O 所具有的优雅性和简单性。
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
I/O 包和 NIO 已经很好地集成了java.io.\* 已经以 NIO 为基础重新实现了,所以现在它可以利用 NIO 的一些特性。例如java.io.\* 包中的一些类包含以块的形式读写数据的方法,这使得即使在面向流的系统中,处理速度也会更快。
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
## 通道与缓冲区
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
### 1. 通道
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
通道 Channel 是对原 I/O 包中的流的模拟,可以通过它读取和写入数据。
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
通道与流的不同之处在于,流只能在一个方向上移动(一个流必须是 InputStream 或者 OutputStream 的子类),而通道是双向的,可以用于读、写或者同时用于读写。
2018-04-06 22:46:59 +08:00
通道包括以下类型:
2019-03-27 20:57:37 +08:00
- FileChannel从文件中读写数据
- DatagramChannel通过 UDP 读写网络中数据;
- SocketChannel通过 TCP 读写网络中数据;
- ServerSocketChannel可以监听新进来的 TCP 连接,对每一个新进来的连接都会创建一个 SocketChannel。
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
### 2. 缓冲区
2018-04-06 22:46:59 +08:00
2018-05-19 16:14:02 +08:00
发送给一个通道的所有数据都必须首先放到缓冲区中,同样地,从通道中读取的任何数据都要先读到缓冲区中。也就是说,不会直接对通道进行读写数据,而是要先经过缓冲区。
2018-04-06 22:46:59 +08:00
缓冲区实质上是一个数组,但它不仅仅是一个数组。缓冲区提供了对数据的结构化访问,而且还可以跟踪系统的读/写进程。
缓冲区包括以下类型:
2019-03-27 20:57:37 +08:00
- ByteBuffer
- CharBuffer
- ShortBuffer
- IntBuffer
- LongBuffer
- FloatBuffer
- DoubleBuffer
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
## 缓冲区状态变量
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
- capacity最大容量
- position当前已经读写的字节数
- limit还可以读写的字节数。
2018-04-06 22:46:59 +08:00
状态变量的改变过程举例:
2019-03-27 20:57:37 +08:00
① 新建一个大小为 8 个字节的缓冲区,此时 position 为 0而 limit = capacity = 8。capacity 变量不会改变,下面的讨论会忽略它。
2018-04-06 22:46:59 +08:00
2019-04-25 18:43:33 +08:00
<div align="center"> <img src="https://cs-notes-1256109796.cos.ap-guangzhou.myqcloud.com/1bea398f-17a7-4f67-a90b-9e2d243eaa9a.png"/> </div><br>
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
② 从输入通道中读取 5 个字节数据写入缓冲区中,此时 position 为 5limit 保持不变。
2018-04-06 22:46:59 +08:00
2019-04-25 18:43:33 +08:00
<div align="center"> <img src="https://cs-notes-1256109796.cos.ap-guangzhou.myqcloud.com/80804f52-8815-4096-b506-48eef3eed5c6.png"/> </div><br>
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
③ 在将缓冲区的数据写到输出通道之前,需要先调用 flip() 方法,这个方法将 limit 设置为当前 position并将 position 设置为 0。
2018-04-06 22:46:59 +08:00
2019-04-25 18:43:33 +08:00
<div align="center"> <img src="https://cs-notes-1256109796.cos.ap-guangzhou.myqcloud.com/952e06bd-5a65-4cab-82e4-dd1536462f38.png"/> </div><br>
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
④ 从缓冲区中取 4 个字节到输出缓冲中,此时 position 设为 4。
2018-04-06 22:46:59 +08:00
2019-04-25 18:43:33 +08:00
<div align="center"> <img src="https://cs-notes-1256109796.cos.ap-guangzhou.myqcloud.com/b5bdcbe2-b958-4aef-9151-6ad963cb28b4.png"/> </div><br>
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
⑤ 最后需要调用 clear() 方法来清空缓冲区,此时 position 和 limit 都被设置为最初位置。
2018-04-06 22:46:59 +08:00
2019-04-25 18:43:33 +08:00
<div align="center"> <img src="https://cs-notes-1256109796.cos.ap-guangzhou.myqcloud.com/67bf5487-c45d-49b6-b9c0-a058d8c68902.png"/> </div><br>
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
## 文件 NIO 实例
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
以下展示了使用 NIO 快速复制文件的实例:
2018-04-06 22:46:59 +08:00
```java
2019-03-27 20:57:37 +08:00
public static void fastCopy(String src, String dist) throws IOException {
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
/* 获得源文件的输入字节流 */
FileInputStream fin = new FileInputStream(src);
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
/* 获取输入字节流的文件通道 */
FileChannel fcin = fin.getChannel();
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
/* 获取目标文件的输出字节流 */
FileOutputStream fout = new FileOutputStream(dist);
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
/* 获取输出字节流的文件通道 */
FileChannel fcout = fout.getChannel();
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
/* 为缓冲区分配 1024 个字节 */
ByteBuffer buffer = ByteBuffer.allocateDirect(1024);
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
while (true) {
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
/* 从输入通道中读取数据到缓冲区中 */
int r = fcin.read(buffer);
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
/* read() 返回 -1 表示 EOF */
if (r == -1) {
break;
}
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
/* 切换读写 */
buffer.flip();
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
/* 把缓冲区的内容写入输出文件中 */
fcout.write(buffer);
2018-08-28 21:52:21 +08:00
2019-03-27 20:57:37 +08:00
/* 清空缓冲区 */
buffer.clear();
}
2018-04-06 22:46:59 +08:00
}
```
2019-03-27 20:57:37 +08:00
## 选择器
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
NIO 常常被叫做非阻塞 IO主要是因为 NIO 在网络通信中的非阻塞特性被广泛使用。
2018-07-19 23:39:27 +08:00
2019-03-27 20:57:37 +08:00
NIO 实现了 IO 多路复用中的 Reactor 模型,一个线程 Thread 使用一个选择器 Selector 通过轮询的方式去监听多个通道 Channel 上的事件,从而让一个线程就可以处理多个事件。
2018-07-19 23:39:27 +08:00
2019-03-27 20:57:37 +08:00
通过配置监听的通道 Channel 为非阻塞,那么当 Channel 上的 IO 事件还未到达时,就不会进入阻塞状态一直等待,而是继续轮询其它 Channel找到 IO 事件已经到达的 Channel 执行。
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
因为创建和切换线程的开销很大,因此使用一个线程来处理多个事件而不是一个线程处理一个事件,对于 IO 密集型的应用具有很好地性能。
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
应该注意的是,只有套接字 Channel 才能配置为非阻塞,而 FileChannel 不能,为 FileChannel 配置非阻塞也没有意义。
2018-07-19 23:39:27 +08:00
2019-04-25 18:43:33 +08:00
<div align="center"> <img src="https://cs-notes-1256109796.cos.ap-guangzhou.myqcloud.com/093f9e57-429c-413a-83ee-c689ba596cef.png" width="350px"> </div><br>
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
### 1. 创建选择器
2018-04-06 22:46:59 +08:00
```java
2019-03-27 20:57:37 +08:00
Selector selector = Selector.open();
2018-04-06 22:46:59 +08:00
```
2019-03-27 20:57:37 +08:00
### 2. 将通道注册到选择器上
2018-04-06 22:46:59 +08:00
```java
2019-03-27 20:57:37 +08:00
ServerSocketChannel ssChannel = ServerSocketChannel.open();
2018-05-19 16:14:02 +08:00
ssChannel.configureBlocking(false);
2019-03-27 20:57:37 +08:00
ssChannel.register(selector, SelectionKey.OP_ACCEPT);
2018-04-06 22:46:59 +08:00
```
2018-06-28 16:32:26 +08:00
通道必须配置为非阻塞模式,否则使用选择器就没有任何意义了,因为如果通道在某个事件上被阻塞,那么服务器就不能响应其它事件,必须等待这个事件处理完毕才能去处理其它事件,显然这和选择器的作用背道而驰。
2018-04-06 22:46:59 +08:00
2018-05-19 16:14:02 +08:00
在将通道注册到选择器上时,还需要指定要注册的具体事件,主要有以下几类:
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
- SelectionKey.OP_CONNECT
- SelectionKey.OP_ACCEPT
- SelectionKey.OP_READ
- SelectionKey.OP_WRITE
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
它们在 SelectionKey 的定义如下:
2018-04-06 22:46:59 +08:00
2018-05-19 16:14:02 +08:00
```java
2019-03-27 20:57:37 +08:00
public static final int OP_READ = 1 << 0;
public static final int OP_WRITE = 1 << 2;
public static final int OP_CONNECT = 1 << 3;
public static final int OP_ACCEPT = 1 << 4;
2018-04-06 22:46:59 +08:00
```
2018-05-19 16:14:02 +08:00
可以看出每个事件可以被当成一个位域,从而组成事件集整数。例如:
2018-04-06 22:46:59 +08:00
```java
2019-03-27 20:57:37 +08:00
int interestSet = SelectionKey.OP_READ | SelectionKey.OP_WRITE;
2018-04-06 22:46:59 +08:00
```
2019-03-27 20:57:37 +08:00
### 3. 监听事件
2018-04-06 22:46:59 +08:00
```java
2019-03-27 20:57:37 +08:00
int num = selector.select();
2018-04-06 22:46:59 +08:00
```
2019-03-27 20:57:37 +08:00
使用 select() 来监听到达的事件,它会一直阻塞直到有至少一个事件到达。
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
### 4. 获取到达的事件
2018-04-06 22:46:59 +08:00
```java
2019-03-27 20:57:37 +08:00
Set<SelectionKey> keys = selector.selectedKeys();
Iterator<SelectionKey> keyIterator = keys.iterator();
while (keyIterator.hasNext()) {
SelectionKey key = keyIterator.next();
if (key.isAcceptable()) {
// ...
} else if (key.isReadable()) {
// ...
}
keyIterator.remove();
2018-04-06 22:46:59 +08:00
}
```
2019-03-27 20:57:37 +08:00
### 5. 事件循环
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
因为一次 select() 调用不能处理完所有的事件,并且服务器端有可能需要一直监听事件,因此服务器端处理事件的代码一般会放在一个死循环内。
2018-04-06 22:46:59 +08:00
```java
2019-03-27 20:57:37 +08:00
while (true) {
int num = selector.select();
Set<SelectionKey> keys = selector.selectedKeys();
Iterator<SelectionKey> keyIterator = keys.iterator();
while (keyIterator.hasNext()) {
SelectionKey key = keyIterator.next();
if (key.isAcceptable()) {
// ...
} else if (key.isReadable()) {
// ...
}
keyIterator.remove();
}
2018-05-19 16:14:02 +08:00
}
2018-04-06 22:46:59 +08:00
```
2019-03-27 20:57:37 +08:00
## 套接字 NIO 实例
2018-04-06 22:46:59 +08:00
```java
2019-03-27 20:57:37 +08:00
public class NIOServer {
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
public static void main(String[] args) throws IOException {
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
Selector selector = Selector.open();
2018-06-04 14:29:04 +08:00
2019-03-27 20:57:37 +08:00
ServerSocketChannel ssChannel = ServerSocketChannel.open();
ssChannel.configureBlocking(false);
ssChannel.register(selector, SelectionKey.OP_ACCEPT);
2018-06-04 14:29:04 +08:00
2019-03-27 20:57:37 +08:00
ServerSocket serverSocket = ssChannel.socket();
InetSocketAddress address = new InetSocketAddress("127.0.0.1", 8888);
serverSocket.bind(address);
2018-06-04 14:29:04 +08:00
2019-03-27 20:57:37 +08:00
while (true) {
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
selector.select();
Set<SelectionKey> keys = selector.selectedKeys();
Iterator<SelectionKey> keyIterator = keys.iterator();
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
while (keyIterator.hasNext()) {
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
SelectionKey key = keyIterator.next();
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
if (key.isAcceptable()) {
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
ServerSocketChannel ssChannel1 = (ServerSocketChannel) key.channel();
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
// 服务器会为每个新连接创建一个 SocketChannel
SocketChannel sChannel = ssChannel1.accept();
sChannel.configureBlocking(false);
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
// 这个新连接主要用于从客户端读取数据
sChannel.register(selector, SelectionKey.OP_READ);
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
} else if (key.isReadable()) {
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
SocketChannel sChannel = (SocketChannel) key.channel();
System.out.println(readDataFromSocketChannel(sChannel));
sChannel.close();
}
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
keyIterator.remove();
}
}
}
2018-06-04 14:29:04 +08:00
2019-03-27 20:57:37 +08:00
private static String readDataFromSocketChannel(SocketChannel sChannel) throws IOException {
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
ByteBuffer buffer = ByteBuffer.allocate(1024);
StringBuilder data = new StringBuilder();
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
while (true) {
2018-08-05 16:35:58 +08:00
2019-03-27 20:57:37 +08:00
buffer.clear();
int n = sChannel.read(buffer);
if (n == -1) {
break;
}
buffer.flip();
int limit = buffer.limit();
char[] dst = new char[limit];
for (int i = 0; i < limit; i++) {
dst[i] = (char) buffer.get(i);
}
data.append(dst);
buffer.clear();
}
return data.toString();
}
2018-05-19 16:14:02 +08:00
}
2018-04-06 22:46:59 +08:00
```
```java
2019-03-27 20:57:37 +08:00
public class NIOClient {
public static void main(String[] args) throws IOException {
Socket socket = new Socket("127.0.0.1", 8888);
OutputStream out = socket.getOutputStream();
String s = "hello world";
out.write(s.getBytes());
out.close();
}
2018-04-06 22:46:59 +08:00
}
```
2019-03-27 20:57:37 +08:00
## 内存映射文件
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
内存映射文件 I/O 是一种读和写文件数据的方法,它可以比常规的基于流或者基于通道的 I/O 快得多。
2018-04-06 22:46:59 +08:00
2018-08-05 16:35:58 +08:00
向内存映射文件写入可能是危险的,只是改变数组的单个元素这样的简单操作,就可能会直接修改磁盘上的文件。修改数据与将数据保存到磁盘是没有分开的。
2018-04-06 22:46:59 +08:00
2019-03-27 20:57:37 +08:00
下面代码行将文件的前 1024 个字节映射到内存中map() 方法返回一个 MappedByteBuffer它是 ByteBuffer 的子类。因此,可以像使用其他任何 ByteBuffer 一样使用新映射的缓冲区,操作系统会在需要时负责执行映射。
2018-04-06 22:46:59 +08:00
```java
2019-03-27 20:57:37 +08:00
MappedByteBuffer mbb = fc.map(FileChannel.MapMode.READ_WRITE, 0, 1024);
2018-04-06 22:46:59 +08:00
```
2019-03-27 20:57:37 +08:00
## 对比
NIO 与普通 I/O 的区别主要有以下两点:
- NIO 是非阻塞的;
- NIO 面向块I/O 面向流。
# 八、参考资料
- Eckel B, 埃克尔, 昊鹏, 等. Java 编程思想 [M]. 机械工业出版社, 2002.
- [IBM: NIO 入门](https://www.ibm.com/developerworks/cn/education/java/j-nio/j-nio.html)
- [Java NIO Tutorial](http://tutorials.jenkov.com/java-nio/index.html)
- [Java NIO 浅析](https://tech.meituan.com/nio.html)
- [IBM: 深入分析 Java I/O 的工作机制](https://www.ibm.com/developerworks/cn/java/j-lo-javaio/index.html)
- [IBM: 深入分析 Java 中的中文编码问题](https://www.ibm.com/developerworks/cn/java/j-lo-chinesecoding/index.html)
- [IBM: Java 序列化的高级认识](https://www.ibm.com/developerworks/cn/java/j-lo-serial/index.html)
- [NIO 与传统 IO 的区别](http://blog.csdn.net/shimiso/article/details/24990499)
- [Decorator Design Pattern](http://stg-tud.github.io/sedc/Lecture/ws13-14/5.3-Decorator.html#mode=document)
- [Socket Multicast](http://labojava.blogspot.com/2012/12/socket-multicast.html)
2019-05-17 22:36:43 +08:00
</br><div align="center">💡 </br></br> 更多精彩内容将发布在公众号 **CyC2018**,公众号提供了该项目的离线阅读版本,后台回复"下载" 即可领取。也提供了一份技术面试复习思维导图,不仅系统整理了面试知识点,而且标注了各个知识点的重要程度,从而帮你理清多而杂的面试知识点,后台回复"资料" 即可领取。我基本是按照这个思维导图来进行复习的,对我拿到了 BAT 头条等 Offer 起到很大的帮助。你们完全可以和我一样根据思维导图上列的知识点来进行复习,就不用看很多不重要的内容,也可以知道哪些内容很重要从而多安排一些复习时间。</div></br>
2019-03-27 20:57:37 +08:00
<div align="center"><img width="180px" src="https://cyc-1256109796.cos.ap-guangzhou.myqcloud.com/%E5%85%AC%E4%BC%97%E5%8F%B7.jpg"></img></div>