0%

四:字符设备

由于Linux中一切皆文件的思想,字符设备(键盘/鼠标/串口)、块设备(存储器)、网络设备(套接字)作为三种主要设备类型,我们在用户层基本可以通过open close read write来完成对设备的绝大部分操作。其中字符设备是涵盖面最广的一种,而且其概念相对容易理解,因此以字符设备为切入口,掌握内核与用户层之间的调用机制是再合适不过了。

本章主要学习

  • 字符设备驱动的基本概念
  • 如何向内核注册/注销一个字符设备
  • 如何通过设备节点、文件API调用驱动的函数

什么是字符设备?

所谓字符设备,泛指那些输入输出以串行方式、按顺序、一个字符一个字符的收发数据的设备。比如键盘,按键数据是一个一个发给系统的,哪怕是组合键;鼠标的坐标;LED灯;串口终端等。而这些数据如果不能及时被系统处理,要么被缓存,要么直接丢弃,但不论如何,当系统去处理这些数据的时候,也是按先来后到的顺序。

你可以设想以下,你的电脑突然卡顿了5秒钟,而这期间你疯狂打了10个字,毫无疑问这10个字的数据被缓存起来了,等系统空闲的时候开始处理它们,现在你是希望这10个字是按照你打的顺序出现在屏幕呢,还是希望它们毫无章法地出现在屏幕。

所以,字符设备,就是数据的IO总是以连续的形式处理的设备类型。

顺带提一句块设备,与字符设备概念做个对比。比如硬盘:你和你的右手出去约会并拍了很多照片回来,然后你把照片导入电脑,而硬盘的存储空间并不是像水杯一样从下往上按顺序填满,而是根据某种算法“随机”存,所以在真实的硬盘中,存放你1号照片的存储区域旁边,并不是2号照片,可能是某份日语学习资料;同理,3号照片可能与去年下载的种子呆在一起。

第一个字符设备 meme

在操作系统中,设备不一定要真实存在,虚拟设备也是设备,可以通过文件函数进行操作。因此为了掌握字符设备的知识,最简单的方法就是自己动手写一个虚拟字符设备。

meme的中文意思是米姆、莫因,表示文化DNA的意思,而作为我学习驱动的实例,它就是“记事本”,用户可以用多种方式读写它,而我给这个虚拟设备取这么个名字没别的意思——just for fun!

先来看看我打算要meme实现哪些内容:

  1. 向内核注册/注销自己
  2. 支持open/close/read/write等文件操作函数

字符设备的注册与注销

要像内核注册一个设备,必须提供它的设备号作为唯一标示,字符设备的设备号由主设备号次设备号共同组成

  • 主设备号(major):表示设备的分类编号,比如1代表u盘、2代表显示器、3代表打印机
  • 次设备号(minor):表示同一分类的实例编号,比如1号u盘、2号u盘、3号u盘

Linux内核可以静态注册动态分配的方式注册一个设备号:

1
2
3
4
5
6
7
8
9
10
// 动态申请,由内核自动扫描空闲设备号给它
// @dev 设备编号
// @firstminor 次设备号的起始编号
// @count 要申请多少个连续的设备号
// @name 设备名称,将出现在/proc/devices中
int alloc_chrdev_region(dev_t *dev, unsigned firstminor, unsigned count, const char *name);

// 静态注册,必须确保该设备号是空闲的
// @first 要注册的起始设备号,主+次
int register_chrdev_region(dev_t first, unsigned count, const char *name);

⚠️注意⚠️:在实际开发过程中,强烈建议仅通过动态分配的方式注册设备,因为说不准你自己规划好的设备编号会在未来被Linux内核给占用了。

字符设备的注册大体分两步:

  1. 初始化一个cdev字符设备的数据结构,向内核说明自己是字符设备
  2. 分配一个设备号与cdev绑定起来

下面就是一个最纯粹的字符设备注册和注销的实现:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
#include <linux/init.h>
#include <linux/module.h>
#include <linux/cdev.h>

// 字符设备结构体,该字符设备的核心数据表示
static struct cdev cdev;

// 驱动的主设备编号,每种类型的设备都有唯一编号
static dev_t devno = 0;

// 模块加载函数:注册字符设备
static int __init meme_init(void)
{
// 1. 向内核申请分配一个主设备号,此设备号从0开始,分配1个,名称为meme
if (alloc_chrdev_region(&devno, 0, 1, "meme") < 0 ) {
printk(KERN_ERR"init fail\n");
return (-1);
}

// 2. 初始化cdev结构体,并与fops文件操作之间建立联系
cdev_init(&cdev, &fops);

// 3. 正式向内核注册一个字符设备
cdev_add(&cdev, devno, 1);

// 注册成功后打印出该设备的主、次设备号
printk(KERN_ALERT"meme init: %d:%d\n", MAJOR(devno), MINOR(devno));
return 0;
}
module_init(meme_init);


// 模块卸载函数:注销字符设备
static void __exit meme_exit(void)
{
// 1. 向内核注销该字符设备
cdev_del(&cdev);

// 2. 向内核申请释放该设备号
unregister_chrdev_region(devno, 1);

printk("meme free\n");
}
module_exit(meme_exit);

// 杂七杂八的东西
MODULE_LICENSE("GPL v2");
MODULE_AUTHOR("Philon");
MODULE_DESCRIPTION("A character device driver");

可以看到,字符设备的注册/注销一般是在模块的加载和卸载函数中实现的,整个过程非常简单:
申请设备号 –> 初始化字符设备 –> 内核添加字符设备 –> 内核删除字符设备 –> 释放设备号

关于cdev_init / cdev_add / cdev_del等函数没有展开说明是因为后续有更好的方法,不要拘泥于此。不过注意cdev_init(&cdev, &fops)这行,fops是接下来要学习的一个非常重要的数据结构——文件操作

字符设备的文件操作

因为Linux的一切皆文件,理论上在用户层任何设备都可以通过文件相关的API函数调用设备,而作为设备驱动本身,很重要的一部分工作就是把用户层的各种文件操作关联到各种驱动函数当中,而这离不开一个结构体struct file_operations,先来看看内核对其定义:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
struct file_operations {
struct module *owner;
loff_t (*llseek) (struct file *, loff_t, int);
ssize_t (*read) (struct file *, char __user *, size_t, loff_t *);
ssize_t (*write) (struct file *, const char __user *, size_t, loff_t *);
ssize_t (*read_iter) (struct kiocb *, struct iov_iter *);
ssize_t (*write_iter) (struct kiocb *, struct iov_iter *);
int (*iterate) (struct file *, struct dir_context *);
int (*iterate_shared) (struct file *, struct dir_context *);
__poll_t (*poll) (struct file *, struct poll_table_struct *);
long (*unlocked_ioctl) (struct file *, unsigned int, unsigned long);
long (*compat_ioctl) (struct file *, unsigned int, unsigned long);
int (*mmap) (struct file *, struct vm_area_struct *);
unsigned long mmap_supported_flags;
int (*open) (struct inode *, struct file *);
int (*flush) (struct file *, fl_owner_t id);
int (*release) (struct inode *, struct file *);
int (*fsync) (struct file *, loff_t, loff_t, int datasync);
int (*fasync) (int, struct file *, int);
int (*lock) (struct file *, int, struct file_lock *);
ssize_t (*sendpage) (struct file *, struct page *, int, size_t, loff_t *, int);
unsigned long (*get_unmapped_area)(struct file *, unsigned long, unsigned long, unsigned long, unsigned long);
int (*check_flags)(int);
int (*flock) (struct file *, int, struct file_lock *);
ssize_t (*splice_write)(struct pipe_inode_info *, struct file *, loff_t *, size_t, unsigned int);
ssize_t (*splice_read)(struct file *, loff_t *, struct pipe_inode_info *, size_t, unsigned int);
int (*setlease)(struct file *, long, struct file_lock **, void **);
long (*fallocate)(struct file *file, int mode, loff_t offset,
loff_t len);
void (*show_fdinfo)(struct seq_file *m, struct file *f);
#ifndef CONFIG_MMU
unsigned (*mmap_capabilities)(struct file *);
#endif
ssize_t (*copy_file_range)(struct file *, loff_t, struct file *,
loff_t, size_t, unsigned int);
loff_t (*remap_file_range)(struct file *file_in, loff_t pos_in,
struct file *file_out, loff_t pos_out,
loff_t len, unsigned int remap_flags);
int (*fadvise)(struct file *, loff_t, loff_t, int);
} __randomize_layout;

乍一看,很复杂!其实用面向对象的思维可以简单理解为——file_operations就是一个需要继承实现的interface。因此不要去纠结里面的内容有多少,大部分时候我们都是根据需要去实现其中的部分函数即可,等具体实现的时候再来参考对应函数在其中的声明形式。(通过该结构体打通了内核与应用间的任督二脉)

为用户层实现open/close和read/write

  • open和close一般都是处理一些设备复位的工作(或者干脆不做任何处理),但如果有逻辑要放在open/close里执行,务必留意应用程序可能会重复多次打开/关闭同一个文件的情况。
  • read/write在内核中主要围绕copy_to_usercopy_from_user两个函数来处理,它们负责把“交换”用户空间与内核模块的数据,但要特别小心文件偏移,不是所有设备在读写的时候都需要偏移的!比如读取LED灯的状态,每次都应该从头开始读。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
// 对应用户层read读取函数,通常用户接收设备内容,如串口收数据
static ssize_t meme_read(struct file* filp, char __user *buf, size_t size, loff_t* off)
{
// 如果当前文件偏移量已经超出内存大小,直接返回错误
if (*off >= meme.size) {
return -ENOMEM;
}

// 如果当前可访问内存长度小于要读取的长度,仅读取可访问长度
if ((*off + size) > meme.size) {
size = meme.size - *off;
}

// 拷贝内核数据到用户空间
if (copy_to_user(buf, filp->private_data + *off, size)) {
return -EFAULT;
}

// 偏移相应的读取长度
*off += size;
return size;
}

// 对应用户层write写入函数,通常用于写入设备内容,如串口发数据
static ssize_t meme_write(struct file* filp, const char __user *buf, size_t size, loff_t* off)
{
// 如果文件偏移超出内存长度,就没必要再写了
if (*off >= meme.size) {
return 0;
}

// 如果要写入的数据长度比剩余可访问的内存长度还要大,仅写入可访问的内存长度
if (*off + size > meme.size) {
size = meme.size - *off;
}

// 拷贝用户数据到内核空间
if (copy_from_user(filp->private_data + *off, buf, size)) {
return -EFAULT;
}

// 偏移相应的写入函数
*off += size;
return size;
}

// 对应用户层open打开函数,就是打开设备描述符
static int meme_open(struct inode* inode, struct file* filp)
{
// 如果是第一次访问设备节点,分配内存
if (meme.data == NULL) {
meme.data = kmalloc(MEME_DEFAULT_DATA_SIZE, GFP_KERNEL);
}

filp->private_data = meme.data;

return 0;
}

// 对应用户层close关闭函数,就是关闭设备文件
static int meme_close(struct inode* inode, struct file* filp)
{
// nothing todo
return 0;
}

// 文件操作结构体,表示内核模块与用户层的函数对应关系
static const struct file_operations fops = {
.owner = THIS_MODULE, // 这其实是个结构体,比如THIS_MODULE->name
.read = meme_read,
.write = meme_write,
.open = meme_open,
.release = meme_close,
};

代码很简单,该说的注释都已经说了,除了file_operations里的这句:.owner = THIS_MODULE。首先要直到THIS_MODULE是一个结构体定义,之所以把它指向owner(模块自身)是为了防止模块正在进行其他操作(如读写)时,被rmmod卸载。每个以模块形式存在的驱动,最好都把这句加上!

设备节点与操作

设备节点是是用户层与内核模块沟通的桥梁!

作为初学者的我曾一度认为/dev目录下的节点就是设备本身,显然这种看法很幼稚,内核真正把设备和驱动暴露在/proc和/sys目录(再说一遍,其实是文件系统!!)而设备节点是在用户层创建的一个特殊文件,它的创建和删除几乎不影响内核对设备本身的管理。

设备节点的创建命令为:mknod <node_name> <type> <major> <minor>

把meme编译好之后实际测试一下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
# 将驱动模块拷贝到镜像
$ cd ~/varm/os/
$ sudo mount -o loop rootfs.ext3 /mnt
$ sudo cp ../drivers/meme/meme.ko /mnt
$ sudo umount /mnt
$ ./power_on.sh # 启动varm系统

# 以下是qemu虚拟机内操作
/$ insmod meme.ko
meme: loading out-of-tree module taints kernel.
meme init: 250:0 # 👈字符设备注册成功,主设备号250,次设备号0

/$ cat /proc/devices
Character devices:
1 mem
2 pty
...
250 meme # 👈通过/proc/devices也可以看到模块信息
251 rpmb
252 usbmon
253 rtc
...

# 创建设备节点,根据设备号
/$ mknod /dev/meme c 250 0
# 用echo命令写内容到设备节点
/$ echo "I am Philon, I want to be a creator!" >> /dev/meme
# 用cat命令从设备节点读内容
/$ cat /dev/meme
I am Philon, I want to be a creator! # 👈说明读写、开关函数都成功了
4 (?U
?U
?U
444 TT?i????~,?~f??

从上面的操作中可以看到,meme驱动的基本文件操作功能已经具备,之所以最后读出来的内容有乱码,是因为这是一个设备,不是普通文件,该设备强制有0x100的存储空间,每次都会被全部读出来。

小结一下

  • 字符设备是一种通过顺序读写来操作的设备
  • 主设备号表示设备类型,次设备号表示设备实例号
  • file_operations定义了文件操作函数的接口
  • 设备节点是在用户层创建的特殊文件
小小鼓励,大大心意!