驱动函数write-linux系统调用如何实现？

2024-01-02 16:18•linux•阅读 1055

原文链接为http://blog.chinaunix.net/uid-22278460-id-1777665.html

这个文章时间比较早，但是写的内容跟很清晰，值得一看，为了防止以后找不到，我这里重新做了一下排版另外少位添加了一些便于观看的注释。

=以下为引用====

在Linux下我们在使用设备的时候，都会用到write这个函数，通过这个函数我们可以象使用文件那样向设备传送数据。可是为什么用户使用write函数就可以把数据写到设备里面去，这个过程到底是怎么实现的呢？

这个奥秘就在于设备驱动程序的write实现中，这里我结合一些源代码来解释如何使得一个简简单单的write函数能够完成向设备里面写数据的复杂过程。

这里的源代码主要来自两个地方。第一是oreilly出版的《Linux device driver》中的实例，第二是Linux Kernel 2.2.14核心源代码。我只列出了其中相关部分的内容，如果读者有兴趣，也可以查阅其它源代码。不过我不是在讲解如何编写设备驱动程序，所以不会对每一个细节都进行说明，再说有些地方我觉得自己还没有吃透。

由于《Linux device driver》一书中的例子对于我们还是复杂了一些，我将其中的一个例程简化了一下。这个驱动程序支持这样一个设备：核心空间中的一个长度为10的数组kbuf[10]（这个数组会在后面代码中提到，所以请记住它）。我们可以通过用户程序open它，read它，write它，close它。这个设备的名字我称为short_t。

现在言归正传。对于一个设备，它可以在/dev下面存在一个对应的逻辑设备节点，这个节点以文件的形式存在，但它不是普通意义上的文件，它是设备文件，更确切的说，它是设备节点。这个节点是通过mknod命令建立的，其中指定了主设备号和次设备号。主设备号表明了某一类设备，一般对应着确定的驱动程序；次设备号一般是区分是标明不同属性，例如不同的使用方法，不同的位置，不同的操作。这个设备号是从/proc/devices文件中获得的，所以一般是先有驱动程序在内核中，才有设备节点在目录中。这个设备号（特指主设备号）的主要作用，就是声明设备所使用的驱动程序。驱动程序和设备号是一一对应的，当你打开一个设备文件时，操作系统就已经知道这个设备所对应的驱动程序是哪一个了。这个"知道"的过程后面就讲。

我们再说说驱动程序的基本结构吧。这里我只介绍动态模块型驱动程序（就是我们使用insmod加载到核心中并使用rmmod卸载的那种），因为我只熟悉这种结构。模块化的驱动程序由两个函数是固定的：int init_module(void) ；void cleanup_module(void)。前者在insmod的时候执行，后者在rmmod的时候执行。 init_nodule在执行的时候，进行一些驱动程序初始化的工作，其中最主要的工作有三

件：注册设备；申请I/O端口地址范围；申请中断IRQ。这里和我们想知道的事情相关的只

有注册设备。

下面是一个典型的init_module函数：

int init_module(void)
{
        int result = check_region(short_base,1)；/* 察看端口地址*/
        ……
        request_region(short_base,1,"short"); /* 申请端口地址*/
        ……
        result = register_chrdev(short_major, "short", &short_fops); /* 注册设备 */
        ……
        result = request_irq(short_irq, short_interrupt, SA_INTERRUPT, "short", NULL); /* 申请IRQ */
        ……
        return 0;
}/* init_module*/

上面这个函数我只保留了最重要的部分，其中最重要的函数是

result = register_chrdev(short_major, "short", &short_fops);

这是一个驱动程序的精髓所在！！当你执行indmod命令时，这个函数可以完成三件大事：第一，申请主设备号(short_major)，或者指定，或者动态分配；第二，在内核中注册设备的名字("short")；第三，指定fops方法(&short_fops)。其中所指定的fops方法就是我们对设备进行操作的方法（例如read,write,seek,dir,open,release等），如何实现这些方法，是编写设备驱动程序大部分工作量所在。

现在我们就要接触关键部分了--如何实现fops方法。我们都知道，每一个文件都有一个file的结构，在这个结构中有一个file_operations的结构体，这个结构体指明了能够对该文件进行的操作。

下面是一个典型的file_operations结构：

struct file_operations 
{
        loff_t        (*llseek)   (struct file *, loff_t, int);
        ssize_t       (*read)     (struct file *, char *, size_t, loff_t *);
        ssize_t       (*write)    (struct file *, const char *, size_t, loff_t *);    /* attention!! */
        int           (*readdir)  (struct file *, void *, filldir_t);
        unsigned int  (*poll)     (struct file *, struct poll_table_struct *);
        int           (*ioctl)    (struct inode *, struct file *, unsigned int, unsigned long);
        int           (*mmap)     (struct file *, struct vm_area_struct *);
        int           (*open)     (struct inode *, struct file *);
        int           (*flush)    (struct file *);
        int           (*release)  (struct inode *, struct file *);
        int           (*fsync)    (struct file *, struct dentry *);
        int           (*fasync)   (int, struct file *, int);
        int           (*check_media_change) (kdev_t dev);
        int           (*revalidate)         (kdev_t dev);
        int           (*lock)      (struct file *, int, struct file_lock *);
};/* 这个版本略微有些旧 */

/* 在网上找到的一个新一些的版本 详细用法参考链接https://blog.csdn.net/littlelee111/article/details/10133759  */
struct file_operations {
        struct module *owner;
        loff_t        (*llseek)    (struct file *, loff_t, int);
        ssize_t       (*read)      (struct file *, char __user *, size_t, loff_t *);
        ssize_t       (*write)     (struct file *, const char __user *, size_t, loff_t *);   /* attention!! */
        ssize_t       (*aio_read)  (struct kiocb *, const struct iovec *, unsigned long, loff_t);
        ssize_t       (*aio_write) (struct kiocb *, const struct iovec *, unsigned long, loff_t);
        int           (*readdir)   (struct file *, void *, filldir_t);
        unsigned int  (*poll)      (struct file *, struct poll_table_struct *);
        long          (*unlocked_ioctl) (struct file *, unsigned int, unsigned long);
        long          (*compat_ioctl)   (struct file *, unsigned int, unsigned long);
        int           (*mmap)      (struct file *, struct vm_area_struct *);
        int           (*open)      (struct inode *, struct file *);
        int           (*flush)     (struct file *, fl_owner_t id);
        int           (*release)   (struct inode *, struct file *);
        int           (*fsync)     (struct file *, loff_t, loff_t, int datasync);
        int           (*aio_fsync) (struct kiocb *, int datasync);
        int           (*fasync)    (int, struct file *, int);
        int           (*lock)      (struct file *, int, struct file_lock *);
        ssize_t       (*sendpage)  (struct file *, struct page *, int, size_t, loff_t *, int);
        unsigned long (*get_unmapped_area) (struct file *, unsigned long, unsigned long, unsigned long, unsigned long);
        int           (*check_flags) (int);
        int           (*flock)       (struct file *, int, struct file_lock *);
        ssize_t       (*splice_write)(struct pipe_inode_info *, struct file *, loff_t *, size_t, unsigned int);
        ssize_t       (*splice_read) (struct file *, loff_t *, struct pipe_inode_info *, size_t, unsigned int);
        int           (*setlease)    (struct file *, long, struct file_lock **);
        long          (*fallocate)   (struct file *file, int mode, loff_t offset,loff_t len);
        int           (*show_fdinfo) (struct seq_file *m, struct file *f);
};

我们可以看到它实际上就是许多文件操作的函数指针，其中就有write，其它的我们就不去管它了。这个write指针在实际的驱动程序中会以程序员所实现的函数名字出现，它指向程序员实现的设备write操作函数。下面就是一个实际的例子，这个write函数可以向核心内存的一个数组里输入一个字符串。

int short_write (struct inode *inode, struct file *filp, const char *buf, int count)
{
        int retval = count;
        extern unsigned char kbuf[10]; //这就是前文提到的设备核心空间

        if(count>10)
            count=10;
        copy_from_user(kbuf, buf, count);
        return retval;
        
}/* short_write */

设备short_t对应的fops方法是这样声明的：

struct file_operations short_fops = {
        NULL,       /* short_lseek */
        short_read,
        short_write,
        NULL,       /* short_readdir */
        NULL,       /* short_poll */
        NULL,       /* short_ioctl */
        NULL,       /* short_mmap */
        short_open,
        short_release,
        NULL,       /* short_fsync */
        NULL,       /* short_fasync */
        /* nothing more, fill with NULLs */
};

其中NULL的项目就是不提供这个功能。所以我们可以看出short_t设备只提供了read,write,open,release功能。其中write功能我们在上面已经实现了，具体的实现函数起名为short_write。这些函数就是真正对设备进行操作的函数，这就是驱动程序的一大好处：不管你实现的时候是多么的复杂，但对用户来看，就是那些常用的文件操作函数。

但是我们可以看到，驱动程序里的write函数和用户程序中的write函数参数个数是不同的，函数格式如下：

/* 早一些的版本 */
short_write(struct inode *inode, struct file *filp, const char *buf, int count) //驱动程序里的write函数有四个参数

/* 后来的版本 */
ssize_t  (*write) (struct file *, const char __user *, size_t, loff_t *); //驱动程序里定义的write函数有四个参数

write(inf fd, char *buf, int count)//用户程序中的write函数有三个参数

那他们两个是怎么联系在一起的呢？这就要靠操作系统核心中的函数sys_write了，下面是Linux Kernel 2.2.14中sys_write中的源代码：

asmlinkage ssize_t sys_write(unsigned int fd, const char * buf, size_t count)
{
        ssize_t ret;
        struct file * file;
        struct inode * inode;
        ssize_t (*write)(struct file *, const char *, size_t, loff_t *); /* 指向驱动程序中的wirte函数的指针*/

        lock_kernel();
        ret = -EBADF;
        file = fget(fd); /* 通过文件描述符得到文件指针 */
        
        if (!file)
            goto bad_file;
                
        if (!(file->f_mode & FMODE_WRITE))
            goto out;
                
        inode = file->f_dentry->d_inode; /* 得到inode信息 */
        ret = locks_verify_area(FLOCK_VERIFY_WRITE, inode, file, file->f_pos, count);
        
        if (ret)
            goto out;
                
        ret = -EINVAL;
        
        if (!file->f_op || !(write = file->f_op->write)) /* 将函数开始时声明的write函数指针指向fops方法中对应的write函数 */
            goto out;
        down(&inode->i_sem);
        
        ret = write(file, buf, count, &file->f_pos); /* 使用驱动程序中的write函数将数据输入设备，注意看，这里就是四个参数了 */
        
        up(&inode->i_sem);
        
        out:
            fput(file);
                
        bad_file:
            unlock_kernel();
                
        return ret;
}

我写了一个简单的程序来测试这个驱动程序，该程序源代码节选如下（该省的我都省了）：

int main()
{
        int fd,count=0;
        unsigned char buf[10];
        
        fd=open("/dev/short_t",O_RDWR);
        printf("input string:");
        scanf("%s",buf);
        count=strlen(buf);
        
        if(count>10)
            count=10;
        count=write(fd,buf,count);
        close(fd);
        return 1;
}

现在我们就演示一下用户使用write函数将数据写到设备里面这个过程到底是怎么实现的：

1，insmod驱动程序。驱动程序申请设备名和主设备号，这些可以在/proc/devieces中获得。

2，从/proc/devices中获得主设备号，并使用mknod命令建立设备节点文件。这是通过主设备号将设备节点文件和设备驱动程序联系在一起。设备节点文件中的file属性中指明了驱动程序中fops方法实现的函数指针。

3，用户程序使用open打开设备节点文件，这时操作系统内核知道该驱动程序工作了，就调用fops方法中的open函数进行相应的工作。open方法一般返回的是文件标示符，实际上并不是直接对它进行操作的，而是有操作系统的系统调用在背后工作。

4，当用户使用write函数操作设备文件时，操作系统调用sys_write函数，该函数首先通过文件标示符得到设备节点文件对应的inode指针和flip指针。inode指针中有设备号信息，能够告诉操作系统应该使用哪一个设备驱动程序，flip指针中有fops信息，可以告诉操作系统相应的fops方法函数在那里可以找到。

5，然后这时sys_write才会调用驱动程序中的write方法来对设备进行写的操作。其中1-3都是在用户空间进行的，4-5是在核心空间进行的。用户的write函数和操作系统的write函数通过系统调用sys_write联系在了一起。

总的来说：设备文件通过设备号绑定了设备驱动，fops绑定了应用层的write和驱动层的write。当应用层写一个设备文件的时候，系统找到对应的设备驱动，再通过fops找到对应的驱动write函数。

以上引用结束==============

这篇文章其实原本的函数描述略有些问题，本文已经做了略微的修改，希望没有违背原作者的心意，但是关于write的一条线索从驱动到内核到应用层都贯穿起来，写的很清晰明了，值得一读，思路清晰。

上一篇 »Linux 驱动开发
下一篇 »linux下的python如何使用tab键补全？

驱动函数write-linux系统调用如何实现？

相关推荐

Linux 内核源码分析 -- chroot

java input 实现调用手机相机和本地照片上传图片到服务器然后压缩

在Ubuntu上为Android增加硬件抽象层，HAL模块访问Linux内核驱动程序 .转载

在Ubuntu上为Android系统编写Linux内核驱动程序

Linux系统如何增加SWAP分区大小？

如何在不使用系统函数的情况下实现PHP中数组系统函数的功能？

Linux系统常用API总结

vi is failed with error "E382: Cannot write, 'buftype' option is set" in Linux