宝塔服务器面板,一键全能部署及管理,送你10850元礼包,点我领取

 一、首先需要看一下这两个函数的作用:

1 #include <unistd.h>
2 
3 int dup(int oldfd);
4 int dup2(int oldfd, int newfd);

根据manual的解释:

dup:创建一份oldfd的拷贝,使用最小的文件描述符作为新的文件描述符。

dup2:创建一份oldfd的拷贝,使用指定的newfd作为新的文件描述符。

要看这两个函数是怎么实现的,首先得知道Linux对于文件描述符是怎么处理的,参考这篇文章

二、分析dup

1 static inline long
2 dup (int fd)
3 {
4     return sys_dup(fd);
5 }

这里看到dup调用了函数sys_dup。

1 asmlinkage long sys_dup(unsigned int fildes)
2 {
3     int ret = -EBADF;
4     struct file * file = fget(fildes);
5 
6     if (file)
7         ret = dupfd(file, 0);
8     return ret;
9 }

在sys_dup函数中,关键的就是两步,fget获取指定文件描述符的struct file指针,然后调用dupfd,至于dupfd的具体实现,我们接着往下走。

 1 struct file fastcall *fget(unsigned int fd)
 2 {
 3     struct file *file;
 4     struct files_struct *files = current->files;
 5 
 6     spin_lock(&files->file_lock);
 7     file = fcheck_files(files, fd);
 8     if (file)
 9         get_file(file);
10     spin_unlock(&files->file_lock);
11     return file;
12 }

可以看到fget函数的实现就是首先获取一个files_struct指针,我们知道files_struct保存了所有打开文件信息(其中current是当前进程的struct task_struct指针),然后加锁,调用fcheck_files,获取file指针,如果file不为空,则调用get_file,下面我们看下这两个函数的实现。

 1 static inline struct file * fcheck_files(struct files_struct *files, unsigned int fd)
 2 {
 3     struct file * file = NULL;
 4 
 5     if (fd < files->max_fds)
 6         file = files->fd[fd];
 7     return file;
 8 }
 9 
10 #define get_file(x)    atomic_inc(&(x)->f_count)

现在已经可以知道,fcheck_files函数的具体步骤是首先判断给定的文件描述符fd是否小于最大文件描述符max_fds,如果小于,则返回fd数组中对应该fd下标的指针。

get_file的作用是原子的增加f_count,也就是该文件的引用计数(在close的时候会减这个值)。

现在再回到sys_dup中,看一下dumfd的实现。

 1 static int dupfd(struct file *file, unsigned int start)
 2 {
 3     struct files_struct * files = current->files;
 4     int fd;
 5 
 6     spin_lock(&files->file_lock);
 7     fd = locate_fd(files, file, start);
 8     if (fd >= 0) {
 9         FD_SET(fd, files->open_fds);
10         FD_CLR(fd, files->close_on_exec);
11         spin_unlock(&files->file_lock);
12         fd_install(fd, file);
13     } else {
14         spin_unlock(&files->file_lock);
15         fput(file);
16     }
17 
18     return fd;
19 }

该函数的具体步骤如下:

1、通过current->files获取struct files_struct指针。

2、加锁,完成后会解锁。

3、调用locate_fd函数获取一个fd,具体获取规则下面再看。

4、如果获取到的fd>=0,则调用FD_SET、FD_CLR、解锁、fd_install。关键在于fd_install;否则调用解锁、fput。

下面再看一下locate_fd、fd_install、fput的实现。

 1 /*
 2  * locate_fd finds a free file descriptor in the open_fds fdset,
 3  * expanding the fd arrays if necessary.  Must be called with the
 4  * file_lock held for write.
 5  */
 6 
 7 static int locate_fd(struct files_struct *files, 
 8                 struct file *file, unsigned int orig_start)
 9 {
10     unsigned int newfd;
11     unsigned int start;
12     int error;
13 
14     error = -EINVAL;
15     if (orig_start >= current->signal->rlim[RLIMIT_NOFILE].rlim_cur)
16         goto out;
17 
18 repeat:
19     /*
20      * Someone might have closed fd's in the range
21      * orig_start..files->next_fd
22      */
23     start = orig_start;
24     if (start < files->next_fd)
25         start = files->next_fd;
26 
27     newfd = start;
28     if (start < files->max_fdset) {
29         newfd = find_next_zero_bit(files->open_fds->fds_bits,
30             files->max_fdset, start);
31     }
32     
33     error = -EMFILE;
34     if (newfd >= current->signal->rlim[RLIMIT_NOFILE].rlim_cur)
35         goto out;
36 
37     error = expand_files(files, newfd);
38     if (error < 0)
39         goto out;
40 
41     /*
42      * If we needed to expand the fs array we
43      * might have blocked - try again.
44      */
45     if (error)
46         goto repeat;
47 
48     if (start <= files->next_fd)
49         files->next_fd = newfd + 1;
50     
51     error = newfd;
52     
53 out:
54     return error;
55 }

根据该函数的注释即可知道它的所用就是:找到一个没有被使用的文件描述符,从start开始(这里就是dup和dup2的区别所在)。

 1 /*
 2  * Install a file pointer in the fd array.  
 3  *
 4  * The VFS is full of places where we drop the files lock between
 5  * setting the open_fds bitmap and installing the file in the file
 6  * array.  At any such point, we are vulnerable to a dup2() race
 7  * installing a file in the array before us.  We need to detect this and
 8  * fput() the struct file we are about to overwrite in this case.
 9  *
10  * It should never happen - if we allow dup2() do it, _really_ bad things
11  * will follow.
12  */
13 
14 void fastcall fd_install(unsigned int fd, struct file * file)
15 {
16     struct files_struct *files = current->files;
17     spin_lock(&files->file_lock);
18     if (unlikely(files->fd[fd] != NULL))
19         BUG();
20     files->fd[fd] = file;
21     spin_unlock(&files->file_lock);
22 }

fd_install的作用就是把fd指针数组对应fd下标的指针赋值为file。

到此回到dupfd,返回获取的fd,这就是新的拷贝,然后sys_dup就返回该值。

三、dup2

dup2的实现跟dup类似,关键的差别就是dup2返回指定的newfd,dup返回最小可用的fd。