一切的体系调用,根据都能够在它的名字前加上“sys_”前缀,这便是它在内核中对应的函数。比方体系调用open、read、write、poll,与之对应的内核函数为:sys_open、sys_read、sys_write、sys_poll。
一、内核结构:
关于体系调用poll或select,它们对应的内核函数都是sys_poll。剖析sys_poll,即可了解poll机制。
1. sys_poll函数坐落fs/select.c文件中,代码如下:
asmlinkage long sys_poll(struct pollfd __user *ufds, unsigned int nfds,
long timeout_msecs)
{
s64 TImeout_jiffies;
if (timeout_msecs > 0) {
#if HZ > 1000
/* We can only overflow if HZ > 1000 */
if (timeout_msecs / 1000 > (s64)0x7fffffffffffffffULL / (s64)HZ)
TImeout_jiffies = -1;
else
#endif
TImeout_jiffies = msecs_to_jiffies(TImeout_msecs);
} else {
/* Infinite (< 0) or no (0) timeout */
timeout_jiffies = timeout_msecs;
}
return do_sys_poll(ufds, nfds, &timeout_jiffies);
}
它对超时参数稍作处理后,直接调用do_sys_poll。
2. do_sys_poll函数也坐落坐落fs/select.c文件中,咱们疏忽其他代码:
int do_sys_poll(struct pollfd __user *ufds, unsigned int nfds, s64 *timeout)
{
……
poll_initwait(&table);
……
fdcount = do_poll(nfds, head, &table, timeout);
……
}
poll_initwait函数十分简略,它初始化一个poll_wqueues变量table:
poll_initwait > init_poll_funcptr(&pwq->pt, __pollwait); > pt->qproc = qproc;
即table->pt->qproc = __pollwait,__pollwait将在驱动的poll函数里用到。
3. do_sys_poll函数坐落fs/select.c文件中,代码如下:
static int do_poll(unsigned int nfds, struct poll_list *list,
struct poll_wqueues *wait, s64 *timeout)
{
01 ……
02 for (;;) {
03 ……
04 if (do_pollfd(pfd, pt)) {
05 count++;
06 pt = NULL;
07 }
08 ……
09 if (count || !*timeout || signal_pending(current))
10 break;
11 count = wait->error;
12 if (count)
13 break;
14
15 if (*timeout < 0) {
16 /* Wait indefinitely */
17 __timeout = MAX_SCHEDULE_TIMEOUT;
18 } else if (unlikely(*timeout >= (s64)MAX_SCHEDULE_TIMEOUT-1)) {
19 /*
20 * Wait for longer than MAX_SCHEDULE_TIMEOUT. Do it in
21 * a loop
22 */
23 __timeout = MAX_SCHEDULE_TIMEOUT – 1;
24 *timeout -= __timeout;
25 } else {
26 __timeout = *timeout;
27 *timeout = 0;
28 }
29
30 __timeout = schedule_timeout(__timeout);
31 if (*timeout >= 0)
32 *timeout += __timeout;
33 }
34 __set_current_state(TASK_RUNNING);
35 return count;
36 }
剖析其间的代码,能够发现,它的效果如下:
① 从02行能够知道,这是个循环,它退出的条件为:
a. 09行的3个条件之一(count非0,超时、有信号等候处理)
count顺0表明04行的do_pollfd至少有一个成功。
b. 11、12行:产生过错
② 重点在do_pollfd函数,后边再剖析
③ 第30行,让本进程休眠一段时刻,留意:应用程序履行poll调用后,假如①②的条件不满足,进程就会进入休眠。那么,谁唤醒呢?除了休眠到指定时刻被体系唤醒外,还能够被驱动程序唤醒──记住这点,这便是为什么驱动的poll里要调用poll_wait的原因,后边剖析。
4. do_pollfd函数坐落fs/select.c文件中,代码如下:
static inline unsigned int do_pollfd(struct pollfd *pollfd, poll_table *pwait)
{
……
if (file->f_op && file->f_op->poll)
mask = file->f_op->poll(file, pwait);
……
}
可见,它便是调用咱们的驱动程序里注册的poll函数。
二、驱动程序:
驱动程序里与poll相关的当地有两处:一是结构file_operation结构时,要界说自己的poll函数。二是经过poll_wait来调用上面提到的__pollwait函数,pollwait的代码如下:
static inline void poll_wait(struct file * filp, wait_queue_head_t * wait_address, poll_table *p)
{
if (p && wait_address)
p->qproc(filp, wait_address, p);
}
p->qproc便是__pollwait函数,从它的代码可知,它仅仅把当时进程挂入咱们驱动程序里界说的一个行列里罢了。它的代码如下:
static void __pollwait(struct file *filp, wait_queue_head_t *wait_address,
poll_table *p)
{
struct poll_table_entry *entry = poll_get_entry(p);
if (!entry)
return;
get_file(filp);
entry->filp = filp;
entry->wait_address = wait_address;
init_waitqueue_entry(&entry->wait, current);
add_wait_queue(wait_address, &entry->wait);
}
履行到驱动程序的poll_wait函数时,进程并没有休眠,咱们的驱动程序里完成的poll函数是不会引起休眠的。让进程进入休眠,是前面剖析的do_sys_poll函数的30行“__timeout = schedule_timeout(__timeout)”。
poll_wait仅仅把本进程挂入某个行列,应用程序调用poll > sys_poll > do_sys_poll > poll_initwait,do_poll > do_pollfd > 咱们自己写的poll函数后,再调用schedule_timeout进入休眠。假如咱们的驱动程序发现情况安排妥当,能够把这个行列上挂着的进程唤醒。可见,poll_wait的效果,仅仅为了让驱动程序能找到要唤醒的进程。即便不必poll_wait,咱们的程序也有机会被唤醒:chedule_timeout(__timeout),仅仅休眠__time_out这段时刻。
现在来总结一下poll机制:
1. poll > sys_poll > do_sys_poll > poll_initwait,poll_initwait函数注册一下回调函数__pollwait,它便是咱们的驱动程序履行poll_wait时,真正被调用的函数。
2. 接下来履行file->f_op->poll,即咱们驱动程序里自己完成的poll函数
它会调用poll_wait把自己挂入某个行列,这个行列也是咱们的驱动自己界说的;
它还判别一下设备是否安排妥当。
3. 假如设备未安排妥当,do_sys_poll里会让进程休眠必定时刻
4. 进程被唤醒的条件有2:一是上面说的“必定时刻”到了,二是被驱动程序唤醒。驱动程序发现条件安排妥当时,就把“某个行列”上挂着的进程唤醒,这个行列,便是前面经过poll_wait把本进程挂过去的行列。
5. 假如驱动程序没有去唤醒进程,那么chedule_timeout(__timeou)超时后,会重复2、3动作,直到应用程序的poll调用传入的时刻抵达。