澄清一个get_user_pages的事实

get_user_pages的作用是得到用户的页面,作为参数返回,注意,得到的是一个page结构数组而不是别的,这些page最起码 在当前记录着用户进程的数据,一般情况下,内核在调用此函数得到用户页面以后,会再将它们映射到内核空间的一个虚拟地址,然后操作这些页面的数据。这样的话在调用完get_user_pages之后然后映射到内核的的页面就最少在两个地方有映射,一个是用户空间,一个是内核空间。这时问题出来了,这些页面可能会被换出,get_user_pages并没有做任何事情比如锁住页面以保证页面不被换出,在页面换出的时候,用户映射的页表项的存在位会被清除,但是这可能不会通知该页面的内核映射的页表项,如果内核继续读写该页面,那么结果将是错误的,因此,内核不应该长时间的保持get_user_pages的映射,请看下面的例子,在2.6内核的aio中:
...
info->nr_pages = get_user_pages(current, ctx->mm, info->mmap_base, nr_pages, 1, 0, info->ring_pages, NULL);
         up_write(&ctx->mm->mmap_sem);
         if (unlikely(info->nr_pages != nr_pages)) {
                 aio_free_ring(ctx);
                 return -EAGAIN;
         }
         ctx->user_id = info->mmap_base;  //比如执行到这里的时候该进程被抢占,ring_pages[0]被换出,下面的就会是不正确的。(注释1)
         info->nr = nr_events;           /* trusted copy 呵呵,这里的注释很有意思*/
         ring = kmap_atomic(info->ring_pages[0], KM_USER0);  //映射之后,快速拷贝数据
         ring->nr = nr_events;   /* user copy */
         ring->id = ctx->user_id;
         ring->head = ring->tail = 0;
         ring->magic = AIO_RING_MAGIC;
         ring->compat_features = AIO_RING_COMPAT_FEATURES;
         ring->incompat_features = AIO_RING_INCOMPAT_FEATURES;
         ring->header_length = sizeof(struct aio_ring);
         kunmap_atomic(ring, KM_USER0);  //马上解除映射,将出错的机会降低到最小
...
注 释1的意思很明显,虽然在get_user_pages中可能调用get_page增加了页面的引用计数,但是请记住,引用计数的增加仅仅是推迟了页面换 出并没有阻止页面的换出,因为在回收的时候会put_page_testzero以减少计数,get_page增加了页面的引用计数只是说明这个页面“最 近被使用”过,这在lru中被探测。这个告诫到此为止。
内核的设计者之所以没有按照完全完美的方式设计上述代码是因为内核极端复杂,很多行为已经不再是确定性的了,而更多意义上是一种统计性行为,在亿万分之一的出错几率下,如果在损失性能以求完备和最大化性能优势从而冒险二者当中选一的话,百分之九十九的人会选择后者...

原文链接: https://blog.csdn.net/dog250/article/details/5303268

欢迎关注

微信关注下方公众号,第一时间获取干货硬货;公众号内回复【pdf】免费获取数百本计算机经典书籍;

也有高质量的技术群,里面有嵌入式、搜广推等BAT大佬

    澄清一个get_user_pages的事实

原创文章受到原创版权保护。转载请注明出处:https://www.ccppcoding.com/archives/410447

非原创文章文中已经注明原地址,如有侵权,联系删除

关注公众号【高性能架构探索】,第一时间获取最新文章

转载文章受原作者版权保护。转载请注明原作者出处!

(0)
上一篇 2023年4月26日 下午12:01
下一篇 2023年4月26日 下午12:01

相关推荐