0%

Linux 的 initcall函数

kernel启动调用流程:
start_kernel -> rest_init -> kernel_thread -> init -> do_basic_setup -> do_initcalls

module_init

/* initcalls are now grouped by functionality into separate                   
 * subsections. Ordering inside the subsections is determined                 
 * by link order.                                                             
 * For backwards compatibility, initcall() puts the call in                   
 * the device init subsection.                                                
 *                                                                            
 * The `id' arg to __define_initcall() is needed so that multiple initcalls                                                        
 * can point at the same handler without causing duplicate-symbol build errors.
 */                                                                           

#define __define_initcall(level,fn,id) \                                      
    static initcall_t __initcall_##fn##id __used \                            
    __attribute__((__section__(".initcall" level ".init"))) = fn              

#define core_initcall(fn)       __define_initcall("1",fn,1)                   
#define postcore_initcall(fn)   __define_initcall("2",fn,2)               
#define arch_initcall(fn)       __define_initcall("3",fn,3)                   
#define subsys_initcall(fn)     __define_initcall("4",fn,4)                   
#define fs_initcall(fn)         __define_initcall("5",fn,5)                   
#define rootfs_initcall(fn)     __define_initcall("rootfs",fn,rootfs)         
#define device_initcall(fn)     __define_initcall("6",fn,6)                   
#define late_initcall(fn)       __define_initcall("7",fn,7)                   

#define __initcall(fn) device_initcall(fn)                             

/**                                                                           
 * module_init() - driver initialization entry point                          
 * @x: function to be run at kernel boot time or module insertion             
 *                                                                            
 * module_init() will either be called during do_initcalls() (if              
 * builtin) or at module insertion time (if a module).  There can only        
 * be one per module.                                                         
 */                                                                           
#define module_init(x)  __initcall(x);         

可以发现这些 *_initcall(fn) 最终都是通过 __define_initcall(level,fn) 宏定义生成的。

#define __define_initcall(level,fn,id) \                                      
    static initcall_t __initcall_##fn##id __used \                            
    __attribute__((__section__(".initcall" level ".init"))) = fn              

定义一个 initcall_t 型的初始化函数,函数存放在 .initcall”level”.init section内。
.initcall”level”.init section定义在vmlinux.lds内。

__initcall_start__initcall_end 定义在vmlinux.lds内,表示 initcall section 的起始和结束地址。

__initcall_start = .;
*(.initcall1.init)
*(.initcall2.init)
*(.initcall3.init)
*(.initcall4.init)
*(.initcall5.init)
*(.initcallrootfs.init)
*(.initcall6.init)
*(.initcall7.init)
__initcall_end = .;

正好包括了上面 init.h 里定义的从 core_initcalllate_initcall 等7个level等级的 .initcall”level”.init section.
因此通过不同的 *_initcall 声明的函数指针最终都会存放不同level等级的 .initcall”level”.init section 内。
这些不同level的section按level等级高低依次存放。

do_initcalls

kernel启动调用流程:

start_kernel -> rest_init -> kernel_thread -> init -> do_basic_setup -> do_initcalls

static void noinline __init_refok rest_init(void)                             
    __releases(kernel_lock)                                                   
{                                                                             
    int pid;                                                                  

    kernel_thread(kernel_init, NULL, CLONE_FS | CLONE_SIGHAND);               
    numa_default_policy();                                                    
    pid = kernel_thread(kthreadd, NULL, CLONE_FS | CLONE_FILES);              
    kthreadd_task = find_task_by_pid_ns(pid, &init_pid_ns);                   
    unlock_kernel();                                                          

    /*                                                                        
     * The boot idle thread must execute schedule()                           
     * at least once to get things moving:                                    
     */                                                                       
    init_idle_bootup_task(current);                                           
    preempt_enable_no_resched();                                              
    schedule();                                                               
    preempt_disable();                                                        

    /* Call into cpu_idle with preempt disabled */                            
    cpu_idle();                                                               
}                    

通过 kernel_thread 创建一个内核线程执行init函数。
其实这里创建的即Linux的1号进程(init进程), 为linux中所有其他进程的父进程。

static void __init do_initcalls(void)                                         
{                                                                             
    initcall_t *call;                                                         

    for (call = __early_initcall_end; call < __initcall_end; call++)                                                               
        do_one_initcall(*call);                                               

    /* Make sure there is no pending stuff from the initcall sequence */      
    flush_scheduled_work();                                                   
}                                                                             

__initcall_start__initcall_end 定义在 vmlinux.lds 内,表示 initcall section 的起始和结束地址。

依次循环调用预先存储在 initcall section 内的所有各个级别的初始化函数。

tips

rest_init 函数原型:

static void noinline __init_refok rest_init(void)                             
    __releases(kernel_lock)       

其中 __releases(kernel_lock) 用于kernel代码静态检测

Sparse 诞生于 2004 年, 是由linux之父开发的, 目的就是提供一个静态检查代码的工具, 从而减少linux内核的隐患.

内核代码中还有一个简略的关于 Sparse的说明文件: Documentation/sparse.txt

Sparse通过 gcc 的扩展属性 __attribute__ 以及自己定义的 __context__ 来对代码进行静态检查.

  • __acquires(x) __attribute__((context(x, 0, 1))) 参数x 在执行前引用计数必须是0,执行后,引用计数必须为1
  • __releases(x) __attribute__((context(x, 1, 0)))__acquires(x) 相反
  • __acquire(x) __context__(x, 1) 参数x 的引用计数 + 1
  • __release(x) __context__(x, -1)__acquire(x) 相反

其中 __acquires(x)__releases(x), __acquire(x)__release(x) 必须配对使用, 否则 Sparse 会给出警告

void __lockfunc _raw_spin_lock(raw_spinlock_t *lock) __acquires(lock);
void __lockfunc _raw_spin_unlock(raw_spinlock_t *lock) __releases(lock);
# define __acquires(x) __attribute__((context(x,0,1)))
# define __releases(x) __attribute__((context(x,1,0)))