1. kernel运转的史前时期和内存布局
在arm渠道下,zImage.bin紧缩镜像是由bootloader加载到物理内存,然后跳到zImage.bin里一段程序,它专门于将被紧缩的kernel解紧缩到KERNEL_RAM_PADDR开端的一段内存中,接着跳进真实的kernel去履行。该kernel的履行起点是stext函数,界说于arch/arm/kernel/head.S。
在剖析stext函数前,先介绍此刻内存的布局如下图所示
在开发板tqs3c2440中,SDRAM连接到内存操控器的Bank6中,它的开端内存地址是0x30000000,巨细为64M,即0x20000000。 ARM Linux kernel将SDRAM的开端地址界说为PHYS_OFFSET。经bootloader加载kernel并由自解压部分代码运转后,终究kernel被放置到KERNEL_RAM_PADDR(=PHYS_OFFSET + TEXT_OFFSET,即0x30008000)地址上的一段内存,经此放置后,kernel代码今后均不会被移动。
在进入kernel代码前,即bootloader和自解紧缩阶段,ARM未敞开MMU功用。因而kernel发动代码一个重要功用是设置好相应的页表,并敞开MMU功用。为了支撑MMU功用,kernel镜像中的一切符号,包含代码段和数据段的符号,在链接时都生成了它在敞开MMU时,地点物理内存地址映射到的虚拟内存地址。
以arm kernel第一个符号(函数)stext为例,在编译链接,它生成的虚拟地址是0xc0008000,而放置它的物理地址为0x30008000(还记得这是PHYS_OFFSET+TEXT_OFFSET吗?)。实际上这个改换能够运用简略的公式进行标明:va = pa – PHYS_OFFSET + PAGE_OFFSET。Arm linux终究的kernel空间的页表,便是依照这个联系来树立。
之所以较早提及arm linux 的内存映射,原因是在进入kernel代码,里边一切符号地址值为清一色的0xCXXXXXXX地址,而此刻ARM未敞开MMU功用,故在履行stext函数第一条履行时,它的PC值便是stext地点的内存地址(即物理地址,0x30008000)。因而,下面有些代码,需求运用地址无关技能。
2.一览stext函数
stext函数界说在Arch/arm/kernel/head.S,它的功用是获取处理器类型和机器类型信息,并创立暂时的页表,然后敞开MMU功用,并跳进第一个C言语函数start_kernel。
stext函数的在前置条件是:MMU, D-cache, 封闭; r0 = 0, r1 = machine nr, r2 = atags prointer.
代码如下:
- .section”.text.head”,”ax”
- (stext)
- /*设置CPU运转形式为SVC,并关中止*/
- msrcpsr_c,#PSR_F_BIT|PSR_I_BIT|SVC_MODE@ensuresvcmode
- @andirqsdisabled
- mrcp15,0,r9,c0,c0@getprocessorid
- bl__lookup_processor_type@r5=procinfor9=cupid
- /*r10指向cpu对应的proc_info记载*/
- movsr10,r5@invalidprocessor(r5=0)?
- beq__error_p@yes,errorp
- bl__lookup_machine_type@r5=machinfo
- /*r8指向开发板对应的arch_info记载*/
- movsr8,r5@invalidmachine(r5=0)?
- beq__error_a@yes,errora
- /*__vet_atags函数触及bootloader造知kernel物理内存的状况,咱们暂时不剖析它。*/
- bl__vet_atags
- /*创立暂时页表*/
- bl__create_page_tables
- /*
- *ThefollowingcallsCPUspecificcodeinapositionindependent
- *manner.Seearch/arm/mm/proc-*.Sfordetails.r10=baseof
- *xxx_proc_infostructureselectedby__lookup_machine_type
- *above.Onreturn,theCPUwillbereadyfortheMMUtobe
- *turnedon,andr0willholdtheCPUcontrolregistervalue.
- */
- /*这儿的逻辑联系适当杂乱,先是从proc_info结构中的中跳进__arm920_setup函数,
- *然后执__enable_mmu函数。最终在__enable_mmu函数经过movpc,r13来履行__switch_data,
- *__switch_data函数在最终一条句子,鱼跃龙门,跳进第一个C言语函数start_kernel。
- */
- ldrr13,__switch_data@addresstojumptoafter
- @mmuhasbeenenabled
- adrlr,__enable_mmu@return(PIC)address
- addpc,r10,#PROCINFO_INITFUNC
- OC(stext)
- .section”.text.head”,”ax”
- (stext)
- /*设置CPU运转形式为SVC,并关中止*/
- msrcpsr_c,#PSR_F_BIT|PSR_I_BIT|SVC_MODE@ensuresvcmode
- @andirqsdisabled
- mrcp15,0,r9,c0,c0@getprocessorid
- bl__lookup_processor_type@r5=procinfor9=cupid
- /*r10指向cpu对应的proc_info记载*/
- movsr10,r5@invalidprocessor(r5=0)?
- beq__error_p@yes,errorp
- bl__lookup_machine_type@r5=machinfo
- /*r8指向开发板对应的arch_info记载*/
- movsr8,r5@invalidmachine(r5=0)?
- beq__error_a@yes,errora
- /*__vet_atags函数触及bootloader造知kernel物理内存的状况,咱们暂时不剖析它。*/
- bl__vet_atags
- /*创立暂时页表*/
- bl__create_page_tables
- /*
- *ThefollowingcallsCPUspecificcodeinapositionindependent
- *manner.Seearch/arm/mm/proc-*.Sfordetails.r10=baseof
- *xxx_proc_infostructureselectedby__lookup_machine_type
- *above.Onreturn,theCPUwillbereadyfortheMMUtobe
- *turnedon,andr0willholdtheCPUcontrolregistervalue.
- */
- /*这儿的逻辑联系适当杂乱,先是从proc_info结构中的中跳进__arm920_setup函数,
- *然后执__enable_mmu函数。最终在__enable_mmu函数经过movpc,r13来履行__switch_data,
- *__switch_data函数在最终一条句子,鱼跃龙门,跳进第一个C言语函数start_kernel。
- */
- ldrr13,__switch_data@addresstojumptoafter
- @mmuhasbeenenabled
- adrlr,__enable_mmu@return(PIC)address
- addpc,r10,#PROCINFO_INITFUNC
- OC(stext)
3 __lookup_processor_type 函数
__lookup_processor_type 函数是一个十分考究技巧的函数,假如你将它体会,也将体会kernel了一些魔法。
Kernel代码将一切CPU信息的界说都放到.proc.info.init段中,因而能够以为.proc.info.init段便是一个数组,每个元素都界说了一个或一种CPU的信息。现在__lookup_processor_type运用该元素的前两个字段cpuid和mask来匹配当时CPUID,假如满意CPUID & mask == cpuid,则找到当时cpu的界说并回来。
下面是tqs3c2440开发板,CPU的界说信息,cpuid = 0x41009200,mask = 0xff00fff0。假如是码是运转在tqs3c2440开发板上,那么函数回来下面的界说:
- .section”.proc.info.init”,#alloc,#execinstr
- .type__arm920_proc_info,#object
- __arm920_proc_info:
- .long0x41009200
- .long0xff00fff0
- .longPMD_TYPE_SECT|\
- PMD_SECT_BUFFERABLE|\
- PMD_SECT_CACHEABLE|\
- PMD_BIT4|\
- PMD_SECT_AP_WRITE|\
- PMD_SECT_AP_READ
- .longPMD_TYPE_SECT|\
- PMD_BIT4|\
- PMD_SECT_AP_WRITE|\
- PMD_SECT_AP_READ
- /*__arm920_setup函数在stext的未尾被调用,请往回看。*/
- b__arm920_setup
- .longcpu_arch_name
- .longcpu_elf_name
- .longHWCAP_SWP|HWCAP_HALF|HWCAP_THUMB
- .longcpu_arm920_name
- .longarm920_processor_functions
- .longv4wbi_tlb_fns
- .longv4wb_user_fns
- #ifndefCONFIG_CPU_DCACHE_WRITETHROUGH
- .longarm920_cache_fns
- #else
- .longv4wt_cache_fns
- #endif
- .size__arm920_proc_info,.-__arm920_proc_info
- .section”.proc.info.init”,#alloc,#execinstr
- .type__arm920_proc_info,#object
- __arm920_proc_info:
- .long0x41009200
- .long0xff00fff0
- .longPMD_TYPE_SECT|\
- PMD_SECT_BUFFERABLE|\
- PMD_SECT_CACHEABLE|\
- PMD_BIT4|\
- PMD_SECT_AP_WRITE|\
- PMD_SECT_AP_READ
- .longPMD_TYPE_SECT|\
- PMD_BIT4|\
- PMD_SECT_AP_WRITE|\
- PMD_SECT_AP_READ
- /*__arm920_setup函数在stext的未尾被调用,请往回看。*/
- b__arm920_setup
- .longcpu_arch_name
- .longcpu_elf_name
- .longHWCAP_SWP|HWCAP_HALF|HWCAP_THUMB
- .longcpu_arm920_name
- .longarm920_processor_functions
- .longv4wbi_tlb_fns
- .longv4wb_user_fns
- #ifndefCONFIG_CPU_DCACHE_WRITETHROUGH
- .longarm920_cache_fns
- #else
- .longv4wt_cache_fns
- #endif
- .size__arm920_proc_info,.-__arm920_proc_info
- /*
- *ReadprocessorIDregister(CP#15,CR0),andlookupinthelinker-built
- *supportedprocessorlist.Notethatwecantusetheabsoluteaddresses
- *forthe__proc_infolistssincewearentrunningwiththeMMUon
- *(andtherefore,wearenotinthecorrectaddressspace).Wehaveto
- *calculatetheoffset.
- *
- *r9=cpuid
- *Returns:
- *r3,r4,r6corrupted
- *r5=proc_infopointerinphysicaladdressspace
- *r9=cpuid(preserved)
- */
- __lookup_processor_type:
- /*adr是相对寻址,它的寻核算成果是将当时PC值加上3f符号与PC的偏移量,
- *而PC是物理地址,因而r3的成果也是3f符号的物理地址*/
- adrr3,3f
- /*r5值为__proc_info_bein,r6值为__proc_ino_end,而r7值为.,
- *也即3f符号的链接地址。请留意,在链接期间,__proc_info_begin和
- *__proc_info_end以及.均是链接地址,也即虚执地址。
- */
- ldmdar3,{r5-r7}
- /*r3为3f的物理地址,而r7为3f的虚拟地址。成果是r3为虚拟地址与物理地址的差值,即PHYS_OFFSET-PAGE_OFFSET。*/
- subr3,r3,r7@getoffsetbetweenvirt&phys
- /*r5为__proc_info_begin的物理地址,即r5指针__proc_info数组的首地址*/
- addr5,r5,r3@convertvirtaddressesto
- /*r6为__proc_info_end的物理地址*/
- addr6,r6,r3@physicaladdressspace
- /*读取r5指向的__proc_info数组元素的CPUID和mask值*/
- 1:ldmiar5,{r3,r4}@value,mask
- /*将当时CPUID和mask相与,并与数组元素中的CPUID比较是否相同
- *若相同,则找到当时CPU的__proc_info界说,r5指向访元素并回来。
- */
- andr4,r4,r9@maskwantedbits
- teqr3,r4
- beq2f
- /*r5指向下一个__proc_info元素*/
- addr5,r5,#PROC_INFO_SZ@sizeof(proc_info_list)
- /*是否遍历完一切__proc_info元素*/
- cmpr5,r6
- blo1b
- /*找不到则回来NULL*/
- movr5,#0@unknownprocessor
- 2:movpc,lr
- ENDPROC(__lookup_processor_type)
- .long__proc_info_begin
- .long__proc_info_end
- 3:.long.
- .long__arch_info_begin
- .long__arch_info_end
- /*
- *ReadprocessorIDregister(CP#15,CR0),andlookupinthelinker-built
- *supportedprocessorlist.Notethatwecantusetheabsoluteaddresses
- *forthe__proc_infolistssincewearentrunningwiththeMMUon
- *(andtherefore,wearenotinthecorrectaddressspace).Wehaveto
- *calculatetheoffset.
- *
- *r9=cpuid
- *Returns:
- *r3,r4,r6corrupted
- *r5=proc_infopointerinphysicaladdressspace
- *r9=cpuid(preserved)
- */
- __lookup_processor_type:
- /*adr是相对寻址,它的寻核算成果是将当时PC值加上3f符号与PC的偏移量,
- *而PC是物理地址,因而r3的成果也是3f符号的物理地址*/
- adrr3,3f
- /*r5值为__proc_info_bein,r6值为__proc_ino_end,而r7值为.,
- *也即3f符号的链接地址。请留意,在链接期间,__proc_info_begin和
- *__proc_info_end以及.均是链接地址,也即虚执地址。
- */
- ldmdar3,{r5-r7}
- /*r3为3f的物理地址,而r7为3f的虚拟地址。成果是r3为虚拟地址与物理地址的差值,即PHYS_OFFSET-PAGE_OFFSET。*/
- subr3,r3,r7@getoffsetbetweenvirt&phys
- /*r5为__proc_info_begin的物理地址,即r5指针__proc_info数组的首地址*/
- addr5,r5,r3@convertvirtaddressesto
- /*r6为__proc_info_end的物理地址*/
- addr6,r6,r3@physicaladdressspace
- /*读取r5指向的__proc_info数组元素的CPUID和mask值*/
- 1:ldmiar5,{r3,r4}@value,mask
- /*将当时CPUID和mask相与,并与数组元素中的CPUID比较是否相同
- *若相同,则找到当时CPU的__proc_info界说,r5指向访元素并回来。
- */
- andr4,r4,r9@maskwantedbits
- teqr3,r4
- beq2f
- /*r5指向下一个__proc_info元素*/
- addr5,r5,#PROC_INFO_SZ@sizeof(proc_info_list)
- /*是否遍历完一切__proc_info元素*/
- cmpr5,r6
- blo1b
- /*找不到则回来NULL*/
- movr5,#0@unknownprocessor
- 2:movpc,lr
- ENDPROC(__lookup_processor_type)
- .long__proc_info_begin
- .long__proc_info_end
- 3:.long.
- .long__arch_info_begin
- .long__arch_info_end
4 __lookup_machine_type 函数
__lookup_machine_type 和__lookup_processor_type像对孪生兄弟,它们的行为都是很相似的:__lookup_machine_type依据r1寄存器的机器编号到.arch.info.init段的数组中顺次查找机器编号与r1相同的记载。它使了与它孪生兄弟相同的方法进行虚拟地址到物理地址的转化核算。
在介绍函数,咱们先剖析tqs3c2440开发板的机器信息的界说:
- Arch/arm/include/asm/mach/arch.h
- #defineMACHINE_START(_type,_name)\
- staticconststructmachine_desc__mach_desc_##_type\
- __used\
- __attribute__((__section__(“.arch.info.init”)))={\
- .nr=MACH_TYPE_##_type,\
- .name=_name,
- #defineMACHINE_END\
- };
- Arch/arm/include/asm/mach/arch.h
- #defineMACHINE_START(_type,_name)\
- staticconststructmachine_desc__mach_desc_##_type\
- __used\
- __attribute__((__section__(“.arch.info.init”)))={\
- .nr=MACH_TYPE_##_type,\
- .name=_name,
- #defineMACHINE_END\
- };
MACHINE_START宏用于界说一个.arch.info.init段的数组元素。.nr元素便是函数要比较的变量。Tqs3c2440开发板相应的界说如下:
- MACHINE_START(S3C2440,”TQ2440″)
- .phys_io=S3C2410_PA_UART,
- .io_pg_offst=(((u32)S3C24XX_VA_UART)>>18)&0xfffc,
- .boot_params=S3C2410_SDRAM_PA+0x100,
- .init_irq=s3c24xx_init_irq,
- .map_io=tq2440_map_io,
- .init_machine=tq2440_machine_init,
- .timer=&s3c24xx_timer,
- MACHINE_END
- MACHINE_START(S3C2440,”TQ2440″)
- .phys_io=S3C2410_PA_UART,
- .io_pg_offst=(((u32)S3C24XX_VA_UART)>>18)&0xfffc,
- .boot_params=S3C2410_SDRAM_PA+0x100,
- .init_irq=s3c24xx_init_irq,
- .map_io=tq2440_map_io,
- .init_machine=tq2440_machine_init,
- .timer=&s3c24xx_timer,
- MACHINE_END
这是一个struct machine_desc结构,在后边的C代码(start_kernel开端履行的代码)会运用该变量目标。在tqs3c2440开发中的__lookup_machine_type函数便是回来该目标指针。
这儿触及许多函数指针,它们都是在start_kernel函数里在各种阶段进行初始化的回函数。如map_io指向的tq2440_map_io便是在树立好内核页表后,再调用它来针对开发板的各种IO端口来树立相关的映射和页表。
至于__loopup_machine_type的代码就不作详细剖析,请比照__lookup_processor_type来自行剖析。代码如下:
- /*
- *Lookupmachinearchitectureinthelinker-buildlistofarchitectures.
- *Notethatwecantusetheabsoluteaddressesforthe__arch_info
- *listssincewearentrunningwiththeMMUon(andtherefore,weare
- *notinthecorrectaddressspace).Wehavetocalculatetheoffset.
- *
- *r1=machinearchitecturenumber
- *Returns:
- *r3,r4,r6corrupted
- *r5=mach_infopointerinphysicaladdressspace
- */
- __lookup_machine_type:
- adrr3,3b
- ldmiar3,{r4,r5,r6}
- subr3,r3,r4@getoffsetbetweenvirt&phys
- addr5,r5,r3@convertvirtaddressesto
- addr6,r6,r3@physicaladdressspace
- 1:ldrr3,[r5,#MACHINFO_TYPE]@getmachinetype
- teqr3,r1@matchesloadernumber?
- beq2f@found
- addr5,r5,#SIZEOF_MACHINE_DESC@nextmachine_desc
- cmpr5,r6
- blo1b
- movr5,#0@unknownmachine
- 2:movpc,lr
- ENDPROC(__lookup_machine_type)
- /*
- *Lookupmachinearchitectureinthelinker-buildlistofarchitectures.
- *Notethatwecantusetheabsoluteaddressesforthe__arch_info
- *listssincewearentrunningwiththeMMUon(andtherefore,weare
- *notinthecorrectaddressspace).Wehavetocalculatetheoffset.
- *
- *r1=machinearchitecturenumber
- *Returns:
- *r3,r4,r6corrupted
- *r5=mach_infopointerinphysicaladdressspace
- */
- __lookup_machine_type:
- adrr3,3b
- ldmiar3,{r4,r5,r6}
- subr3,r3,r4@getoffsetbetweenvirt&phys
- addr5,r5,r3@convertvirtaddressesto
- addr6,r6,r3@physicaladdressspace
- 1:ldrr3,[r5,#MACHINFO_TYPE]@getmachinetype
- teqr3,r1@matchesloadernumber?
- beq2f@found
- addr5,r5,#SIZEOF_MACHINE_DESC@nextmachine_desc
- cmpr5,r6
- blo1b
- movr5,#0@unknownmachine
- 2:movpc,lr
- ENDPROC(__lookup_machine_type)
5. 为kernel树立暂时页表
前面提及到,kernel里边的一切符号在链接时,都运用了虚拟地址值。在完结根本的初始化后,kernel代码将跳到第一个C言语函数start_kernl来履行,在哪个时分,这些虚拟地址有必要能够对它所存放在真实内存方位,不然运转将为犯错。为此,CPU有必要敞开MMU,但在敞开MMU前,有必要为虚拟地址到物理地址的映射树立相应的面表。在敞开MMU后,kernel指并不马大将PC值指向start_kernl,而是要做一些C言语运转期的设置,如仓库,重界说等作业后才跳到start_kernel去履行。在此过程中,PC值仍是物理地址,因而还需求为这段内存空间树立va = pa的内存映射联系。当然,本函数树立的一切页表都会在将来paging_init毁掉再重建,这是暂时过度性的映射联系和页表。
在介绍__create_table_pages前,先知道一个macro pgtbl,它将KERNL_RAM_PADDR – 0x4000的值赋给rd寄存器,从下面的运用中能够看它,该值是页表在物理内存的根底,也即页表放在kernel开端地址下的16K的当地。
- .macropgtbl,rd
- ldr\rd,=(KERNEL_RAM_PADDR-0x4000)
- .endm
- .macropgtbl,rd
- ldr\rd,=(KERNEL_RAM_PADDR-0x4000)
- .endm
- /*
- *Setuptheinitialpagetables.Weonlysetupthebarest
- *amountwhicharerequiredtogetthekernelrunning,which
- *generallymeansmappinginthekernelcode.
- *
- *r8=machinfo
- *r9=cpuid
- *r10=procinfo
- *
- *Returns:
- *r0,r3,r6,r7corrupted
- *r4=physicalpagetableaddress
- */
- __create_page_tables:
- /*r4=KERNEL_RAM_PADDR–0x4000=0x30004000
- *后边的C代码中的swapper_pg_dir变量,它的值也指向0x30004000
- *内存地址,不过它的值是虚拟内存地址,即0xc0004000
- */
- pgtblr4@pagetableaddress
- /*将从r4到KERNEL_RAP_PADDR的16K页表空间清空。*/
- movr0,r4
- movr3,#0
- addr6,r0,#0x4000
- 1:strr3,[r0],#4
- strr3,[r0],#4
- strr3,[r0],#4
- strr3,[r0],#4
- teqr0,r6
- bne1b
- /*还记得r10指向开发板相应的proc_info元素吗?这儿它将的mm_mmuflags值读到r7中。
- *PROCINFO_MM_MMUFLAGS值为8,可对应上面列出来的__arm920_proc_info结构或你相应开发板结构的值来查看该mmu_flags值。
- *这儿的flags便是用于设置目录项的flags。查看该mmu_flags的界说,发现它是要求一级页表是section。
- */
- ldrr7,[r10,#PROCINFO_MM_MMUFLAGS]@mm_mmuflags
- /*
- *CreateidentitymappingforfirstMBofkernelto
- *caterfortheMMUenable.Thisidentitymapping
- *willberemovedbypaging_init().Weuseourcurrentprogram
- *countertodeterminecorrespondingsectionbaseaddress.
- */
- /*r3=((pc>>20)<<20)|r7,即取PC以1M向下对齐的地址。R6=pc>>20也即r6=0x300(pgd_idx),
- *即PC对一切1M内存空间,在页表中的下标。
- *R7值标明该目录项是section,即它映射的巨细是1M。故刚好一个目录项就能够映射kernel上的1M空间。
- *这个暂时的va=pa映射只树立1M巨细内存的,而不需求树立整个kernel镜像规模的映射。
- *由于这个va=pa的映射只要当时汇编言语才运用,一量跳进start_kernl后,这将不会用到了。而汇编代码在链接时,
- *已将它安排到代码段的最前面了。
- movr6,pc,lsr#20@startofkernelsection
- orrr3,r7,r6,lsl#20@flags+kernelbase
- /*将目录内空写到页表相应方位,即((uint32_t*)r4)[pgd_idx]=r3*/
- strr3,[r4,r6,lsl#2]@identitymapping
- /*上面代码段为[pc&(~0xfffff),(pc+0xfffff)&(~0xfffff)]的物理内存空间树立了va=pa的映射联系。*/
- /*下面为kernel镜像所占有空间,即KERNL_START到KERNEL_END树立内存映射,
- *映射联系为:va=pa–PHYS+PAGR_OFFSET。留意,这儿的KENEL_START是kernel空间开端的虚拟地址。
- *这儿的目录表项相同是section,即一个项映射1M的内存。
- */
- /*KERNEL_START=PAGE_OFFSET+TEXT_OFFSET,
- *r0=((uint32_t*)(r4))[(KERNEL_START&0xff000000)>>20],
- *即r0指向KERNEL_START&0xff000000(即kernel以16M向下对齐的)虚拟地址,地点项表目录中的方位。
- addr0,r4,#(KERNEL_START&0xff000000)>>18
- /*r0=((uint32_t*)r0)[(KERNEL_START&0x00f00000)>>20]
- *履行前r0指向kernel以16M向下对齐的虚执地址,而这儿再加上KERNEL_START未以16M向对齐部分的偏移量。
- *将本来r3的值写到页表目录中。R3的值便是之前已树立好va=pa映射的那个PA值。
- */
- strr3,[r0,#(KERNEL_START&0x00f00000)>>18]!
- /*r6为kernel镜像的尾部虚拟地址。*/
- ldrr6,=(KERNEL_END-1)
- /*指向下一个即行将填写的目录项*/
- addr0,r0,#4
- /*r6指向KERNEL_END-1虚拟地址地点的目录表项的方位*/
- addr6,r4,r6,lsr#18
- 1:cmpr0,r6
- /*每填一个目录项,后一个比前一个所指向的物理地址大1M。*/
- addr3,r3,#1<<20
- strlsr3,[r0],#4
- bls1b
- #ifdefCONFIG_XIP_KERNEL
- /*疏忽,不剖析这种状况*/
- #endif
- /*一般kernel的发动参数由bootloader放到了物理内存的第1个M上,所以需求为RAM上的第1个M树立映射。
- *上面已为PHYS_OFFSET+TEXT_OFFSET树立了映射,假如TEXT_OFFSET小于0x00100000的话,
- *上面代码应该也为SDRAM的第一个M树立了映射,但假如大于0x0010000则不会。
- *所以这儿无论如何均为SDRAM的第一个M树立映射(不知剖析对否,还请纠正)。
- */
- addr0,r4,#PAGE_OFFSET>>18
- orrr6,r7,#(PHYS_OFFSET&0xff000000)
- .if(PHYS_OFFSET&0x00f00000)
- orrr6,r6,#(PHYS_OFFSET&0x00f00000)
- .endif
- strr6,[r0]
- #ifdefCONFIG_DEBUG_LL
- /*省略*/
- #ifdefined(CONFIG_ARCH_NETWINDER)||defined(CONFIG_ARCH_CATS)
- /*省略*/
- #endif
- #ifdefCONFIG_ARCH_RPC
- /*省略*/
- #endif
- #endif
- movpc,lr
- ENDPROC(__create_page_tables)
- /*
- *Setuptheinitialpagetables.Weonlysetupthebarest
- *amountwhicharerequiredtogetthekernelrunning,which
- *generallymeansmappinginthekernelcode.
- *
- *r8=machinfo
- *r9=cpuid
- *r10=procinfo
- *
- *Returns:
- *r0,r3,r6,r7corrupted
- *r4=physicalpagetableaddress
- */
- __create_page_tables:
- /*r4=KERNEL_RAM_PADDR–0x4000=0x30004000
- *后边的C代码中的swapper_pg_dir变量,它的值也指向0x30004000
- *内存地址,不过它的值是虚拟内存地址,即0xc0004000
- */
- pgtblr4@pagetableaddress
- /*将从r4到KERNEL_RAP_PADDR的16K页表空间清空。*/
- movr0,r4
- movr3,#0
- addr6,r0,#0x4000
- 1:strr3,[r0],#4
- strr3,[r0],#4
- strr3,[r0],#4
- strr3,[r0],#4
- teqr0,r6
- bne1b
- /*还记得r10指向开发板相应的proc_info元素吗?这儿它将的mm_mmuflags值读到r7中。
- *PROCINFO_MM_MMUFLAGS值为8,可对应上面列出来的__arm920_proc_info结构或你相应开发板结构的值来查看该mmu_flags值。
- *这儿的flags便是用于设置目录项的flags。查看该mmu_flags的界说,发现它是要求一级页表是section。
- */
- ldrr7,[r10,#PROCINFO_MM_MMUFLAGS]@mm_mmuflags
- /*
- *CreateidentitymappingforfirstMBofkernelto
- *caterfortheMMUenable.Thisidentitymapping
- *willberemovedbypaging_init().Weuseourcurrentprogram
- *countertodeterminecorrespondingsectionbaseaddress.
- */
- /*r3=((pc>>20)<<20)|r7,即取PC以1M向下对齐的地址。R6=pc>>20也即r6=0x300(pgd_idx),
- *即PC对一切1M内存空间,在页表中的下标。
- *R7值标明该目录项是section,即它映射的巨细是1M。故刚好一个目录项就能够映射kernel上的1M空间。
- *这个暂时的va=pa映射只树立1M巨细内存的,而不需求树立整个kernel镜像规模的映射。
- *由于这个va=pa的映射只要当时汇编言语才运用,一量跳进start_kernl后,这将不会用到了。而汇编代码在链接时,
- *已将它安排到代码段的最前面了。
- movr6,pc,lsr#20@startofkernelsection
- orrr3,r7,r6,lsl#20@flags+kernelbase
- /*将目录内空写到页表相应方位,即((uint32_t*)r4)[pgd_idx]=r3*/
- strr3,[r4,r6,lsl#2]@identitymapping
- /*上面代码段为[pc&(~0xfffff),(pc+0xfffff)&(~0xfffff)]的物理内存空间树立了va=pa的映射联系。*/
- /*下面为kernel镜像所占有空间,即KERNL_START到KERNEL_END树立内存映射,
- *映射联系为:va=pa–PHYS+PAGR_OFFSET。留意,这儿的KENEL_START是kernel空间开端的虚拟地址。
- *这儿的目录表项相同是section,即一个项映射1M的内存。
- */
- /*KERNEL_START=PAGE_OFFSET+TEXT_OFFSET,
- *r0=((uint32_t*)(r4))[(KERNEL_START&0xff000000)>>20],
- *即r0指向KERNEL_START&0xff000000(即kernel以16M向下对齐的)虚拟地址,地点项表目录中的方位。
- addr0,r4,#(KERNEL_START&0xff000000)>>18
- /*r0=((uint32_t*)r0)[(KERNEL_START&0x00f00000)>>20]
- *履行前r0指向kernel以16M向下对齐的虚执地址,而这儿再加上KERNEL_START未以16M向对齐部分的偏移量。
- *将本来r3的值写到页表目录中。R3的值便是之前已树立好va=pa映射的那个PA值。
- */
- strr3,[r0,#(KERNEL_START&0x00f00000)>>18]!
- /*r6为kernel镜像的尾部虚拟地址。*/
- ldrr6,=(KERNEL_END-1)
- /*指向下一个即行将填写的目录项*/
- addr0,r0,#4
- /*r6指向KERNEL_END-1虚拟地址地点的目录表项的方位*/
- addr6,r4,r6,lsr#18
- 1:cmpr0,r6
- /*每填一个目录项,后一个比前一个所指向的物理地址大1M。*/
- addr3,r3,#1<<20
- strlsr3,[r0],#4
- bls1b
- #ifdefCONFIG_XIP_KERNEL
- /*疏忽,不剖析这种状况*/
- #endif
- /*一般kernel的发动参数由bootloader放到了物理内存的第1个M上,所以需求为RAM上的第1个M树立映射。
- *上面已为PHYS_OFFSET+TEXT_OFFSET树立了映射,假如TEXT_OFFSET小于0x00100000的话,
- *上面代码应该也为SDRAM的第一个M树立了映射,但假如大于0x0010000则不会。
- *所以这儿无论如何均为SDRAM的第一个M树立映射(不知剖析对否,还请纠正)。
- */
- addr0,r4,#PAGE_OFFSET>>18
- orrr6,r7,#(PHYS_OFFSET&0xff000000)
- .if(PHYS_OFFSET&0x00f00000)
- orrr6,r6,#(PHYS_OFFSET&0x00f00000)
- .endif
- strr6,[r0]
- #ifdefCONFIG_DEBUG_LL
- /*省略*/
- #ifdefined(CONFIG_ARCH_NETWINDER)||defined(CONFIG_ARCH_CATS)
- /*省略*/
- #endif
- #ifdefCONFIG_ARCH_RPC
- /*省略*/
- #endif
- #endif
- movpc,lr
- ENDPROC(__create_page_tables)
一口气将__create_pages_table剖析完,但里触及的代码仍是需求细细品读。尤其是右移20位和18位两个当地与页表目录项的地址联系比较杂乱。履行完该函数后,虚拟内存和物理内存的映射联系如下图所示:
6. 敞开MMU
看完页表的树立,想必敞开MMU的代码也是小菜一碟吧。此函数的主要功用是将页表的基址加到cp15中的面表指针寄存器,一同设置域拜访(domain access)寄存器。
- /*
- *SetupcommonbitsbeforefinallyenablingtheMMU.Essentially
- *thisisjustloadingthepagetablepointeranddomainaccess
- *registers.
- */
- __enable_mmu:
- /*这儿设置是否为非对齐内存拜访发生反常*/
- #ifdefCONFIG_ALIGNMENT_TRAP
- orrr0,r0,#CR_A
- #else
- bicr0,r0,#CR_A
- #endif
- /*是否禁用数据缓存功用*/
- #ifdefCONFIG_CPU_DCACHE_DISABLE
- bicr0,r0,#CR_C
- #endif
- /*是否禁用CPU_BPREDICT?,不是很清楚此选项*/
- #ifdefCONFIG_CPU_BPREDICT_DISABLE
- bicr0,r0,#CR_Z
- #endif
- /*是否禁用指令缓存功用*/
- #ifdefCONFIG_CPU_ICACHE_DISABLE
- bicr0,r0,#CR_I
- #endif
- /*设置域拜访寄存器的值。这儿设置每个domain的特点是否上面树立的页表中,
- *每个目录项的damon值一同进行拜访操控查看。详细状况请参阅ARM处理器手册。
- */
- movr5,#(domain_val(DOMAIN_USER,DOMAIN_MANAGER)|\
- domain_val(DOMAIN_KERNEL,DOMAIN_MANAGER)|\
- domain_val(DOMAIN_TABLE,DOMAIN_MANAGER)|\
- domain_val(DOMAIN_IO,DOMAIN_CLIENT))
- mcrp15,0,r5,c3,c0,0@loaddomainaccessregister
- mcrp15,0,r4,c2,c0,0@loadpagetablepointer
- b__turn_mmu_on
- ENDPROC(__enable_mmu)
- /*
- *EnabletheMMU.Thiscompletelychangesthestructureofthevisible
- *memoryspace.Youwillnotbeabletotraceexecutionthroughthis.
- *Ifyouhaveanenquiryaboutthis,*please*checkthelinux-arm-kernel
- *mailinglistarchivesBEFOREsendinganotherposttothelist.
- *
- *r0=cp#15controlregister
- *r13=*virtual*addresstojumptouponcompletion
- *
- *otherregistersdependonthefunctioncalleduponcompletion
- */
- .align5
- __turn_mmu_on:
- movr0,r0
- /*将r0的值写到操控寄存器中。这儿,总算敞开MMU功用了。
- *查阅手册说操控寄存器的0方位1标明敞开MMU,但这儿r0的第0是多少呢(还请我们纠正)
- */
- mcrp15,0,r0,c1,c0,0@writecontrolreg
- mrcp15,0,r3,c0,c0,0@readidreg
- /*这儿的两个mov好像是否流水线有关的,敞开MMU句子后边几条是不能进行内存寻址的。但仍未搞理解详细东西的。*/
- movr3,r3
- movr3,r3
- /*转跳到r13的函数中去,r13为__mmap_switched函数的虚拟地址,
- *从stext函数的未尾能够找到它的赋值。故从此开端pc的值就真实在内存的虚拟地址空间了。
- */
- movpc,r13
- ENDPROC(__turn_mmu_on)
- /*
- *SetupcommonbitsbeforefinallyenablingtheMMU.Essentially
- *thisisjustloadingthepagetablepointeranddomainaccess
- *registers.
- */
- __enable_mmu:
- /*这儿设置是否为非对齐内存拜访发生反常*/
- #ifdefCONFIG_ALIGNMENT_TRAP
- orrr0,r0,#CR_A
- #else
- bicr0,r0,#CR_A
- #endif
- /*是否禁用数据缓存功用*/
- #ifdefCONFIG_CPU_DCACHE_DISABLE
- bicr0,r0,#CR_C
- #endif
- /*是否禁用CPU_BPREDICT?,不是很清楚此选项*/
- #ifdefCONFIG_CPU_BPREDICT_DISABLE
- bicr0,r0,#CR_Z
- #endif
- /*是否禁用指令缓存功用*/
- #ifdefCONFIG_CPU_%&&&&&%ACHE_DISABLE
- bicr0,r0,#CR_I
- #endif
- /*设置域拜访寄存器的值。这儿设置每个domain的特点是否上面树立的页表中,
- *每个目录项的damon值一同进行拜访操控查看。详细状况请参阅ARM处理器手册。
- */
- movr5,#(domain_val(DOMAIN_USER,DOMAIN_MANAGER)|\
- domain_val(DOMAIN_KERNEL,DOMAIN_MANAGER)|\
- domain_val(DOMAIN_TABLE,DOMAIN_MANAGER)|\
- domain_val(DOMAIN_IO,DOMAIN_CLIENT))
- mcrp15,0,r5,c3,c0,0@loaddomainaccessregister
- mcrp15,0,r4,c2,c0,0@loadpagetablepointer
- b__turn_mmu_on
- ENDPROC(__enable_mmu)
- /*
- *EnabletheMMU.Thiscompletelychangesthestructureofthevisible
- *memoryspace.Youwillnotbeabletotraceexecutionthroughthis.
- *Ifyouhaveanenquiryaboutthis,*please*checkthelinux-arm-kernel
- *mailinglistarchivesBEFOREsendinganotherposttothelist.
- *
- *r0=cp#15controlregister
- *r13=*virtual*addresstojumptouponcompletion
- *
- *otherregistersdependonthefunctioncalleduponcompletion
- */
- .align5
- __turn_mmu_on:
- movr0,r0
- /*将r0的值写到操控寄存器中。这儿,总算敞开MMU功用了。
- *查阅手册说操控寄存器的0方位1标明敞开MMU,但这儿r0的第0是多少呢(还请我们纠正)
- */
- mcrp15,0,r0,c1,c0,0@writecontrolreg
- mrcp15,0,r3,c0,c0,0@readidreg
- /*这儿的两个mov好像是否流水线有关的,敞开MMU句子后边几条是不能进行内存寻址的。但仍未搞理解详细东西的。*/
- movr3,r3
- movr3,r3
- /*转跳到r13的函数中去,r13为__mmap_switched函数的虚拟地址,
- *从stext函数的未尾能够找到它的赋值。故从此开端pc的值就真实在内存的虚拟地址空间了。
- */
- movpc,r13
- ENDPROC(__turn_mmu_on)
7.__mmap_switched函数
__mmap_switched函数专用来设置C言语的履行环境,比方重定位作业,仓库,以及BSS段的清零。
__switch_data变量先界说了一系里边处量的数据,如重定位和数据段的地址,BSS段的地址,pocessor_id和__mach_arch_type变量的地址等。
- .type__switch_data,%object
- __switch_data:
- .long__mmap_switched
- .long__data_loc@r4
- .long_data@r5
- .long__bss_start@r6
- .long_end@r7
- .longprocessor_id@r4
- .long__machine_arch_type@r5
- .long__atags_pointer@r6
- .longcr_alignment@r7
- .longinit_thread_union+THREAD_START_SP@sp
- /*
- *ThefollowingfragmentofcodeisexecutedwiththeMMUoninMMUmode,
- *andusesabsoluteaddresses;thisisnotpositionindependent.
- *
- *r0=cp#15controlregister
- *r1=machineID
- *r2=atagspointer
- *r9=processorID
- */
- __mmap_switched:
- adrr3,__switch_data+4
- /*r4=__data_loc,r5=_data,r6=_bss_start,r7=_end*/
- ldmiar3!,{r4,r5,r6,r7}
- /*下面这段代码相似于这段C代码,行将整个数据段从__data_loc拷贝到_data段。
- *if(__data_loc==_data||_data!=_bass_start)
- *memcpy(_data,__data_loc,_bss_start-_data);
- */
- cmpr4,r5@Copydatasegmentifneeded
- 1:cmpner5,r6
- ldrnefp,[r4],#4
- strnefp,[r5],#4
- bne1b
- /*将BSS段,也即从_bss_start到_end的内存清零。*/
- movfp,#0@ClearBSS(andzerofp)
- 1:cmpr6,r7
- strccfp,[r6],#4
- bcc1b
- /*r4=processor_id,
- *r5=__machine_arch_type
- *r6=__atags_pointer
- *r7=cr_alignment
- *sp=init_thread_union+THREAD_START_SP
- *为什么将栈顶指针设置为init_thread_union+THREAD_START_SP
- *init_head_union变量是一个巨细为THREAD_SIZE的union,它在编译时,放到数据段的前面。
- *开始估量这块空间是内核仓库。故在跳入C言语代码时,它SP的值设置为init_thread_union+THREAD_START_SP。
- *留意THREAD_START_SP界说为THREAD_SIZE–8,中心为什么留出8个字节呢?是与ARM的仓库操作有关吗?还有用专向start_kernel函数传递参数?
- */
- ldmiar3,{r4,r5,r6,r7,sp}
- strr9,[r4]@SaveprocessorID
- strr1,[r5]@Savemachinetype
- strr2,[r6]@Saveatagspointer
- bicr4,r0,#CR_A@ClearAbit
- /*cr_alignment变量的后边接着放置cr_no_alignment,
- *r0为翻开alignment检测时,操控寄存器的值,而r4为封闭时的值,
- *这儿分将将翻开和封闭alignment查看的操控寄存器的值写到
- *cr_alignment和cr_no_alignement变量中。
- */
- stmiar7,{r0,r4}@Savecontrolregistervalues
- /*跳到start_kernel函数,此函数代码用纯C来完结,它会调用各个渠道的相关初始化函数,
- *来完结不同渠道的初始化作业。至此,armlinux的发动作业完结。
- */
- bstart_kernel
- ENDPROC(__mmap_switched)
- .type__switch_data,%object
- __switch_data:
- .long__mmap_switched
- .long__data_loc@r4
- .long_data@r5
- .long__bss_start@r6
- .long_end@r7
- .longprocessor_id@r4
- .long__machine_arch_type@r5
- .long__atags_pointer@r6
- .longcr_alignment@r7
- .longinit_thread_union+THREAD_START_SP@sp
- /*
- *ThefollowingfragmentofcodeisexecutedwiththeMMUoninMMUmode,
- *andusesabsoluteaddresses;thisisnotpositionindependent.
- *
- *r0=cp#15controlregister
- *r1=machineID
- *r2=atagspointer
- *r9=processorID
- */
- __mmap_switched:
- adrr3,__switch_data+4
- /*r4=__data_loc,r5=_data,r6=_bss_start,r7=_end*/
- ldmiar3!,{r4,r5,r6,r7}
- /*下面这段代码相似于这段C代码,行将整个数据段从__data_loc拷贝到_data段。
- *if(__data_loc==_data||_data!=_bass_start)
- *memcpy(_data,__data_loc,_bss_start-_data);
- */
- cmpr4,r5@Copydatasegmentifneeded
- 1:cmpner5,r6
- ldrnefp,[r4],#4
- strnefp,[r5],#4
- bne1b
- /*将BSS段,也即从_bss_start到_end的内存清零。*/
- movfp,#0@ClearBSS(andzerofp)
- 1:cmpr6,r7
- strccfp,[r6],#4
- bcc1b
- /*r4=processor_id,
- *r5=__machine_arch_type
- *r6=__atags_pointer
- *r7=cr_alignment
- *sp=init_thread_union+THREAD_START_SP
- *为什么将栈顶指针设置为init_thread_union+THREAD_START_SP
- *init_head_union变量是一个巨细为THREAD_SIZE的union,它在编译时,放到数据段的前面。
- *开始估量这块空间是内核仓库。故在跳入C言语代码时,它SP的值设置为init_thread_union+THREAD_START_SP。
- *留意THREAD_START_SP界说为THREAD_SIZE–8,中心为什么留出8个字节呢?是与ARM的仓库操作有关吗?还有用专向start_kernel函数传递参数?
- */
- ldmiar3,{r4,r5,r6,r7,sp}
- strr9,[r4]@SaveprocessorID
- strr1,[r5]@Savemachinetype
- strr2,[r6]@Saveatagspointer
- bicr4,r0,#CR_A@ClearAbit
- /*cr_alignment变量的后边接着放置cr_no_alignment,
- *r0为翻开alignment检测时,操控寄存器的值,而r4为封闭时的值,
- *这儿分将将翻开和封闭alignment查看的操控寄存器的值写到
- *cr_alignment和cr_no_alignement变量中。
- */
- stmiar7,{r0,r4}@Savecontrolregistervalues
- /*跳到start_kernel函数,此函数代码用纯C来完结,它会调用各个渠道的相关初始化函数,
- *来完结不同渠道的初始化作业。至此,armlinux的发动作业完结。
- */
- bstart_kernel
- ENDPROC(__mmap_switched)