时断时续的研讨arm也有2个月了,现在才感觉了解了arm在Nand flash形式下的发动进程,现在来这儿记录下来以表达我无比高兴的心境。闲话少说,趁着还没有忘掉学习进程中的感触,直接进入正题。
咱们都知道,arm在Nand flash发动形式下发动时体系会将Nand flash中的前4KB代码复制到SRAM(也便是Steppingstone中),由SRAM装备中止向量表和完结Nand flash拜访的必要初始化,然后将Nand flash中的悉数程序代码复制到SDRAM中,最后由SRAM跳转到SDRAM,然后程序就正常履行了,这一进程看上去很简略,可是真实了解这一进程仍是不简略的,虽然这样,仍是想告知咱们细心了解仍是比较简略了解这个进程的。假如您是ADS用户,你省去了许多费事,但我不确认你省去的这些费事是否值得,这儿介绍的是一种费事的方法,linux下的led程序。
代码Head.s
- .externmain
- .text
- .global_start
- _start:
- breset
- reset:
- ldrsp,=4096
- bldisable_watch_dog
- blclock_init
- blmemsetup
- blcopy_steppingstone_to_sdram
- ldrpc,=on_sdram
- on_sdram:
- msrcpsr_c,#0xdf
- ldrsp,=0x34000000
- ldrlr,=halt_loop
- ldrpc,=Main
- halt_loop:
- bhalt_loop
我以为,最需求了解的便是这段代码了。先简略的解说下这段代码。
(1)因为arm履行reset之后pc会被清零,也便是reset中止的中止进口地址,因而,榜首条指令便是b reset,跳转到reset中止处理函数。
(2)因为这儿硬件装备都是C言语来完结的,并且咱们的初始代码比较小,彻底不会超出4KB,因而能够在SRAM运用仓库,故将SP设置为4096,以供给C运转环境
(3)接下来的3个bl别离完结了封闭看门够定时器,装备时钟信号和存储器装备的作业,第四个bl是将SRAM的4KB空间内的代码复制到了SDRAM中。
(4)接下来的ldr句将pc赋值为on_sdram的地址,完结了从SRAM到SDRAM的跳转(下面会讲为什么)
(5)on_sdram中切换到了了体系形式然后分配了体系形式仓库,将链接寄存器设置为halt_loop然后就跳转到了SDRAM中的Main
上面的解说仅仅大体上阐明晰代码的意思,可是初学者总会有个疑问便是为什么ldr pc,=on_sdram就完结了从SRAM到SDRAM的跳转呢?我被这个问题困扰了很长时刻,到今日才想了解了这个问题,问题的要害便是相对跳转和肯定跳转的问题。为了阐明这个问题我先解说一下bl指令跟ldr指令在履行进程中的差异。
B指令是相对跳转指令,B 指令是最简略的跳转指令。一旦遇到一个 B 指令,ARM 处理器将当即跳转到给定的方针地址,从那里持续履行。留意存储在跳转指令中的实践值是相对当时PC 值的一个偏移量,而不是一个肯定地址,它的值由汇编器来核算(参阅寻址方法中的相对寻址)。它是 24 位有符号数,左移两位后有符号扩展为 32 位,表明的有用偏移为 26 位(前后32MB 的地址空间),相同的,BL、BX都是相对跳转。
LDR伪指令是将第二操作直接赋值给榜首操作数,当履行ldr pc,=Main时是将Main的肯定地址赋值给了PC。
好了,知道这两个指令的差异之后咱们来看代码是怎么完结的从SRAM到SDRAM的跳转,首要需求指出,2440的开发板有SRAM和SDRAM,SRAM是从地址0x00000000开端的4KB内存空间,SDRAM是从0x30000000开端的64M空间。
不管用ADS编译仍是用arm-linux-gcc编译都会将代码链接到0x30000000今后(也便是SDRAM中),ADS用户能够经过检查ADS的工程装备,其中有项装备是RO开端地址是0x30000000,linux用户在链接时需求用-T指定代码的其实地址为0x30000000。
依据编译原理,在链接阶段程序中函数的地址就现已确认了,也便是说函数的实践地址都在0x30000000之后,而程序的进口函数也便是这儿的_start的地址便是0x300000000,其他函数都会大于这个数。
可是因为arm上电后体系会将Nand flash的前4KB代码复制到SRAM中,也便是_start函数开端的4KB指令将被复制到SRAM中履行,依据上例,在0x00000000处履行的指令便是“b reset”,因为b是相对跳转,是在当时pc值的基础上加减某个数而跳转到即将履行的代码处,因而,pc加减该数之后将抵达reset函数的方位,故reset函数不能写到4KB之外的空间中,不然arm的发动将会失利,相同的,接下来的几个bl都是履行的相对跳转,所以都相对当时pc进行的跳转,因为Nand flash一共只要64M的空间,所以相对跳转是不可能会跳转到SDRAM的,因为跳转到SDRAM至少要产生0x30000000的跳转,而这个相对位移远远大于64M。
而ldr pc,=Main是将Main函数的实践地址赋值给pc,而Main的实践地址是在0x30000000之后,这样,就从SRAM跳转到了SDRAM。
因为这个进程规划到了硬件格式和编译原理,所以对一般人来讲,了解起来的确比较困难,并且受自己水平约束,许多当地只能说是只可意会不可言传,假如误导了咱们请咱们体谅。当然假如看到这儿还不能了解arm的发动进程能够留言评论这个问题。下面是相关的其他代码,我附在这儿,2440addr.h没有贴出,因为我也是运用arm自带示例程序中的代码,并且代码有四千多行,大都地址是没有用到的。其他的代码如下
代码Init.s
- #include”2440addr.h”
- voiddisable_watch_dog(void);
- voidclock_init(void);
- voidmemsetup(void);
- voidcopy_steppingstone_to_sdram(void);
- voidinituart(void);
- voiddisable_watch_dog(void)
- {
- rWTCON=0;
- }
- voidclock_init(void)
- {
- rCLKDIVN=0x03;
- /*
- *假如HDIVN非0,CPU的总线形式应该从
- *“fastbusmode”变为“asynchronous
- *busmode”
- */
- __asm__(
- “mrcp15,0,r1,c1,c0,0”
- “orrr1,r1,#0xc0000000”
- “mcrp15,0,r1,c1,c0,0”
- );
- rMPLLCON=(92<<12)|(1<<4)|(2);
- //rMPLLCON=((0x5c<<12)|(0x01<<4)|(0x02));
- }
- voidmemsetup(void)
- {
- volatileunsignedlong*p=(volatileunsignedlong*)0x48000000;
- /*这个函数之所以这样赋值,而不是像前面的试验(比方mmu试验)那样将装备值
- *写在数组中,是因为要生成”方位无关的代码”,使得这个函数能够在被复制到
- *SDRAM之前就能够在steppingstone中运转
- */
- /*存储控制器13个寄存器的值*/
- p[0]=0x22011110;//BWSCON
- p[1]=0x00000700;//BANKCON0
- p[2]=0x00000700;//BANKCON1
- p[3]=0x00000700;//BANKCON2
- p[4]=0x00000700;//BANKCON3
- p[5]=0x00000700;//BANKCON4
- p[6]=0x00000700;//BANKCON5
- p[7]=0x00018005;//BANKCON6
- p[8]=0x00018005;//BANKCON7
- /*REFRESH,
- *HCLK=12MHz:0x008C07A3,
- *HCLK=100MHz:0x008C04F4
- */
- p[9]=0x008C04F4;
- p[10]=0x000000B1;//BANKSIZE
- p[11]=0x00000030;//MRSRB6
- p[12]=0x00000030;//MRSRB7
- }
- voidcopy_steppingstone_to_sdram(void)
- {
- unsignedint*pdwSrc=(unsignedint*)0;
- unsignedint*pdwDest=(unsignedint*)0x30000000;
- while(pdwSrc<(unsignedint*)4096)
- {
- *pdwDest=*pdwSrc;
- pdwDest++;
- pdwSrc++;
- }
- }
留意:因为咱们的代码比较小,远小于4KB,因而arm发动时主动复制到SRAM中的4KB代码包括咱们的悉数代码,因而copy操作我是将stepingstone中的4KB代码复制到了SDRAM中,在实践使用中代码大都是超越4KB,因而copy函数应该是将Nand flash中的悉数代码复制到SDRAM,这样才干成功运转ARM。
代码Main.c:
- #include”2440addr.h”
- voidDelay(inti)
- {
- intm,n,p;
- for(m=0;m!=i;++m)
- {
- for(n=0;n!=255;++n)
- {
- for(p=0;p!=255;++p)
- ;
- }
- }
- }
- voidMain()
- {
- intcount;
- intleds[4]={0x1c0,0x1a0,0x160,0xe0};
- rGPBCON=0x00155555;
- rGPBUP=rGPBUP&0xFF00;
- while(1)
- {
- for(count=0;count!=4;++count)
- {
- rGPBDAT=leds[count];
- if(count%2)
- rGPBDAT+=1;
- Delay(2);
- }
- }
- }
链接文件led.lds如下:
- SECTIONS
- {
- .=0x30000000;
- .text:{*(.text)}
- .rodataALIGN(4):{*(.rodata)}
- .dataALIGN(4):{*(.data)}
- .bssALIGN(4):{*(.bss)*(COMMON)}
- }
makefile如下:
- objects:=Head.oInit.oMain.o
- led.bin:$(objects)
- arm-linux-ld-Tled.lds-nostdlib-oled_elf$^
- arm-linux-objcopy-Obinary-Sled_elf$@
- arm-linux-objdump-D-marmled_elf>led.dis
- %.o:%.c
- arm-linux-gcc-Wall-O2-c-o$@$<
- %.o:%.s
- arm-linux-gcc-Wall-O2-c-o$@$<;
- .PYTHON:clean
- clean:
- rm-fled.binled_elfled.dis*.o
如上除了2440addr.h之外就都全了,别的需求指出的是2440addr.h中引用了Option.h,为了简化代码,能够将这句能够注释掉,在咱们这段代码中彻底用不到该文件相关功用。不然需求自行修正makefile文件完结Option.h相关的编译和链接作业。
好了,又浪费了咱们这么长的时刻,这儿就不多说了,有什么问题求高手指出来。