您的位置 首页 ADAS

单片机程序编写优化

在一本书上看到的,觉得很不错,就分享给大家.由于单片机的性能同电脑的性能是天渊之别的,无论从空间资源上、内存资源、工作频率,都是无…

在一本书上看到的,觉得很不错,就同享给咱们.

由于单片机的功用同电脑的功用是天渊之别的,不管从空间资源上、内存资源、作业频率,都是无法
与之比较的。PC 机编程基本上不必考虑空间的占用、内存的占用的问题,终究意图便是完结功用就能够了。
关于单片机来说就天壤之别了,一般的单片机的Flash 和Ram 的资源是以KB 来衡量的,可想而知,单片
机的资源是少得不幸,为此咱们有必要主意设法榨尽其一切资源,将它的功用发挥到最佳,程序设计时有必要
遵从以下几点进行优化:

1. 运用尽量小的数据类型
能够运用字符型(char)界说的变量,就不要运用整型(int)变量来界说;能够运用整型变量界说的变
量就不要用长整型(long int),能不运用浮点型(float)变量就不要运用浮点型变量。当然,在界说变
量后不要超越变量的作用规模,假如超越变量的规模赋值,C 编译器并不报错,但程序运转成果却错了,
并且这样的过错很难发现。

2. 运用自加、自减指令
一般运用自加、自减指令和复合赋值表达式(如a-=1 及a+=1 等)都能够生成高质量的
程序代码,编译器一般都能够生成inc 和dec 之类的指令,而运用a=a+1 或a=a-1 之类
的指令,有许多C 编译器都会生成二到三个字节的指令。

3. 削减运算的强度
能够运用运算量小但功用相同的表达式替换本来杂乱的的表达式。
(1) 求余运算
N= N %8 能够改为N = N &7
阐明:位操作只需一个指令周期即可完结,而大部分的C 编译器的“%”运算均是调用子程序来
完结,代码长、履行速度慢。一般,只需求是求2n 方的余数,均可运用位操作的办法来替代。
(2) 平方运算
N=Pow(3,2) 能够改为N=3*3
阐明:在有内置硬件乘法器的单片机中(如51 系列),乘法运算比求平方运算快得多, 由于浮点数
的求平方是经过调用子程序来完结的,乘法运算的子程序比平方运算的子程序代码短,履行速度快。
(3) 用位移替代乘法除法
N=M*8 能够改为N=M<<3
N=M/8 能够改为N=M>>3
阐明:一般假如需求乘以或除以2n,都能够用移位的办法替代。假如乘以2n,都能够生成左移
的代码,而乘以其它的整数或除以任何数,均调用乘除法子程序。用移位的办法得到代码比调用乘除法子
程序生成的代码功率高。实际上,只需是乘以或除以一个整数,均能够用移位的办法得到成果。如N=M*9
能够改为N=(M<<3)+M;
(4) 自加自减的差异
例如咱们平常运用的延时函数都是经过选用自加的办法来完结。
void DelayNms(UINT16 t)
{
UINT16 i,j;
for(i=0;ifor(j=0;i<1000;j++)
}
能够改为
void DelayNms(UINT16 t)
{
UINT16 i,j;
for(i=t;i>=0;i–)
for(j=1000;i>=0;j–)
}
阐明:两个函数的延时作用类似,但简直一切的C 编译对后一种函数生成的代码均比前一种代码少1~3
个字节,由于简直一切的MCU 均有为0 搬运的指令,选用后一种办法能够生成这类指令。

4. while 与do…while 的差异
void DelayNus(UINT16 t)
{
while(t–)
{
NOP();
}
}
能够改为
void DelayNus(UINT16 t)
{
do
{
NOP();
}while(–t)
}
阐明:运用do…while 循环编译后生成的代码的长度短于while 循环。

5. register 关键字
void UARTPrintfString(INT8 *str)
{
while(*str && str)
{
UARTSendByte(*str++)
}
}
能够改为
void UARTPrintfString(INT8 *str)
{
register INT8 *pstr=str;
while(*pstr && pstr)
{
UARTSendByte(*pstr++)
}
}
阐明:在声明局部变量的时分能够运用register 关键字。这就使得编译器把变量放入一个多用途的存放
器中,而不是在仓库中,合理运用这种办法能够进步履行速度。函数调用越是频频,越是或许进步代码的
速度,留意register 关键字只是主张编译器罢了。

6. volatile 关键字
volatile 总是与优化有关,编译器有一种技能叫做数据流剖析,剖析程序中的变量在哪里赋值、在
哪里运用、在哪里失效,剖析成果能够用于常量兼并,常量传达等优化,进一步能够死代码消除。一般来
说,volatile 关键字只用在以下三种状况:
a) 中止服务函数中修正的供其它程序检测的变量需求加volatile(参阅本书高档试验程序)
b) 多使命环境下各使命间同享的标志应该加volatile
c) 存储器映射的硬件存放器一般也要加volatile 阐明,由于每次对它的读写都或许由不同含义
总归,volatile 关键字是一种类型修饰符,用它声明的类型变量表明能够被某些编译器不知道的要素
更改,比方:操作体系、硬件或许其它线程等。遇到这个关键字声明的变量,编译器对拜访该变量的代码
就不再进行优化,然后能够供给对特别地址的安稳拜访。

7. 以空间换时刻
在数据校验实战傍边,CRC16 循环冗余校验其实还有一种办法是查表法,经过查表能够愈加速取得
校验值,功率更高,当校验数据量大的时分,运用查表法优势愈加显着,不过仅有的缺陷是占用许多的空
间。
//查表法:
code UINT16 szCRC16Tbl[256] = {
0x0000, 0x1021, 0x2042, 0x3063, 0x4084, 0x50a5, 0x60c6, 0x70e7,
0x8108, 0x9129, 0xa14a, 0xb16b, 0xc18c, 0xd1ad, 0xe1ce, 0xf1ef,
0x1231, 0x0210, 0x3273, 0x2252, 0x52b5, 0x4294, 0x72f7, 0x62d6,
0x9339, 0x8318, 0xb37b, 0xa35a, 0xd3bd, 0xc39c, 0xf3ff, 0xe3de,
0x2462, 0x3443, 0x0420, 0x1401, 0x64e6, 0x74c7, 0x44a4, 0x5485,
0xa56a, 0xb54b, 0x8528, 0x9509, 0xe5ee, 0xf5cf, 0xc5ac, 0xd58d,
0x3653, 0x2672, 0x1611, 0x0630, 0x76d7, 0x66f6, 0x5695, 0x46b4,
0xb75b, 0xa77a, 0x9719, 0x8738, 0xf7df, 0xe7fe, 0xd79d, 0xc7bc,
0x48c4, 0x58e5, 0x6886, 0x78a7, 0x0840, 0x1861, 0x2802, 0x3823,
0xc9cc, 0xd9ed, 0xe98e, 0xf9af, 0x8948, 0x9969, 0xa90a, 0xb92b,
0x5af5, 0x4ad4, 0x7ab7, 0x6a96, 0x1a71, 0x0a50, 0x3a33, 0x2a12,
0xdbfd, 0xcbdc, 0xfbbf, 0xeb9e, 0x9b79, 0x8b58, 0xbb3b, 0xab1a,
0x6ca6, 0x7c87, 0x4ce4, 0x5cc5, 0x2c22, 0x3c03, 0x0c60, 0x1c41,
0xedae, 0xfd8f, 0xcdec, 0xddcd, 0xad2a, 0xbd0b, 0x8d68, 0x9d49,
0x7e97, 0x6eb6, 0x5ed5, 0x4ef4, 0x3e13, 0x2e32, 0x1e51, 0x0e70,
0xff9f, 0xefbe, 0xdfdd, 0xcffc, 0xbf1b, 0xaf3a, 0x9f59, 0x8f78,
0x9188, 0x81a9, 0xb1ca, 0xa1eb, 0xd10c, 0xc12d, 0xf14e, 0xe16f,
0x1080, 0x00a1, 0x30c2, 0x20e3, 0x5004, 0x4025, 0x7046, 0x6067,
0x83b9, 0x9398, 0xa3fb, 0xb3da, 0xc33d, 0xd31c, 0xe37f, 0xf35e,
0x02b1, 0x1290, 0x22f3, 0x32d2, 0x4235, 0x5214, 0x6277, 0x7256,
0xb5ea, 0xa5cb, 0x95a8, 0x8589, 0xf56e, 0xe54f, 0xd52c, 0xc50d,
0x34e2, 0x24c3, 0x14a0, 0x0481, 0x7466, 0x6447, 0x5424, 0x4405,
0xa7db, 0xb7fa, 0x8799, 0x97b8, 0xe75f, 0xf77e, 0xc71d, 0xd73c,
0x26d3, 0x36f2, 0x0691, 0x16b0, 0x6657, 0x7676, 0x4615, 0x5634,
0xd94c, 0xc96d, 0xf90e, 0xe92f, 0x99c8, 0x89e9, 0xb98a, 0xa9ab,
0x5844, 0x4865, 0x7806, 0x6827, 0x18c0, 0x08e1, 0x3882, 0x28a3,
0xcb7d, 0xdb5c, 0xeb3f, 0xfb1e, 0x8bf9, 0x9bd8, 0xabbb, 0xbb9a,
0x4a75, 0x5a54, 0x6a37, 0x7a16, 0x0af1, 0x1ad0, 0x2ab3, 0x3a92,
0xfd2e, 0xed0f, 0xdd6c, 0xcd4d, 0xbdaa, 0xad8b, 0x9de8, 0x8dc9,
0x7c26, 0x6c07, 0x5c64, 0x4c45, 0x3ca2, 0x2c83, 0x1ce0, 0x0cc1,
0xef1f, 0xff3e, 0xcf5d, 0xdf7c, 0xaf9b, 0xbfba, 0x8fd9, 0x9ff8,
0x6e17, 0x7e36, 0x4e55, 0x5e74, 0x2e93, 0x3eb2, 0x0ed1, 0x1ef0
};
UINT16 CRC16CheckFromTbl(UINT8 *buf,UINT8 len)
{
UINT16 i;
UINT16 uncrcReg = 0, uncrcConst = 0xffff;
for(i = 0;i < len;i ++)
{
uncrcReg = (uncrcReg << 8) ^ szCRC16Tbl[(((uncrcConst ^ uncrcReg) >> 8)
^ *buf++) & 0xFF];
uncrcConst <<= 8;
}
return uncrcReg;
}
假如体系要求实时性比较强,在CRC16 循环冗余校验傍边,引荐运用查表法,以空间换时刻。

8. 宏函数替代函数
首要不引荐一切函数改为宏函数,避免呈现不必要的过错。可是一些基本功用的函数很有必要运用宏
函数来替代。
UINT8 Max(UINT8 A,UINT8 B)
{
return (A>B?A:B)
}
能够改为
#define MAX(A,B) {(A)>(B)?(A):(B)}
阐明:函数和宏函数的差异就在于,宏函数占用了许多的空间,而函数占用了时刻。咱们要知道的是,函
数调用是要运用体系的栈来保存数据的,假如编译器里有栈查看选项,一般在函数的头会嵌入一些汇编语
句对当时栈进行查看;一起,cpu 也要在函数调用时保存和康复当时的现场,进行压栈和弹栈操作,所以,
函数调用需求一些cpu 时刻。而宏函数不存在这个问题。宏函数只是作为预先写好的代码嵌入到当时程序,
不会产生函数调用,所以只是是占用了空间,在频频调用同一个宏函数的时分,该现象特别杰出。

9. 适当地运用算法
假如有一道算术题,求1~100 的和。
作为程序员的咱们会毫不犹豫地点击键盘写出以下的核算办法:
UINT16 Sum(void)
{
UINT8 i,s;
for(i=1;i<=100;i++)
{
s+=i;
}
return s;
}
很显着咱们都会想到这种办法,可是功率方面并不满意,咱们需求动脑筋,便是选用数学算法解决问题,
使核算功率进步一个等级。
UINT16 Sum(void)
{
UINT16 s;
s=(100 *(100+1))>>1;
return s;
}
成果很显着,相同的成果不同的核算办法,运转功率会有大大不同,所以咱们需求最大极限地经过数
学的办法进步程序的履行功率。

10. 用指针替代数组
在许多种状况下,能够用指针运算替代数组索引,这样做常常能产生又快又短的代码。与数组索引相
比,指针一般能使代码速度更快,占用空间更少。运用多维数组时差异更显着。下面的代码作用是相同的,
可是功率不一样。
UINT8 szArrayA[64];
UINT8 szArrayB[64];
UINT8 i;
UINT8 *p=szArray;
for(i=0;i<64;i++)szArrayB=szArrayA;
for(i=0;i<64;i++)szArrayB=*p++;
指针办法的长处是,szArrayA 的地址装入指针p 后,在每次循环中只需对p 增量操作。在数组索引
办法中,每次循环中都有必要进行依据i 值求数组下标的杂乱运算。

11. 强制转化
C 言语精华榜首精华便是指针的运用,第二精华便是强制转化的运用,恰当地运用指针和强制转化不光
能够供给程序功率,并且使程序愈加之简练,由于强制转化在C 言语编程中占有重要的位置,下面将已五
个比较典型的比方作为解说。
比方1:将带符号字节整型转化为无符号字节整型
UINT8 a=0;
INT8 b=-3;
a=(UINT8)b;
比方2:在大端形式下(8051 系列单片机是大端形式),将数组a[2]转化为无符号16 位整型值。
办法1:选用位移办法。
UINT8 a[2]={0x12,0x34};
UINT16 b=0;
b=(a[0]<<8)|a[1];
成果:b=0x1234
办法2:强制类型转化。
UINT8 a[2]={0x12,0x34};
UINT16 b=0;
b= *(UINT16 *)a; //强制转化
成果:b=0x1234
比方3:保存结构体数据内容。
办法1:逐一保存。
typedef struct _ST
{
UINT8 a;
UINT8 b;
UINT8 c;
UINT8 d;
UINT8 e;
}ST;
ST s;
UINT8 a[5]={0};
s.a=1;
s.b=2;
s.c=3;
s.d=4;
s.e=5;
a[0]=s.a;
a[1]=s.b;
a[2]=s.c;
a[3]=s.d;
a[4]=s.e;
成果:数组a 存储的内容是1、2、3、4、5。
办法2:强制类型转化。
typedef struct _ST
{
UINT8 a;
UINT8 b;
UINT8 c;
UINT8 d;
UINT8 e;
}ST;
ST s;
UINT8 a[5]={0};
UINT8 *p=(UINT8 *)&s;//强制转化
UINT8 i=0;
s.a=1;
s.b=2;
s.c=3;
s.d=4;
s.e=5;
for(i=0;i{
a=*p++;
}
成果:数组a 存储的内容是1、2、3、4、5。
比方4:在大端形式下(8051 系列单片机是大端形式)将含有位域的结构体赋给无符号字节整型值
办法1:逐位赋值。
typedef struct __BYTE2BITS
{
UINT8 _bit7:1;
UINT8 _bit6:1;
UINT8 _bit5:1;
UINT8 _bit4:1;
UINT8 _bit3:1;
UINT8 _bit2:1;
UINT8 _bit1:1;
UINT8 _bit0:1;
}BYTE2BITS;
BYTE2BITS Byte2Bits;
Byte2Bits._bit7=0;
Byte2Bits._bit6=0;
Byte2Bits._bit5=1;
Byte2Bits._bit4=1;
Byte2Bits._bit3=1;
Byte2Bits._bit2=1;
Byte2Bits._bit1=0;
Byte2Bits._bit0=0;
UINT8 a=0;
a|= Byte2Bits._bit7<<7;
a|= Byte2Bits._bit6<<6;
a|= Byte2Bits._bit5<<5;
a|= Byte2Bits._bit4<<4;
a|= Byte2Bits._bit3<<3;
a|= Byte2Bits._bit2<<2;
a|= Byte2Bits._bit1<<1;
a|= Byte2Bits._bit0<<0;
成果:a=0x3C
办法2:强制转化。
typedef struct __BYTE2BITS
{
UINT8 _bit7:1;
UINT8 _bit6:1;
UINT8 _bit5:1;
UINT8 _bit4:1;
UINT8 _bit3:1;
UINT8 _bit2:1;
UINT8 _bit1:1;
UINT8 _bit0:1;
}BYTE2BITS;
BYTE2BITS Byte2Bits;
Byte2Bits._bit7=0;
Byte2Bits._bit6=0;
Byte2Bits._bit5=1;
Byte2Bits._bit4=1;
Byte2Bits._bit3=1;
Byte2Bits._bit2=1;
Byte2Bits._bit1=0;
Byte2Bits._bit0=0;
UINT8 a=0;
a = *(UINT8 *)&Byte2Bits
成果:a=0x3C
比方5:在大端形式下(8051 系列单片机是大端形式)将无符号字节整型值赋给含有位域的结构体。
办法1:逐位赋值。
typedef struct __BYTE2BITS
{
UINT8 _bit7:1;
UINT8 _bit6:1;
UINT8 _bit5:1;
UINT8 _bit4:1;
UINT8 _bit3:1;
UINT8 _bit2:1;
UINT8 _bit1:1;
UINT8 _bit0:1;
}BYTE2BITS;
BYTE2BITS Byte2Bits;
UINT8 a=0x3C;
Byte2Bits._bit7=a&0x80;
Byte2Bits._bit6=a&0x40;
Byte2Bits._bit5=a&0x20;
Byte2Bits._bit4=a&0x10;
Byte2Bits._bit3=a&0x08;
Byte2Bits._bit2=a&0x04;
Byte2Bits._bit1=a&0x02;
Byte2Bits._bit0=a&0x01;
办法2:强制转化。
typedef struct __BYTE2BITS
{
UINT8 _bit7:1;
UINT8 _bit6:1;
UINT8 _bit5:1;
UINT8 _bit4:1;
UINT8 _bit3:1;
UINT8 _bit2:1;
UINT8 _bit1:1;
UINT8 _bit0:1;
}BYTE2BITS;
BYTE2BITS Byte2Bits;
UINT8 a=0x3C;
Byte2Bits= *(BYTE2BITS *)&a;

12. 削减函数调用参数
运用全局变量比函数传递参数愈加有功率。这样做去除了函数调用参数入栈和函数完结后参数出栈所
需求的时刻。可是决议运用全局变量会影响程序的模块化和重入,故要稳重运用。

13. switch 句子中依据产生频率来进行case 排序
switch 句子是一个一般的编程技能,编译器会产生if-else-if 的嵌套代码,并依照次序进行比较,
发现匹配时,就跳转到满意条件的句子履行。运用时需求留意。每一个由机器言语完结的测验和跳转只是
是为了决议下一步要做什么,就把名贵的处理器时刻耗尽。为了进步速度,无法把详细的状况依照它们发
生的相对频率排序。换句话说,把最或许产生的状况放在榜首位,最不或许的状况放在最终。

14. 将大的switch 句子转为嵌套switch 句子
当switch 句子中的case 标号许多时,为了削减比较的次数,正确的做法是把大switch 句子转为嵌
套switch 句子。把产生频率高的case 标号放在一个switch 句子中,并且是嵌套switch 句子的最外
层,产生相对频率相对低的case 标号放在另一个switch 句子中。比方,下面的程序段把相对产生频率
低的状况放在缺省的case 标号内。
UINT8 ucCurTask=1;
void Task1(void);
void Task2(void);
void Task3(void);
void Task4(void);
……………
void Task16(void);
switch(ucCurTask)
{
case 1: Task1();break;
case 2: Task2();break;
case 3: Task3();break;
case 4: Task4();break;
………………………
case 16: Task16();break;
default:break;
}
能够改为
UINT8 ucCurTask=1;
void Task1(void);
void Task2(void);
void Task3(void);
void Task4(void);
……………
void Task16(void);
switch(ucCurTask)
{
case 1: Task1();break;
case 2: Task2();break;
default:
switch(ucCurTask)
{
case 3: Task3();break;
case 4: Task4();break;
………………………
case 16: Task16();break;
default:break;
}
Break;
}
由于switch 句子等同于if-else-if 的嵌套代码,假如大的if 句子相同要转化为嵌套的if 句子。
UINT8 ucCurTask=1;
void Task1(void);
void Task2(void);
void Task3(void);
void Task4(void);
……………
void Task16(void);
if (ucCurTask==1) Task1();
else if(ucCurTask==2) Task2();
else
{
if (ucCurTask==3) Task3();
else if(ucCurTask==4) Task4();
………………
else Task16();
}

15. 函数指针妙用
当switch 句子中的case 标号许多时,或许if 句子的比较次数过多时,为了进步程序履行速度,
能够运用函数指针来替代switch 或if 句子的用法,这些用法能够参阅电子菜单试验代码、USB 试验代码
和网络试验代码。
UINT8 ucCurTask=1;
void Task1(void);
void Task2(void);
void Task3(void);
void Task4(void);
……………
void Task16(void);
switch(ucCurTask)
{
case 1: Task1();break;
case 2: Task2();break;
case 3: Task3();break;
case 4: Task4();break;
………………………
case 16: Task16();break;
default:break;
}
能够改为
UINT8 ucCurTask=1;
void Task1(void);
void Task2(void);
void Task3(void);
void Task4(void);
……………
void Task16(void);
void (*szTaskTbl)[16])(void)={Task1,Task2,Task3,Task4,…,Task16};
调用办法1:(*szTaskTbl[ucCurTask])();
调用办法2: szTaskTbl[ucCurTask]();

16. 循环嵌套
循环在编程中经常用到的,往往会呈现循环嵌套。现在就已for 循环为例。
UINT8 i,j;
for(i=0;i<255;i++)
{
for(j=0;j<25;j++)
{
………………
}
}
较大的循环嵌套较小的循环编译器会糟蹋愈加多的时刻,引荐的做法便是较小的循环嵌套较大的循环。
UINT8 i,j;
for(j=0;j<25;j++)
{
for(i=0;i<255;i++)
{
………………
}
}

17. 内联函数
在C++中,关键字inline 能够被加入到任何函数的声明中。这个关键字恳求编译器用函数内部的代
码替换一切关于指出的函数的调用。这样做在两个方面快于函数调用。这样做在两个方面快于函数调用:
榜首,省去了调用指令需求的履行时刻;第二,省去了传递变元和传递进程需求的时刻。可是运用这种方
法在优化程序速度的一起,程序长度变大了,因而需求更多的ROM。运用这种优化在inline 函数频频调
用并且只包括几行代码的时分是最有用的。
假如编译器答应在C 言语编程中能够支撑inline 关键字,留意不是C++言语编程,并且单片机的ROM
足够大,就能够考虑加上inline 关键字。支撑inline 关键字的编译器如ADS1.2,RealView MDK 等。

18. 从编译器着手
许多编译器都具有倾向于代码履行速度上的优化、代码占用闲暇太小的优化。例如Keil 开发环境编
译时能够挑选倾向于代码履行速度上的优化(Favor Speed)仍是代码占用空间太小的优化(Favor
Size)。还有其他依据GCC 的开发环境一般都会供给-O0、-O1、-O2、—O3、-Os 的优化选项,而运用
-O2 的优化代码履行速度上最理想,运用-Os 优化代码占用空间巨细最小。

19. 嵌入汇编—杀手锏
汇编言语是功率最高的核算机言语,在一般项目开发傍边一般都选用C 言语来开发的,由于嵌入汇编
之后会影响渠道的移植性和可读性,不同渠道的汇编指令是不兼容的。可是关于一些执着的程序员要求程
序取得极致的运转的功率,他们都在C 言语中嵌入汇编,即“混合编程”。
留意:假如想嵌入汇编,必定要对汇编有深入的了解。不到万不得已的状况,不要运用嵌入汇编。

咱们能够学习学习下,在实践中来证明运用开展。

声明:本文内容来自网络转载或用户投稿,文章版权归原作者和原出处所有。文中观点,不代表本站立场。若有侵权请联系本站删除(kf@86ic.com)https://www.86ic.net/qiche/adas/276269.html

为您推荐

联系我们

联系我们

在线咨询: QQ交谈

邮箱: kf@86ic.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

返回顶部