最简略C代码剖析
为简化问题,来剖析一下最简的c代码生成的汇编代码:
# vi test1.c
int main()
{
return 0;
}
编译该程序,发生二进制文件:
# gcc test1.c -o test1
# file test1
test1: ELF 32-bit LSB executable 80386 Version 1, dynamically linked, not stripped
test1是一个ELF格局32位小端(Little Endian)的可执行文件,动态链接而且符号表没有去除。
这正是Unix/Linux渠道典型的可执行文件格局。
用mdb反汇编能够调查生成的汇编代码:
# mdb test1
Loading modules: [ libc.so.1 ]
> main::dis ; 反汇编main函数,mdb的指令一般格局为 <地址>::dis
main: pushl %ebp;ebp寄存器内容压栈,即保存main函数的上级调用函数的栈基地址
main+1: movl %esp,%ebp ; esp值赋给ebp,设置main函数的栈基址main+3:subl $8,%esp
main+6:andl $0xf0,%esp
main+9:movl $0,%eax
main+0xe:subl %eax,%esp
main+0x10: movl $0,%eax ; 设置函数回来值0
main+0x15:leave; 将ebp值赋给esp,pop从前栈内的上级函数栈的基地址给ebp,恢恢复栈基址
main+0x16: ret ; main函数回来,回到上级调用
注:这儿得到的汇编言语语法格局与Intel的手册有很大不同,Unix/Linux选用AT&T汇编格局作为汇编言语的语法格局
问题:谁调用了 main函数?
在C言语的层面来看,main函数是一个程序的开端进口点,而实际上,ELF可执行文件的进口点并不是main而是_start。
mdb也能够反汇编_start:
> _start::dis ;从_start 的地址开端反汇编
_start: pushl $0
_start+2: pushl $0
_start+4: movl %esp,%ebp
_start+6: pushl %edx
_start+7: movl $0x80504b0,%eax
_start+0xc: testl %eax,%eax
_start+0xe: je +0xf <_start+0x1d>
_start+0x10: pushl $0x80504b0
_start+0x15: call -0x75
_start+0x1a: addl $4,%esp
_start+0x1d: movl $0x8060710,%eax
_start+0x22: testl %eax,%eax
_start+0x24: je +7 <_start+0x2b>
_start+0x26: call -0x86
_start+0x2b: pushl $0x80506cd
_start+0x30: call -0x90
_start+0x35: movl +8(%ebp),%eax
_start+0x38: leal +0x10(%ebp,%eax,4),%edx
_start+0x3c: movl %edx,0x8060804
_start+0x42: andl $0xf0,%esp
_start+0x45: subl $4,%esp
_start+0x48: pushl %edx
_start+0x49: leal +0xc(%ebp),%edx
_start+0x4c: pushl %edx
_start+0x4d: pushl %eax
_start+0x4e: call +0x152 <_init>
_start+0x53: call -0xa3 <__fpstart>
_start+0x58: call +0xfb ;在这儿调用了main函数
_start+0x5d: addl $0xc,%esp
_start+0x60: pushl %eax
_start+0x61: call -0xa1
_start+0x66: pushl $0
_start+0x68: movl $1,%eax
_start+0x6d: lcall $7,$0
_start+0x74: hlt
声明:本文内容来自网络转载或用户投稿,文章版权归原作者和原出处所有。文中观点,不代表本站立场。若有侵权请联系本站删除(kf@86ic.com)https://www.86ic.net/qianrushi/xitong/260219.html