[Bug Hunter]浅说shellcode

  上一篇我们进一步了解了stackoverflow Bug的利用点,就是通过复写函数返回地址的方式来控制程序的逻辑,本篇对shellcode进行一个简单的介绍。虽然本篇暂时和上连篇没有联系,但是我会在Lesson IV里将shellcode和stackoverflow的Bug结合起来。


  何为shellcode呢,shellcode就是一段可执行的二进制代码,可执行程序的代码段是只读的,即.text段是只读的,那么在我们无法更改程序.text段的情况下怎么执行我们自己的代码呢,那就是我们前两篇一直提到的Stack,但是本篇例子放shellcode的地方并不在Stack上,而是在.data段,因为const char code[]是一个全局已经初始化的变量,但是无关本篇的结论,你愿意的话可以把它放到main里去,并不影响结果。


const char code[] = "bytecode will go here!";
int main(int argc, char **argv)
	int (*func)();
	func = (int (*)()) code;

  这段代码比较简单,稍微解释一下吧,函数名在汇编这一层也就是一个label,一个具体地址的替代而已,程序的执行就是顺着地址走的,地址里存的就是具体的cpu指令,而我们的shellcode就是cpu指令,下面我会show给你看的。所以这个例子就是讲code地址转换为函数指针,然后执行函数,就是执行我们的shellcode。原理清楚了,我们试着跑一下这个测试模板,可想而知,code的数据并不是cpu指令,所以会引发segment fault。你可以编译运行一下以上的代码段,结果如下:

Segmentation fault


; exit.asm
[SECTION .text]
global _start
    xor eax, eax
    mov al, 1
    mov ebx, 10
    int 0x80

  这段汇编的作用就是调用了系统调用sys_exit(10),这里有x86的系统调用列表,Linux System Call Table。先生成shellcode,nasm -f elf exit.asm,然后ld exit.o -o exiter -melf_i386,然后objdump -d exiter >log,这里是log文件的内容:

exiter: file format elf32-i386
Disassembly of section .text:
08048060 <_start>:
8048060: 31 c0 xor %eax,%eax
8048062: b0 01 mov $0x1,%al
8048064: 31 db xor %ebx,%ebx
8048066: cd 80 int $0x80

  那么\x31\xc0\xb0\x01\x31\xdb\xcd\x80,就是我们要找的cpu指令,即所谓的shellcode,我们可以直接用工具截取objdump内容的shellcode,odfhex。代码也比较简单,当然作者并不是博主。./odfhex log,得到结果如下:

Odfhex - object dump shellcode extractor - by steve hanna - v.01
Trying to extract the hex of log which is 279 bytes long
11 bytes extracted.

  用以上shellcode替换code[]的内容,编译运行,并没有segment fault,程序正常退出,在shell里echo $?获取程序执行的返回码,为10,证明我们的shellcode成功执行了。

一个简单的hello hacking world的例子

[SECTION .text]
global _start
    jmp short ender

    xor eax, eax    ;clean up the registers
    xor ebx, ebx
    xor edx, edx
    xor ecx, ecx

    mov al, 4       ;syscall write
    mov bl, 1       ;stdout is 1
    pop ecx         ;get the address of the string from the stack
    mov dl, 20       ;length of the string
    int 0x80

    xor eax, eax
    mov al, 1       ;exit the shellcode
    xor ebx,ebx
    int 0x80

    call starter	;put the address of the string on the stack
    db 'hello hacking world',0x0a

  简单说下这段汇编代码,程序由_start开始执行,定义局部变量,存的是字符串hello hacking world\n0x0a就是\n,调用call会直接将下一条指令压栈,所以跳转到starter,清空寄存器,xor可以用来快速将寄存器清零,然后调用sys_write,然后调用sys_exit()。编译hello.asmnasm -f elf hello.asm,然后ld hello.o -o hello -melf_i386,然后objdump -d hello >log,然后./odfhex log,结果如下:

Odfhex - object dump shellcode extractor - by steve hanna - v.01
Trying to extract the hex of log which is 1265 bytes long
52 bytes extracted.


hello hacking world


  以上例子仅仅是为了说明shellcode的基本原理,让我们来展望一下,如果执行我们的shellcode的是一个root user,那么说明什么呢?首先我们可以轻松构造一个shellcode拿到对方机器的shell,然后可以干什么呢?可以干任何事,对方的机器对我们来说就是一个肉鸡啦。下一期我会将shellcode和stackoverflow结合起来,因为shellcode本来自身就是一个非常深的话题,我们这里浅尝辄止,感兴趣可以关注这里的资源The Shellcoder's Handbook


