Я экспериментировал со сборкой в Linux с помощью NASM, чтобы понять скрипт loader.s на OSDev.
Одна вещь, которая показалась мне интересной, это сборка, созданная при объявлении переменной с помощью dd. Я провел несколько тестов и привел результат ниже. По сути, я просто выделяю разные числа и смотрю, какая сборка генерируется в объектном файле (не в исполняемом файле).
$ cat test1.s
global _start
section .text
dd 0x0
_start:
mov eax, 1
mov ebx, 0
int 80h
$ nasm -f elf test1.s ; objdump -d test1.o
test1.o: file format elf32-i386
Disassembly of section .text:
00000000 <_start-0x4>:
0: 00 00 add %al,(%eax)
...
00000004 <_start>:
4: b8 01 00 00 00 mov $0x1,%eax
9: bb 00 00 00 00 mov $0x0,%ebx
e: cd 80 int $0x80
.
$ cat test2.s
global _start
section .text
dd 0x0
dd 0x5
_start:
mov eax, 1
mov ebx, 0
int 80h
$ nasm -f elf test2.s ; objdump -d test2.o
test2.o: file format elf32-i386
Disassembly of section .text:
00000000 <_start-0x8>:
0: 00 00 add %al,(%eax)
2: 00 00 add %al,(%eax)
4: 05 00 00 00 b8 add $0xb8000000,%eax
00000008 <_start>:
8: b8 01 00 00 00 mov $0x1,%eax
d: bb 00 00 00 00 mov $0x0,%ebx
12: cd 80 int $0x80
.
$ cat test3.s
global _start
section .text
dd 0x0
dd 0x5
dd 0xf
_start:
mov eax, 1
mov ebx, 0
int 80h
$ nasm -f elf test3.s ; objdump -d test3.o
test3.o: file format elf32-i386
Disassembly of section .text:
00000000 <_start-0xc>:
0: 00 00 add %al,(%eax)
2: 00 00 add %al,(%eax)
4: 05 00 00 00 0f add $0xf000000,%eax
9: 00 00 add %al,(%eax)
...
0000000c <_start>:
c: b8 01 00 00 00 mov $0x1,%eax
11: bb 00 00 00 00 mov $0x0,%ebx
16: cd 80 int $0x80
.
$ cat test4.s
global _start
section .text
dd 0x0
dd 0x5
dd 0xf
dd 0x16
_start:
mov eax, 1
mov ebx, 0
int 80h
$ nasm -f elf test4.s ; objdump -d test4.o
test4.o: file format elf32-i386
Disassembly of section .text:
00000000 <_start-0x10>:
0: 00 00 add %al,(%eax)
2: 00 00 add %al,(%eax)
4: 05 00 00 00 0f add $0xf000000,%eax
9: 00 00 add %al,(%eax)
b: 00 16 add %dl,(%esi)
d: 00 00 add %al,(%eax)
...
00000010 <_start>:
10: b8 01 00 00 00 mov $0x1,%eax
15: bb 00 00 00 00 mov $0x0,%ebx
1a: cd 80 int $0x80
Мой вопрос: почему мы сначала добавляем что-то в регистр eax, а затем модифицируем другие регистры, такие как edx и esi, по мере роста данных? При размещении этих данных не следует использовать регистры, и особенно не следует их добавлять. И почему я никогда не вижу, чтобы правильная переменная помещалась в регистр (ответ на первый вопрос может ответить на это)? Например, я вижу инструкцию add $0xb8000000,%eax
, когда выделяю 0x5, но в этой инструкции нет 0x5.