Was tut dieser Assembly Code? (Anfängerfrage)



  • Der Opcode für xor eax, eax ist kürzer als der für mov eax, 0, daher verwendet man es immer noch. Ich würde sogar sagen dass es so üblich ist, dass es den einen oder anderen geübten Assembler-Leser ein klein bisschen verwirren könnte mov eax, 0 zu lesen.

    BTW: xor eax, eax ist auch kürzer als xor rax, rax, weswegen man xor eax, eax auch findet wenn das ganze rax auf 0 gesetzt werden soll. Was sich wieder die Tatsache zu nutze macht dass bei 32 Bit Befehlen im 64 Bit Mode die oberen 32 Bit des Ziel-Registers auf 0 gesetzt werden.

    Und Speicher soll wohl auch ein ziemlicher Flaschenhals geworden sein, da dessen Geschwindigkeit nicht so schnell gewachsen ist wie bei den CPUs, also wird es heute wohl weniger LUTs geben als früher, wenn die Berechnung weniger kostet als ein Speicherzugriff.

    Was günstiger ist kommt auf viele Faktoren an. Wenn man viele Werte in Folge aus der LUT braucht, die LUT klein genug ist und die Befehle um den Wert direkt zu berechnen teuer genug, dann zahlt sich das schon noch aus. Für eine Multiplikation macht man es aber eher nicht mehr. Für eine Division meist auch nicht, aber für viele in Folge... vielleicht doch.


  • Gesperrt

    Hier kommt immer eine Gleitkomma-Ausnahme und ich weiß auch nicht, wieso ich rax nur relativ adressieren kann:

    	.text
    	.globl	getx
    	.type	getx, @function
    getx:
    .LFB0:
    	push		%rax
    	push		%rbx
    	push		%rcx
    	push		%rdx
    #	mov			%r8, %rax
    #	mov			%r9, %rbx
    # main.c:7: 	float w2 = w * (M_PI / 180.0);
    # main.c:8: 	x = (int) (r * cos(w2));
    # main.c:9: 	return x;
    	mov			$0x4048f5c3, %rax
    	mov			$0x43340000, %rbx
    	div			%rbx
    	mul			%r8
    	movsd		0(%rax), %xmm0
    	call		cos@PLT
    	movsd		%xmm0, 0(%rax)
    	mul			%r9
    	mov			0(%rax), %eax
    #	pop			%rax
    #	pop			%rbx
    #	pop			%rcx
    #	pop			%rdx
    	leave
    	ret
    

    Aufruf:

    # main.c:24: 		x = getx(25, i);
    	mov		%rbp, %r8	# i, tmp87
    	mov		$25, %r9	#,
    	call	getx	#
    	movl	%eax, -16(%rbp)	# tmp88, x
    


  • Die Ausnahme kommt vermutlich gerade weil du rax "relativ addressierst" - das heisst ja du lädst den Wert für xmm0 aus dem Speicher, und zwar von der Adresse die in rax steht. Und da an der Adresse - wenig überraschend - nix gemappt ist, gibt's aua.

    Und warum es nicht "direkt" geht: rax ist ein 64 Bit Skalar-Register, xmm0 ist ein 128 Bit Vektorregister. Wie soll das also gehen? Angenommen es gibt einen Register<->Register mov Befehl der das kann (keinen Ahnung ob es den gibt), dann müsstest du zumindest irgendwo mit angeben was genau er jetzt mit den 64 Bit machen soll. Also wie er die 64 Bit aus rax auf xmm0 "aufteilen" soll.

    Bei "indirekt" dagegen nimmt der Compiler an dass xmm0 in seinem normalen Format (also 128 Bit) im Speicher liegt. Und das geht natürlich immer, dabei ist ja keine Konvertierung/Abbildung von Bits nötig.


  • Gesperrt

    Auch damit geht es nicht (gleiche Fehlermeldung)

    getx:
    .LFB0:
    	push		%rax
    	push		%rbx
    	push		%rcx
    	push		%rdx
    #	mov			%r8, %rax
    #	mov			%r9, %rbx
    # main.c:7: 	float w2 = w * (M_PI / 180.0);
    # main.c:8: 	x = (int) (r * cos(w2));
    # main.c:9: 	return x;
    	mov			$0x4048f5c3, %rax
    	mov			$0x43340000, %rbx
    	div			%rbx
    	mul			%r8
    	movd		%rax, %xmm0
    	call		cos@PLT
    	movd		%xmm0, %rax
    	mul			%r9
    	movd		%rax, %xmm0
    	cvttsd2si	%xmm0, %eax
    #	pop			%rax
    #	pop			%rbx
    #	pop			%rcx
    #	pop			%rdx
    	leave
    	ret
    


  • Sorry, ich hab vollkommen übersehen dass da ja nicht mov sondern movd stand. Peinlich.

    Fangen wir mal so an: Was willst du denn überhaupt machen?

    Und: Ich mag mich jetzt täuschen, aber mir wäre nicht bekannt dass man bei AMD64 die "normalen" Register (rax, rbx, ..., r8 ... r15) für Floating-Point Berechnungen verwenden könnte.
    Und z.B.

    	mul			%r9
    

    ist ziemlich sicher ne 64 Bit Integer Multiplikation (rax = rax * r9). Da würde ich jetzt mittlere Geldbeträge drauf verwetten.

    Wenn du Float-Zeugs machen willst musst du die SSE* Register verwenden (oder den guten alten x87 Registerstack).


  • Gesperrt

    Also was ich machen möchte das steht in den Kommentaren in Zeile 9, 10 und 11.

    Sowas blödes... Dann hab ich die ganze Zeit die falschen Register verwendet!

    Aber nochmal ganz kurz umrissen, was ich machen möchte:
    Es werden zwei int Werte übergeben, sagen wir jetzt einfach mal i und j.
    Dann möchte ich einmal dividieren und zweimal multiplizieren (und einmal cos aufrufen):
    (cos((3.14 / 180.0) * i) * j)
    Das Ergebnis möchte ich dann wieder in einen int Wert konvertieren und nach %eax schieben.



  • @EinNutzer0 (3.14 / 180.0) ist ein Konstanter Wert, den du schon vorher ausrechnen kannst (spart die Division).


  • Gesperrt

    @DirkB : richtig, das wäre $0x3c8efa35. 🙂



  • @EinNutzer0 sagte in Was tut dieser Assembly Code? (Anfängerfrage):

    Dann möchte ich einmal dividieren und zweimal multiplizieren (und einmal cos aufrufen):
    (cos((3.14 / 180.0) * i) * j)

    Du willst aber eine floating-Point-Division durchführen! div mit rax ist aber Integer-Division. Floating point Division ist fdiv (wie im Pentium-Bug) (das wäre @hustbaer s "guter alter" Weg). Mit SSE kannst du z.B. mit cvtsi2sd xmm0, eax den Wert aus eax von int nach double konvertieren. Dann weiter mit divsd oder so.

    Schau dir doch einfach mal den gewünschten Code an im Compiler Explorer an. Nur für dich als Beispiel: https://godbolt.org/z/7cxXFW



  • @EinNutzer0 ich weiß immer noch nicht was du mit x86-64 asm willst wenn du lernen sollst einen bestimmten (welchen?) µController zu programmieren. Geht nicht in mein Hirn.


  • Gesperrt

    @wob : super, ich weiß nur noch nicht, wie man selber zu solch einer Lösung gelangen kann.


  • Gesperrt

    @wob sagte in Was tut dieser Assembly Code? (Anfängerfrage):

    dann hast du doch bestimmt irgendwas bekommen haben, womit du lernen sollst?!

    Wir haben ein Skript. Das gute Stück umfasst 500 Folien und mehr... Aber das Problem: es ist zwar Assembler Code vorhanden, jedoch wird dieser in keinster Weise erklärt.



  • @EinNutzer0 sagte in Was tut dieser Assembly Code? (Anfängerfrage):

    Wir haben ein Skript. Das gute Stück umfasst 500 Folien und mehr... Aber das Problem: es ist zwar Assembler Code vorhanden, jedoch wird dieser in keinster Weise erklärt.

    Nochmal:

    @Swordfish sagte in Was tut dieser Assembly Code? (Anfängerfrage):

    [...] (welchen?) µController [...]

    MMX auf x86-64 hilft dir dabei sicher nicht.


  • Gesperrt

    Ich hab noch lauter Fragezeichen... funktioniert muls.. , divs.. usw. nur dann, wenn ich eax vorher in xmm schiebe? Ist das immer so, dass es mit den general purpose register nicht funktioniert? Und was genau bewirkt push %rax und push %rbx, wieso braucht man danach ein mov für lokale Variablen? Und soll man noch pop aufrufen oder bewirkt das das leave.

    Sorry man merkt ich bin Anfänger auf diesem Gebiet, aber haben wir alle nicht mal low begonnen?

    @Swordfish sagte in Was tut dieser Assembly Code? (Anfängerfrage):

    (welchen?) µController

    Das versuche ich gerade herauszufinden... In der Prüfung kann auch ein ganz anderer mc drankommen, es wird ein Teil der Doku mitgegeben. Dennoch möchte ich mich "vorbereiten".


  • Gesperrt

    Habe jetzt Assemblercode der funktioniert aber das falsche Ergebnis für x ausgibt:

    	.text
    	.globl	getx
    	.type	getx, @function
    getx:
    .LFB0:
    	push		%rcx
    # main.c:7: 	float w2 = w * (M_PI / 180.0);
    # main.c:8: 	x = (int) (r * cos(w2));
    # main.c:9: 	return x;
    	movl			$0x4048f5c3, %ecx
    	movl			$0x43340000, %edx
    	cvtsi2sd	%ecx, %xmm0
    	cvtsi2sd	%edx, %xmm1
    	divsd		%xmm0, %xmm1
    	cvtsi2sd	%eax, %xmm0
    	mulsd		%xmm0, %xmm1
    	movsd			%xmm1, %xmm0
    	call		cos@PLT
    	movsd			%xmm0, %xmm1
    	cvtsi2sd	%ebx, %xmm0
    	mulsd		%xmm0, %xmm1
    	cvttsd2si	%xmm1, %eax
    	pop			%rcx
    	ret
    

    Caller:

    # main.c:24: 		x = getx(25, i);
    	movl	-4(%rbp), %ebx	# i, tmp87
    	movl		$25, %eax	#,
    	call	getx	#
    	movl	%eax, -16(%rbp)	# tmp88, x
    # main.c:25: 		y = gety(25, i);
    	movl	-4(%rbp), %eax	# i, tmp89
    	movl	%eax, %esi	# tmp89,
    	movl	$25, %edi	#,
    	call	gety	#
    	movl	%eax, -20(%rbp)	# tmp90, y
    

    Wieso ist das Ergebnis noch falsch?



  • @EinNutzer0 sagte in Was tut dieser Assembly Code? (Anfängerfrage):

    In der Prüfung kann auch ein ganz anderer mc drankommen, es wird ein Teil der Doku mitgegeben.

    Dann wird das sicher etwas ziemlich simples sein. Ich finde aber so eine Ansage eher ... ähm ... pervers.
    Auf jeden Fall wird es mit ziemlicher Sicherheit nicht AT&T-Syntax sein.



  • Stimme Swordfish zu. Du willst jetzt speziell Floating-Point-Berechnung auf X8664 lernen, um Mikrocontroller-Assembler zu schreiben?!

    Jedenfalls: was tust du denn eigentlich in deiner Funktion?
    Du teilst 0x43340000 durch 0x4048f5c3 (oder andersrum, ich kommt bei at&t immer durcheinander) - das ergibt 1.0453936 und hat in jedem Fall nichts mit pi/180 zu tun. Wie kommst du überhaupt auf die beiden Zahlen in Zeile 10/11?



  • @EinNutzer0
    0x4048f5c3 ist die IEEE single precision float representation für 3.14.
    So funktioniert das aber nicht. cvtsi2sd interpretiert den Wert im Register als Integer.
    Laut Internetz kannst du movd dafür verwenden.
    Also statt

    	movl			$0x4048f5c3, %ecx
    	movl			$0x43340000, %edx
    	cvtsi2sd	%ecx, %xmm0
    	cvtsi2sd	%edx, %xmm1
    

    dann

    	movl			$0x4048f5c3, %ecx
    	movl			$0x43340000, %edx
    	movd			%ecx, %xmm0
    	movd			%edx, %xmm1
    

    Die weiteren cvtsi2sd müssen aber bleiben, denn da willst du ja wirklich nen Integer nach Float konvertieren.


  • Gesperrt

    Ich glaub jetzt inzwischen, die float literals sind das Problem... (Und ich hatte eax und ebx in getx vertauscht...)

    Hier hab ich eine interessante Quelle gefunden: https://www3.nd.edu/~dthain/courses/cse40243/fall2015/intel-intro.html

    https://a.uguu.se/bm1a5UpI4kHZ.png

    https://a.uguu.se/KKLJK0bxdZFI.png

    https://a.uguu.se/gNWD5HtWKcry.png

    Möglichkeit 2: Man verwende ein int literal und teile dies durch einen Divisor


  • Mod

    Da du so konsequent diese Frage von Swordfish, DirkB und anderen ignorierst, versuche ich noch einmal mein Glück: Du bist dir vollkommen bewusst, dass die Feinheiten der x64-Floating-Point-Programmierung dir absolut gar nichts helfen, wenn du einen anderen Prozessortyp als eigentliche Zielplattform hast? Dass du gerade deine Zeit damit vertrödelst Spanisch zu büffeln, wenn du demnächst eine Französischklausur schreiben musst?

    Schlimmer noch: Allem nach zu beurteilen, was du bisher gesagt hast, geht es in der Prüfung doch wohl eher um fundamentales wie Kontrollfluss und grundlegende Algorithmen, wohingegen Floating Point Berechnungen erst recht nutzloses Spezialwissen sind. Du lernst spanische Sprichwörter, wenn es um französische Grammatik geht.


Anmelden zum Antworten