Bytecode's

Hallo, ich lese ab und zu etwas über Bytecodes. Mich würd mal interessieren was das ist. Wie diese aussehen. Wie man diese erstellt und so. Danke für die Antworten.

cu

rüdiger

http://foldoc.doc.ic.ac.uk/foldoc/foldoc.cgi?query=bytecode&action=Search

und wie macht man selber sowas?

SG1

Normalerweise gar nicht, dafuer gibts doch Compiler.

? Und wie haben es die Java Entwickler gemacht?

Taurin

Die haben Java-Compiler geschrieben, die Javecode in Bytecode übersetzten.

Leute, sagt doch wenn ihr auch nicht wisst wie es geht.

Ich wollte nur verstehen wie das Funktioniert. Natürlich habe ich jetzt etwas darüber erfahren. Aber wie implementiert man sowas. Und wie wird so ein Bytecode später von der Exe verarbeitet. Das habe ich noch nicht verstanden.

Bitte nur die antorten die auch wissen was ich meine. Der Rest kann mitlesen und etwas dazu lernen.

Shade Of Mine

p9 schrieb:

Ich wollte nur verstehen wie das Funktioniert. Natürlich habe ich jetzt etwas darüber erfahren. Aber wie implementiert man sowas. Und wie wird so ein Bytecode später von der Exe verarbeitet. Das habe ich noch nicht verstanden.

Bytecode ist nichts anderes als eine eigene Sprache wenn du so willst. Nur statt

print "Hallo"
schreibt man
00 32 A7 C0 AA CA AD D7 79 67 D6 ...

Es kommt nur auf das parsen an.
Eine fuer menschen lesbare Syntax ist schwer ist parsen, bzw. kann nicht so einfach optimaler Code daraus generiert werden.

Deswegen gehen Interpretersprachen gerne ueber einen Bytecode, der quasi wie eine kompilierte EXE ist, nur dass den Code nicht der Prozessor, sondern der Interpreter zu lesen bekommt. Dieser wandelt ihn dann zB in fuer den Prozessor verstaendliche Symbole um, oder Interpretiert den Bytecode selber.

Was genau interessiert dich?

SirLant

Wenn du dir einmal eine kompilierte class-datei von Java ansiehst, wirst du
feststellen, dass dort nur Schlüsselwörter in Bytecode übersetzt wurde Strings
und Zahlenkonstanten sind nach wie vor lesbar.
Es ist für einen Computer einfach leichter mit Binärdateien zu hantieren und dort
immer X-Bytes einzulesen und zu analysieren was für ein Symbol/Schlüsselwort das
ist, als Zeichen für Zeichen einzulesen und diesen einen Sinn zu geben, bzw.
möglich ohne Probleme aber viel aufwändiger und langsamer.

Perl verwendet auch ein internes Format, da Perl OpenSource ist kannst du dir
ja mal anschauen wie die das machen und wie das anschließend aussieht.

Danke für diese Antworten.

Ich habe mal eine einfache Skriptsprache geschrieben. Die Exe-Datei hat diese Script Befehle interpretiert.

player 0,0,100 <- Script Befehl

Pseudocode (exe):

if "player"
  player.x=x;
  player.y=y;
  ...

In Bytecode müsste es so was sein:

01 00 00 64

if 01 //01 wird als player interpretiert
  player.x=00;
  player.y=00;
  player.z=64;
  ...

Ich hoffe mal das ich das richtig verstanden habe.

SirLant

Wenn du ein Schlüsselwort "Player" in der Sprache hast und dieses in Bytecode
als 0x01 darstellst, dann müsstest du eben 1Byte der Datei einlesen und eben
schauen ob es 0x01 oder 0x02,... ist.

frenki

Hmmm, habe ich da Jahrelang was falsch gemacht?

Bei mir ist Bytecode so eine Art Minimal-Assembler der von meiner Virtuellen Maschine ausgeführt wird.

Wenn ich ein "Script" habe, das so aussieht:

a = "Hallo"
b = " Welt"
c = a || b // || sei mein String-Concatenate, ist von SQL abgeschaut
print(c)

sähe der Bytecode dafür z.B. so aus:

push "Hallo"
setvar a // Popt Element vom Stack und weist der der Variablen a zu
push " Welt"
setvar b
pushvar a // Inhalt der Variablen a auf den Stack pushen
pushvar b
concatenate // Zwei Elemente von Stack popen, zusammehängen und das Ergebnis pushen
funcall "print" // Funktion print aufrufen

Nur halt dass setvar z.B. 0x01 ist, push 0x02, pop 0x03 usw...

Ähm... Was ich damit sagen will, Bytecode ist für mich direkt ausführbarer Code. Da wird nichts mehr geparsed oder Interpertiert, der wird direkt so wie er ist von der VM ausgeführt.

Shade Of Mine

frenki schrieb:

Ähm... Was ich damit sagen will, Bytecode ist für mich direkt ausführbarer Code. Da wird nichts mehr geparsed oder Interpertiert, der wird direkt so wie er ist von der VM ausgeführt.

Aha, woher weiss denn dein Interpreter was er bei
0x01 0x07 0x10
machen soll?

Weil er es interpretiert. Genauso macht es der Prozessor ja auch. Er sieht eine Zahlenkombinationen und erkennt: aha, na dann pushe ich das da mal auf den stack

frenki

Ähhh, ja so gesehen hast du recht.

Allerdings ist meine VM einfach nur ein Array aus Funktionen und die Bytecodes sind die Indizies in dieses Array