Eigenes OS?


  • Mod

    @+fricky: Danke für Deine Ratschläge. 🙂



  • Erhard Henkes schrieb:

    @+fricky: Danke für Deine Ratschläge.

    keine ursache. es gibt übrigens auch kernels, die ganz ohne asm auskommen. such mal nach protothreads/contiki und das hier:
    http://www.nilsenelektronikk.no/nenesos.html
    🙂


  • Mod

    Contiki is designed for microcontrollers with small amounts of memory. A typical Contiki configuration is 2 kilobytes of RAM and 40 kilobytes of ROM.

    Ist mir schon klar, wo ich mich bei dem x86-Gerödel befinde. Das Programm oder OS wird dann eben ins EEPROM geflasht (mache ich beim Asuro oder Nibo auch: http://www.henkessoft.de/Roboter/Bilder/Nibo_mit_STK500_flashen_Ausschnitt_small.jpg ) anstelle von Floppy oder Hard Disk gebootet. Übrigens sehe ich ASM nicht als Nachteil für den bisherigen OS Start.

    Mal eine andere Frage: Kennt sich jemand mit Qemu aus? Ich habe es bisher nicht geschafft, das OS damit zu booten. Lohnt es sich, sich damit herum zu quälen?

    Zum Debuggen erscheint mir der Bochs Debugger momentan ideal.
    @Nobuo T: Wie debuggst Du bei solchen Entwicklungen genau?



  • Im Abschnitt über die A20-Leitung ist mir folgendes aufgefallen:

    Es fehlt der definitive Grund, warum sie unbedingt im PM aktiviert sein muß. Ich will es mal so formulieren: Im PM kann ich auf die paar Byte, die die A20-Leitung adressiert, auch gerne verzichten. Aber warum sollte ich das lieber nicht? 🙂



  • Erhard Henkes schrieb:

    Contiki is designed for microcontrollers with small amounts of memory. A typical Contiki configuration is 2 kilobytes of RAM and 40 kilobytes of ROM.

    Ist mir schon klar, wo ich mich bei dem x86-Gerödel befinde. Das Programm oder OS wird dann eben ins EEPROM geflasht (mache ich beim Asuro oder Nibo auch: http://www.henkessoft.de/Roboter/Bilder/Nibo_mit_STK500_flashen_Ausschnitt_small.jpg ) anstelle von Floppy oder Hard Disk gebootet.

    naja, das waren ja nur beispiele, für nicht-preemptive kernels, die entweder continuations oder state machines für's task-switching benutzen. sowas muss nicht unbedingt ins flash, man kann's auch vom laufwerk booten.

    Übrigens sehe ich ASM nicht als Nachteil für den bisherigen OS Start.

    nachteil ist, je mehr asm du einsetzt, desto mehr nagelst du dein OS auf einen spezifischen prozessor fest. und wenn du so, wie bis jetzt, weiter machst, kannste dein tutorial bald in 'die geheimen tricks der x86-assembler gurus' umtaufen.
    🙂


  • Mod

    Es fehlt der definitive Grund, warum sie unbedingt im PM aktiviert sein muß. Ich will es mal so formulieren: Im PM kann ich auf die paar Byte, die die A20-Leitung adressiert, auch gerne verzichten. Aber warum sollte ich das lieber nicht?

    Im Protected Mode kann man problemlos mit 32 Bit arbeiten. Daher muss man das A20-Gate wieder aktivieren, da ansonsten bei bestimmten Speicherzugriffen Fehler auftreten, da die 21. Adressleitung deaktiviert ist. Das bedeutet, das man auf eine andere Speicherstelle zugreifen kann als beabsichtigt. Daher schaltet man A20 ein, bevor man den Kernel und weitere Programmteile startet. Ist das so o.k.?


  • Mod

    wenn du so, wie bis jetzt, weiter machst, kannste dein tutorial bald in 'die geheimen tricks der x86-assembler gurus' umtaufen.

    Ja, da hast Du evtl. Recht.



  • @Erhard Henkes: Inwiefern nervt Sund VirtualBox eigentlich bei dir mit Werbung?
    Bei mir erscheinen nur gelegentlich Tipps und Hinweise auf Updates, ich finde diese Passage zur Werbung daher etwas übertrieben...



  • Erhard Henkes schrieb:

    wenn du so, wie bis jetzt, weiter machst, kannste dein tutorial bald in 'die geheimen tricks der x86-assembler gurus' umtaufen.

    Ja, da hast Du evtl. Recht.

    Ich denke, jeder verfolgt beim Programmieren seine eigene Philosophie. Und in Assembler ist es irgendwie so, je länger man sich damit beschäftigt, desto verschwommener wird die Grenze "tricks" und "normal".
    Zum Beispiel einfache Zeile aus kernel.asm:

    xor cx, cx
    

    Warum nicht einfach:

    mov cx, 0
    

    Oder noch eine Zeile:

    or cl, cl     ; zero? (start of the string)
    

    Warum nicht einfach:

    cmp cl, 0
    

    Und man braucht nicht einmal ein Kommentar dazu. Jeder, der es liest, sieht sofort: compare irgendwas mit Null.
    Ich habe bei mir persönlich festgestellt, je "idiotensicherer" der Code geschrieben, desto weniger Kommentare und noch weniger Zeit beim Debuggen. Aber das ist wiederum meine "Philosophie".



  • IMHO, wer mit so einer Philosophie anfaengt (x86)Asm zu programmieren, kann irgendwo nicht wirkliche viel Ahnung von der Plattform haben, fuer die er da programmiert und ist daher wohl besser beraten, es bleiben zu lassen und auf eine abstrakte Hochsprache umzusteigen, in der derart "idiotensichererer Code" in der Performance nicht so kontraproduktiv, und auch allgemein viel effektiver uebersichtlicher zu gestalten ist.
    So ist das doch einfach eine billige Ausrede fuer schlechten Code.

    edit: Ack volkard. Auch ein guter Vergleich. 🙂



  • wer

    xor cx, cx
    

    verschmäht, weil es angeblich unleserlich wäre, und

    mov cx, 0
    

    vorzieht, der muß in der hochsprache auch

    ++c;
    

    meiden und immer brav

    c = c + 1;
    

    schreiben.


  • Mod

    Bei mir erscheinen nur gelegentlich Tipps und Hinweise auf Updates, ich finde diese Passage zur Werbung daher etwas übertrieben...

    Akzeptiert, werde dies abmildern. Möchte sachlich bleiben, hat mich aber schon ziemlich genervt.


  • Mod

    Wir haben einen noch etwas ausbaubaren Real Mode, auch im PM könnte man in Assembler noch etwas machen, aber ich denke, nun ist es an der Zeit, zu einem in C geschriebenen Kernel zu wechseln.

    Als Compiler unter Windows verwende ich den allseits bekannten Compiler DJGPP (2.03 ohne C++). Ist dies das richtige Werkzeug? (Download bei Bona Fide OS Dev.) http://www.osdever.net/downloads/compilers/DJGPP-Installer-nocpp.exe

    Dazu habe ich eine technische Frage:

    Ich habe boot.bin (aufgefüllt auf 512 Byte mit Bootsignatur) und kernel.bin (aufgefüllt auf 1024 Byte).

    Dann habe ich ein k(ernel)_entry.asm und ckernel.asm, das via k_entry.o und ckernel.o mittels linker ld zu ckernel.bin gelinkt wird.

    Dann packe ich alles zu einer einzigen Binärdatei zusammen, die dann auf Floppy geschrieben wird: copy /b boot.bin + kernel.bin + ckernel.bin MyOS.bin

    Der Bootloader lädt sich selbst nach 0x7C00 und den Rest nach 0x8000. Der gelinkte Part mit dem C-Kernel fängt durch die HLT-Auffüllung ab 0x8400 an.

    so sieht k_entry.asm aus:

    [BITS 32]
    
    [global start]
    [extern _main] ; this is in the c file
    hlt
    hlt 
    hlt
    start:
      call _main
      jmp $
    

    Ich kann im bin-Format nicht [extern start] angeben und dann nach start springen: jmp 0x8:0x8000+start

    Daher habe ich mir erst mal die drei HLT vor start gebaut, dann kann ich die Startadresse im Hexeditor hinter den "f4f4f4" leicht finden 😃 und direkt anspringen, z.B.: jmp 0x8:0x86e3; goto C-Kernel (0x8400 + 0x02e3 ist natürlich eine variable Zielscheibe).
    Finde das didaktisch interessant, weil man hier zeigen kann, wie die Zusammenhänge im Speicher ganz genau sind und warum man eine Objektdatei benötigt, denn "start" kann man nur dort als externes Label verwenden.

    Was ist hier eurer Meinung nach der sauberste Weg?
    Benötigt man überhaupt noch eine Zwischen-Datei k(ernel)_entry.asm? (16/32-Bit-Problematik beim ersten Kernel? Außerdem haben wir im ersten Kernel "org 0x8000" verwendet, was wiederum nur im Binär-Format geht)

    Gibt es irgendwie einen Trick (außer dem Spicken nach einer optischen Erkennungsmarke in der Binärdatei), dass man aus kernel.bin nach "start" springen kann, also wie gesagt "extern start" klappt nicht im Binär-Format.

    Der Sprung von _main nach _main() {...} innerhalb der Objektdateien ist natürlich problemlos.

    Wie überwindet man die Grenze bin -> obj mit einem Sprung am saubersten?

    EDIT: Inzwischen über Linker und Linkerscript gelöst.



  • abc.w schrieb:

    xor cx, cx
    

    Warum nicht einfach:

    mov cx, 0
    

    Oder noch eine Zeile:

    or cl, cl     ; zero? (start of the string)
    

    Warum nicht einfach:

    cmp cl, 0
    

    das hat nichts mit philosophie zu tun, es generiert anderen code, der andere laufzeit und performance eigenschaften hat. das ist eben der unterschied zwischen cisc und risc.
    wenn man diese nicht kennt, macht es nicht soviel sinn etwas in assembler zu schreiben, und das ist kein ding der sprache, sondern der hardware.

    auf nem cell sieht du vielleicht

    NOP
    OR R1,R1,R1
    OR R2,R2,R2
    

    und wunderst dich, wieso nicht einfach immer NOP? Philosophie? vielleicht sogar im gcc?

    (und nein, ist kein CISC, ich hab mir das ja auch nicht ausgedacht es so zu machen :P)



  • abc.w schrieb:

    Zum Beispiel einfache Zeile aus kernel.asm:

    xor cx, cx
    

    Warum nicht einfach:

    mov cx, 0
    

    weil der erste befehl keinen operanden braucht -> kürzer/schneller
    das gehört zum guten ton der assemblerprogrammierung. meistens will man möglichst wenig und möglichst schnellen code haben. na gut, bei den heutigen giga-Hz und -byte x86ern ist sowas natürlich alles egal.
    🙂



  • volkard schrieb:

    wer

    xor cx, cx
    

    verschmäht, weil es angeblich unleserlich wäre, und

    mov cx, 0
    

    vorzieht, der muß in der hochsprache auch

    ++c;
    

    meiden und immer brav

    c = c + 1;
    

    schreiben.

    volkard, vielleicht war es gestern spät bei Dir, oder, nach deiner Schlussvorlgerung zu urteilen, hast Du den Unterschied zwischen Assembler und Compiler nicht verstanden...

    rapso schrieb:

    auf nem cell sieht du vielleicht

    NOP
    OR R1,R1,R1
    OR R2,R2,R2
    

    und wunderst dich, wieso nicht einfach immer NOP? Philosophie? vielleicht sogar im gcc?

    rapso, wahrscheinlich war es bei Dir auch spät gestern. Ich kenne mich mit ner Cell CPU natürlich nicht aus und finde diese drei Befehle, so wie sie da stehen, hm, ja, hübsch. Ich vermute aber, da es keinen Sinn macht, diese drei Befehle einfach so aus dem Kontext zu entreissen und ohne "Vorgeschichte" und "Nachgeschichte" einfach so zu posten, dass Du deren Bedeutung auch nicht verstanden hast...
    Wie dem auch sei, interessant, wie es abgeht, wenn man anfängt, beim Assembler-Gefrickel mal auf den einen oder den anderen Umstand hinzuweisen. Und ich habe mich noch nicht in den ganzen Code eingelesen...
    Trotzdem unverständlich, oder vielleicht übersehe ich irgendwas? Nehmen wir den Bootloader z.B., der Zugriff auf die Festplatte ist im ms-Bereich. Sagen wir mal 10 ms. Bei einer 1 GHz CPU entsprechen die 10 ms 10 Millionen Takte. Nehmen wir an, ein CPU Takt entspricht 1 Sekunde, 10 Millionen Takte sind also 10 Millionen Sekunden. Ergibt etwa 115 Tage... Ihr habt jetzt also mit xor ax, ax einen Takt gespart. Also eine Sekunde gespart, um dann 115 Tage zu warten... Kann mich bitte jemand aufklären?



  • abc.w schrieb:

    volkard schrieb:

    wer

    xor cx, cx
    

    verschmäht, weil es angeblich unleserlich wäre, und

    mov cx, 0
    

    vorzieht, der muß in der hochsprache auch

    ++c;
    

    meiden und immer brav

    c = c + 1;
    

    schreiben.

    volkard, vielleicht war es gestern spät bei Dir, oder, nach deiner Schlussvorlgerung zu urteilen, hast Du den Unterschied zwischen Assembler und Compiler nicht verstanden...

    ach, da ist ein unterschied? bestimmt nur philosophischer natur.
    zur sache:
    xor reg,reg ist einfach ein festes idiom, das sich mit ein wenig übung sogar schneller liest, als mov reg,0
    ++var ist einfach ein festes idiom, das sich mit ein wenig übung sogar schneller liest, als var=var+1
    diese parallele versuchte ich aufzuzeigen.


  • Mod

    Volkard hat im abstrakten Sinne Recht. Es kann nicht sein, dass man performant Assembler schreiben will und dann die Lesbarkeit in den Vordergrund rückt.

    Bezüglich der Linker-Geschichte habe ich es jetzt auch endlich geschafft. Ich hatte die Reihenfolge hinter ld falsch angegeben. Konnte auch weiter vereinfachen. Nun ist alles zu meiner Zufriedenheit.

    Jetzt gibt es nur noch: bootloader, (asm)kernel and ckernel.
    asm- und C-kernel werden zusammen gelinkt. Wichtig ist, dass der asm-kernel binär vorne bei 0x8000 zu liegen kommt. Daher die Reihenfolge ld ... kernel.o ckernel.o Anders hängen die ganzen Strings vorne bei 0x8000 herum.

    linker \1:

    OUTPUT_FORMAT("binary")
    ENTRY(RealMode)
    SECTIONS
    {
      .text  0x8000 : {
        *(.text)
      }
      .data  : {
        *(.data)
      }
      .bss  :  {                
        *(.bss)
      }
    }
    

    makefile:

    all:
       nasmw -O32 -f bin boot.asm -o boot.bin
       nasmw -O32 -f aout kernel.asm -o kernel.o
       gcc -c ckernel.c -o ckernel.o
       ld -T kernel.ld kernel.o ckernel.o
       rename a.out ckernel.bin
    
       cmd /c copy /b boot.bin + ckernel.bin MyOS.bin
       partcopy MyOS.bin 0 1000 -f0
    


  • abc.w schrieb:

    Wie dem auch sei, interessant, wie es abgeht, wenn man anfängt, beim Assembler-Gefrickel mal auf den einen oder den anderen Umstand hinzuweisen.

    das nennt man 'best practices' der asm-programmierung, keine umstände. genau so, wie der c++-frickler lieber ++x statt x++ verwendet, obwohl es in vielen fällen keinen unterschied macht.
    🙂



  • +fricky schrieb:

    das nennt man 'best practices' der asm-programmierung, keine umstände. genau so, wie der c++-frickler lieber ++x statt x++ verwendet, obwohl es in vielen fällen keinen unterschied macht.
    🙂

    Best practices... Lese grade das hier http://www.win.tue.nl/~aeb/linux/kbd/A20.html

    ...However, it failed to do this address truncation (a bug), and people found that there existed programs that actually depended on this truncation.

    Bestimmt hat einer damals beim Programmieren der 8086er gedacht, wozu in meinem Programm explizit eine Abfrage einbauen, wenn die CPU von selbst eine "address truncation" macht und ich so Takte sparen und dabei perfomant auf die unteren Adressen zugreifen kann... Gängige Praxis, eine Funktion nutzen, die irgendwas vollkommen anderes macht, das eine oder andere Zwischenergebnis in einem ganz bestimmten Sonderfall erzeugt, an den man normalerweise nicht denkt, dessen Zwischenergebnis ich dann doch in meinem Programm benutze und mich darauf verlasse.


Anmelden zum Antworten