Frage zu EXE in RAM?

Question

Hallo!
Angenommen man Doppelklickt eine .exe, dann wird ja CreateProcess gestartet.
Was macht Windows dann im Detail?
Wird zuerst PE-Header gelesen, dann der ganze Code in den RAM geladen und dann der Entrypoint gecalled?
Braucht das OS die .exe auf der Festplatte dann &uuml;berhaupt noch oder geschieht dann alles im RAM?
Lg

PeterKremsner · Accepted Answer

Naja er mapped die Exe zumindest in den Ram. Allerdings muss man beachten, dass der Adressraum von Programmen nicht komplett im Ram ist sondern es handelt sich um Virtuellen Ram. Ein Teil des Adressraums muss zB gar nicht physisch existent sein sollange keine Lese und Schreibzugriffe darauf folgen und der Teil der wirklich da ist muss nicht im Ram sein sondern kann auf die Festplatte ausgelagert sein. 
Bei Windows kenn ich die Prozedur nicht genau aber Linux kopiert das Programm in den virtuellen Adressraum und du kannst das Programm nach dem Start durchaus l&ouml;schen und das wird weiterhin funktionieren. 
Durch das Virtuelle Mapping ist aber durchaus m&ouml;glich, dass er Programmteile dynamisch nachl&auml;dt.

Commodore64 · Answer

Der Prozessor kann nur auf Speicheradressen (RAM oder ROM/CMOS) und auf Hardwareadressen zugreifen.
Damit ein Programm abgearbeitet werden kann, muss es im RAM stehen, es geht nicht anders! Zwar haben die Bl&ouml;cke auf der Festplatte ebenfalls eine Adresse, die ist aber f&uuml;r den prozessor nicht ersichtlich, er kann da nicht dran. Der Festplattencontroller blendet ein paar Bytes in den Hardwareadressraum ein, da drin wird ein Teil von einem Block der Festplatte sichtbar wenn er durch schreiben von Werten in andere Hardwareregister des Controllers angefordert wurde. Diese Schnipsel m&uuml;ssen dann erst mal von Daten die das Dateisystem zur Verwaltung der Daten braucht befreit werden und zu einem l&uuml;ckenlos durchgehenden Programm zusammen gesetzt werden.
Fr&uuml;her war es tats&auml;chlich m&ouml;glich, ein Programm auf ROM-Chips in einen ISA Slot zu stecken und der Prozessor konnte dann zumindest auf Teile davon direkt zugreifen, zur Laufzeit des Programms auch das Fenster im ROM Bereich verschieben. 
In einem alten BIOS findet man die Einstellung "Shadow Video BIOS enable/disable". Man hat beim IBM UR-PC schon damals dran gedacht, dass neue, bessere Hardware entwickelt werden wird mit der aufger&uuml;stet werden kann. Damals war es noch &uuml;blich jedes mal ein v&ouml;llig neues inkompatibles Computersystem auf den Markt zu bringen wenn es bessere Komponenten gibt. Beim IBM PC nicht. Hier gibt es eine ganze Reihe von Hardwareadressen die das BIOS abklappert und nach ROM Bausteinen sucht. Findet es einen, wird der Code darin zusammen mit dem Rest des Codes im BIOS benutzt. Die VGA F&auml;higkeiten des BIOS sitzen also nicht im BIOS Chip sondern auf der Grafikkarte. Bei alten ISA und ur-PCI Grafikkarten sieht man ein gro&szlig;es, klobiges EPROM auf der Karte, das ist das Video-BIOS. Die SHADOW funktion im BIOS kopiert das erst mal ins RAM damit der Prozessor mit seinem vollen Takt drauf zugreifen kann, ein EPROM ist relativ langsam und ISA ist auf 8MHz begrenzt. Mit eingeschaltetem SHADOW werden Grafikausgaben unter DOS viel schneller, besonders wichtig bei Spielen.
Neben dem Video_BIOS gibt es noch viele andere Stellen, zum Beispiel SCSI Controller und auch Netzwerkkarten. Bei Netzwerkkarten war damals immer zumindest eine leere IC Fassung f&uuml;r das EPROM drauf. Mit EPROM auf der Netzwerkkarte kann jeder IBM-Kompatible aus dem Netzwerk booten, wurde aber im Consumerbereich praktisch nie benutzt und daher die leeren Fassungen.

Commodore64 · Answer

Die CPU weist nichts an. Die CPU arbeitet nur Anweisungen ab. Eine CPU hat Adressleitungen und Datenleitungen. Auf die Adressleitungen wird eine Adresse gelegt, das ist die Nummer der Speicher oder Registerzelle die dann mit dem Datrenbus verbunden wird. Eine weitere Leitung der CPU legt fest, ob das angesprochene Register gelesen wird oder geschrieben wird.
Da im RAM beliebige Stellen angesprungen werden m&uuml;ssen, mu&szlig; der gesamte Bereich des RAM &uuml;ber die Adressleitungen ansprechbar sein. Andere Dinge haben Register mit denen die gesteuert werden und Daten austauschen k&ouml;nnen. Zum einen verringert das die Anzahl an Adressleitungen die n&ouml;tig w&auml;ren wenn jede Kleinigkeit eine andere Adresse h&auml;tte, zum anderen funktioniert ein direktes Ansprechen nicht zur Steuerung. Soll z.B. eine LED an gemacht werden, m&uuml;sste die CPU st&auml;ndig deren Adresse anliegen haben, w&auml;re also 100% ihrer Zeit mit den anschalten der LED besch&auml;ftigt. Daher schreibt man nur einen Wert in ein Register der besagt, dass die LED an sein soll, die bleibt dann an bis ein anderer Wert zum ausschalten da rein geschrieben wird.
Das selbe gilt f&uuml;r die Festplatte. W&auml;re die wie RAM angeschlossen, m&uuml;sste die CPU um mehrere TB verwalten zu k&ouml;nnen "hunderte" Adressleitungen haben und die m&uuml;ssten alle auch noch mit der Festplatte verbunden sein. Allein durch die Menge an Kabeln und deren L&auml;nge um alles zu verkabeln wird es nicht nur unglaublich teuer sondern auch unglaublich langsam. Es macht auch keinen Sinn das so zu machen, die Festplatte mu&szlig; ihre Daten ja auch erst mal "suchen", also kriegt die &uuml;ber ein Register nur die Anweisung einen Block zu finden und den dann an anderen Registern zug&auml;nglich zu machen.
Treiber sind Programmteile die Modular an das Betriebssystem angebaut werden. Die CPU arbeitet stur Anweisungen ab, die wei&szlig; nicht was Treiber sind und was Betriebssystem oder was ganz anderes. Das Betriebssystem springt vom programmablauf auf einen Treiber um was bestimmtes zu machen, die Trennung die der Mensch macht in Layer, Treiber usw., die gibt es f&uuml;r die Maschine nicht. 
Das Multitasking moderner Betriebssysteme basiert darauf, dass programmabschnitte (Auch in Treibern und dem Betriebssystem selber) als Unterprogramme aufgerufen werden und dann ein Return geben, dann wird ein anderer Schnipsel eines anderen Programms gestartet bis es die Kontrolle zur&uuml;ck gibt. Das nennt man Kooperatives Multiplexing, hatte Win3.x so gemacht. St&uuml;rzte was ab, fror der ganze PC ein. Modernes Multitasking startet einen Timer in der Hardware, l&auml;uft der ab springt die CPU zwangsweise wieder zur&uuml;ck.

tunik123 · Answer

Aus Sicht des Prozessors gibt es nur virtuellen RAM, der von einer Hardware auf den physisch vorhandenen RAM abgebildet wird. Wenn kein physischer RAM f&uuml;r die angefragte Adresse zugeordnet ist, gibt es einen Interrupt "Page fault".
Der virtuelle Speicher wird in St&uuml;cke "Pages" (z.B. 4kByte) eingeteilt, entweder die ganze Page ist zugeordnet oder sie befindet sich in einer Datei (Auslagerungsdatei) oder existiert &uuml;berhaupt nicht.
Um zu wissen, wie das Betriebssystem den Interrupt zu behandeln hat, h&auml;lt es sich f&uuml;r jeden Prozess eine Tabelle, in der f&uuml;r jede existierende Page steht, in welche Datei sie ausgelagert ist und an welcher Stelle in der Datei sie sich befindet.
Wenn die virtuelle Page auf physischen RAM gemappt ist, wird die virtuelle Adresse in die entsprechende physische umgerechnet. Das macht Hardware (die MMU), das kostet keine Zeit.
Wird eine EXE gestartet, so wird entsprechend viel virtualler Speicher zugeordnet und pageweise eingetragen, wo in der EXE die Daten stehen. Die EXE wird also zu einer Art "Auslagerungsdatei". Geladen werden die Programmdaten erstmal nicht.
Au&szlig;erdem werden Pages f&uuml;r Daten (RAM) und den Stack angelegt, auch zun&auml;chst nur virtuell.
Jetzt versucht das Betriebssystem den Entry-Point anzuspringen und bekommt einen Page-Fault-Interrupt. Dann wird die Page aus der EXE geladen, in der sich der Entry befindet. Sobald der Befehlsz&auml;hler dies Page verl&auml;sst, wird die n&auml;chste Page geladen. Es werden also nur Pages geladen, die wirklich benutzt werden.
Wenn der RAM knapp wird, werden auch wieder Pages rausgeschmissen, sie k&ouml;nnen ja jederzeit wieder geladen werden. Wenn sie modifiziert wurden (Daten, Stack), m&uuml;ssen sie in die Auslagerungsdatei geschrieben werden, damit sie bei Bedarf wiederhergestellt werden k&ouml;nnen.
Die EXE muss also f&uuml;r die gesamte Programmlaufzeit existieren, sie wird gegen &Uuml;berschreiben gesch&uuml;tzt.
In Wirklichkeit ist es etwas komplizierter, aber im Prinzip funktioniert das so. (zumindest bei Windows und Linux)

Commodore64 · Answer

Der klick auf die EXE befiehlt dem Betriebssystem diese auszuf&uuml;hren. Dahinter steckt eine Prozedur die dann durchgef&uuml;hrt wird.
Das Betriebssystem enth&auml;lt eine ganze Reihe an Treibern, der Treiber f&uuml;r die Festplatte wird angewiesen diese Datei in einen vom Betriebssystem vorbereiteten Speicherbereich zu kopieren. D.H. die CPU f&uuml;hrt Programmteile des Treibers aus. Der Treiber kann dann vom Hardware-Festplattencontroller "Byteweise" in ein CPU register kopieren und dann in den Speicher oder das DMA System beauftragen das automatisch "um den Prozessor herum" zu erledigen und bescheid zu sagen (DMA IRQ) wenn er fertig ist.
Die Prozedur ist also ungef&auml;hr:

feststellen wie gro&szlig; die EXE ist
 Speicherplatz f&uuml;r die EXE vorbereiten
 Dateisystem-treiber anweisen die Datei da rein zu kopieren.
 Dateisystemtreiber erkl&auml;rt Festplattentreiber welche Bl&ouml;cke wohin sollen
 Festplattentreiber kopiert Daten per CPU oder DMA vom Festplattencontroller (Hardware) in den Speicher
 feststellen ob EXE fehlerfrei geladen wurde und auch wirklich eine EXE ist
 Sprung auf ausf&uuml;hrbaren Code im Speicher wo die EXE liegt durchf&uuml;hren.

Frage zu EXE in RAM?

7 Antworten

Paging konstante Größe?

Wie wandle ich eine exe in eine Web Datei um?

GNU GRUB unter Windows 10 komplett entfernen?

C# - EXE in WinForm anzeigen?

Warum verwendet man Memory Pages?

Warum keine vorzeitige Optimierung?

Was ist Assembler ?

Aufbau von exe-Dateien

Warum nutzen wir alle nicht wieder alte Software?

Texturen in Modern Warfare Warzone laden nicht korrekt?

Warum ist Geld wichtiger als Leistung?

Welche Low-Level-Programmiersprache ist für den Anfang gut?

Assembler Zufallszahlen generieren?

Wie viele Zeilen Code schreiben Softwareentwickler bzw. Programmierer durchschnittlich pro Tag?