

# Überblick

## Adressraum

- Physikalischer Adressraum
- Logischer Adressraum
- Virtueller Adressraum
- Zusammenfassung

## Adressraumkonzepte

Betriebssystemsicht

**physikalischer Adressraum** definiert einen nicht-linear adressierbaren, von Lücken durchzogenen Bereich von E/A-Schnittstellen und Speicher (\*RAM, \*ROM), dessen Größe der Adressbreite der CPU entspricht

- ▶  $2^N$  Bytes, bei einer Adressbreite von  $N$  Bits

**logischer Adressraum** definiert einen linear adressierbaren Speicherbereich von  $2^M$  Bytes bei einer Adressbreite von  $N$  Bits

- ▶  $M = N$  z.B. im Fall einer *Harvard-Architektur*
  - ▶ getrennter Programm-, Daten- und E/A-Adressraum
- ▶  $M < N$  sonst

**virtueller Adressraum** ein logischer Adressraum, der  $2^K$  Bytes umfasst

- ▶  $K > N$  bei Speicherbankumschaltung, Überlagerungstechnik
- ▶  $K \leq N$  sonst

# Adressraumorganisation

Adressenbelegung (engl. *address assignment*)

| Adressbereich       | Größe (KB) | Verwendung                          |
|---------------------|------------|-------------------------------------|
| 00000000–0009ffff   | 640        | RAM (System)                        |
| 000a0000–000bffff   | 128        | Video RAM                           |
| 000c0000–000c7fff   | 32         | BIOS Video RAM                      |
| 000c8000–000dffff   | 96         | keine                               |
| 000e0000–000effff   | 64         | BIOS Video RAM ( <i>shadow</i> )    |
| 000f0000–000fffff   | 64         | BIOS RAM ( <i>shadow</i> )          |
| 00100000–090fffff   | 147456     | RAM (Erweiterung)                   |
| 09100000–ffffdfffff | 4045696    | keine                               |
| ffffe000–ffffeffff  | 64         | SM-RAM ( <i>system management</i> ) |
| fffff000–ffffffff   | 64         | BIOS ROM                            |

Toshiba Tecra 730CDT, 1996

## Ungültige Adressen

Zugriff ~ Busfehler (engl. *bus error*)

| Adressbereich       | Größe (KB) | Verwendung                          |
|---------------------|------------|-------------------------------------|
| 00000000–0009ffff   | 640        | RAM (System)                        |
| 000a0000–000bffff   | 128        | Video RAM                           |
| 000c0000–000c7fff   | 32         | BIOS Video RAM                      |
| 000c8000–000dffff   | 96         | keine                               |
| 000e0000–000effff   | 64         | BIOS Video RAM ( <i>shadow</i> )    |
| 000f0000–000fffff   | 64         | BIOS RAM ( <i>shadow</i> )          |
| 00100000–090fffff   | 147456     | RAM (Erweiterung)                   |
| 09100000–ffffdfffff | 4045696    | keine                               |
| ffffe000–ffffeffff  | 64         | SM-RAM ( <i>system management</i> ) |
| fffff000–ffffffff   | 64         | BIOS ROM                            |

Toshiba Tecra 730CDT, 1996

## Reservierte Adressen

Zugriff  $\sim$  **Schutzfehler** (engl. *protection fault*)

| Adressbereich       | Größe (KB) | Verwendung                          |
|---------------------|------------|-------------------------------------|
| 00000000–0009ffff   | 640        | RAM (System)                        |
| 000a0000–000bffff   | 128        | Video RAM                           |
| 000c0000–000c7fff   | 32         | BIOS Video RAM                      |
| 000c8000–000dffff   | 96         | keine                               |
| 000e0000–000effff   | 64         | BIOS Video RAM ( <i>shadow</i> )    |
| 000f0000–000fffff   | 64         | BIOS RAM ( <i>shadow</i> )          |
| 00100000–090fffff   | 147456     | RAM (Erweiterung)                   |
| 09100000–ffffdfffff | 4045696    | keine                               |
| ffffe000–ffffeffff  | 64         | SM-RAM ( <i>system management</i> ) |
| fffff000–ffffffff   | 64         | BIOS ROM                            |

Toshiba Tecra 730CDT, 1996

## Freie Adressen

Arbeitsspeicher (engl. *working memory*)

| Adressbereich       | Größe (KB) | Verwendung                          |
|---------------------|------------|-------------------------------------|
| 00000000–0009ffff   | 640        | RAM (System)                        |
| 000a0000–000bffff   | 128        | Video RAM                           |
| 000c0000–000c7fff   | 32         | BIOS Video RAM                      |
| 000c8000–000dffff   | 96         | keine                               |
| 000e0000–000effff   | 64         | BIOS Video RAM ( <i>shadow</i> )    |
| 000f0000–000fffff   | 64         | BIOS RAM ( <i>shadow</i> )          |
| 00100000–090fffff   | 147456     | RAM (Erweiterung)                   |
| 09100000–ffffdfffff | 4045696    | keine                               |
| ffffe000–ffffeffff  | 64         | SM-RAM ( <i>system management</i> ) |
| fffff000–ffffffff   | 64         | BIOS ROM                            |

Toshiba Tecra 730CDT, 1996

# Segmentierung

Logische Unterteilung von Programmadressräumen

Ebene 4-Programme sind in (mind.) zwei Segmente logisch aufgeteilt:

- ▶ **Text** → Maschinenanweisungen, Programmkonstanten
- ▶ **Daten** → initialisierte Daten, globale Variablen, Halde

Ebene 3-Programme kennen (mind.) ein weiteres Segment:

- ▶ **Stapel** → lokale Variablen, Hilfsvariablen, aktuelle Parameter

Betriebssysteme verwalten diese Segmente im physikalischen Adressraum

- ▶ ggf. mit Hilfe einer MMU (engl. *memory management unit*)
  - ▶ Hardware, die nur logische in physikalische Adressen umsetzt
  - ▶ für die Verwaltung des Speichers ist das Betriebssystem verantwortlich
- ▶ die MMU legt eine **Organisationsstruktur** auf den phys. Adressraum
  - ▶ sie unterteilt ihn in Seiten fester oder Segmente variabler Länge

# Ausprägungen von Programmadressräumen

Seitennummrierter oder segmentierter Adressraum

eindimensional in **Seiten** aufgeteilt (engl. *paged*)

- ▶ eine Programmadresse  $A_P$  bildet ein Tupel  $(p, o)$ :
- $p = A_P \text{ div } 2^N \rightsquigarrow$  Seitennummer (engl. *page number*)
- $o = A_P \text{ mod } 2^N \rightsquigarrow$  Versatz (engl. *byte offset*)
- ▶ mit  $2^N$  gleich der Seitengröße (engl. *page size*) in Bytes
- ▶ Seite  $\mapsto$  **Seitenrahmen** (auch: Kachel) des phys. Adressraums

zweidimensional in **Segmente** aufgeteilt (engl. *segmented*)

- ▶ eine Programmadresse  $A_S$  bildet ein Paar  $(S, A)$ 
  - ▶ mit der Adresse  $A$  relativ zu Segment(name/nummer)  $S$
  - ▶ bei Seitennummierungen wird  $A$  als  $A_P$  interpretiert
- ▶ Segment  $\mapsto$  Folge von Bytes/Seitenrahmen des phys. Adressraums

# Adressumsetzung

Seitennummrierter Adressraum (engl. *paged address space*)



- die Seitennummer ist ein Index in eine Seitentabelle
  - pro Prozess
  - dimensioniert durch die MMU
- ein ungültiger Index führt zum Trap

- die indizierte Adressierung (der MMU) liefert einen Seitendescriptor
  - enthält die Seitenrahmennummer, die die Seitennummer ersetzt
  - entspricht der Basisadresse des Seitenrahmens im phys. Adressraum
- setzen der Basis-/Längenregister der MMU  $\sim$  Adressraumwechsel

# Adressumsetzung (Forts.)

Segmentierter Adressraum (engl. *segmented address space*)



- der Segmentname ist ein Index in die Segmenttabelle eines Prozesses
  - dimensioniert durch die MMU, ungültiger Index führt zum Trap
- die indizierte Adressierung (der MMU) ergibt den Segmentdeskriptor
  - enthält Basisadresse und Länge des Segments (engl. base/limit)
  - $address_{phys} = address > limit ? Trap : base + address$

## Adressumsetzung (Forts.)

Segmentierter seitennummrierter Adressraum (engl. *page-segmented address space*)



- **Reihenschaltung** von zwei Adressumsetzungseinheiten der MMU:  
Segmenteinheit löst eine segmentierte Adresse auf
  - ▶ adressiert und begrenzt die Seitentabelle
- Seiteneinheit generiert die physikalische Adresse
- jeder Prozess hat (mind.) eine Segment- und eine Seitentabelle

## Adressumsetzung (Forts.)

Segmentregister bzw. Segmentselektor (engl. *segment selector*)



- je nach Art des Speicherzugriffs selektiert die MMU implizit das passende Segment

Befehlsabruf (engl. *instruction fetch*)  $\mapsto$  code ✓

Operandenabruf (engl. *operand fetch*)  $\leadsto$  Text, Daten oder Stapel ?

- ▶ Direktwerte  $\mapsto$  code
- ▶ globale/lokale Daten  $\mapsto$  data/stack

▶ **char \*foo (char bar) { return &bar; }**

☞ Programme können weiterhin 1-dimensionale log. Adressen verwenden

# Seiten- bzw. Segmentdeskriptor

Abbildung steuernder Verbund

Adressumsetzung basiert auf **Deskriptoren** der MMU, die für jede Seite/Segment eines Prozesses Relocations- und Zugriffsdaten verwalten

- ▶ die **Basisadresse** des Seitenrahmens/Segments im phys. Adressraum
- ▶ die **Zugriffsrechte** des Prozesses
  - ▶ lesen (*read*), schreiben (*write*), ggf. ausführen (*execute*)

Segmente sind (im Gegensatz zu Seiten) von variabler, dynamischer Größe und benötigen daher zusätzliche Verwaltungsdaten → **Segmentdeskriptor**

- ▶ die **Segmentlänge**, um Segmentverletzungen abfangen zu können
  - ▶ Basis-/Längenregister (S. 6-32) ⊂ Segmentdeskriptor
- ▶ die **Expansionsrichtung**: Halde „*bottom-up*“, Stapel „*top-down*“

Programmierung der Deskriptoren erfolgt zur Programmlade- und -laufzeit

- ▶ bei Erzeugung/Zerstörung schwer- und leichtgewichtiger Prozesse
- ▶ bei Anforderung/Freigabe von Arbeitsspeicher

# Seiten- bzw. Segmenttabelle

Adressraum beschreibende Datenstruktur

Deskriptoren des Adressraums eines Prozesses sind in einer **Tabelle** im Arbeitsspeicher zusammengefasst

- ▶ die **Arbeitsmenge** (engl. *working set*) von Deskriptoren eines Prozesses wird im Zwischenspeicher (engl. *cache*) gehalten
  - ▶ TLB (engl. *translation lookaside buffer*) der MMU
- ▶ Adressraumwechsel als Folge eines Prozesswechsels bedeutet:
  1. zerstören der Arbeitsmenge (TLB „*flush*“; teuer, schwergewichtig)
  2. Tabellenwechsel (Zeiger umsetzen; billig, federgewichtig)

## Basis-/Längenregister (engl. *base/limit register*)

- ▶ beschreibt eine Tabelle und damit exakt einen Prozessadressraum
- ▶ bei der Adressumsetzung wird eine **Indexprüfung** durchgeführt:
  - ▶  $descriptor = index \leq limit ? \& base[index] : Trap$
  - ▶ wobei *index* die Seitennummer/den Segmentnamen repräsentiert

# Adressraumabbildung einhergehend mit Ein-/Ausgabe

Integration von Vorder- und Hintergrundspeicher

Abstraktion von Größe und Örtlichkeit des verfügbaren Arbeitsspeichers

- ▶ vom Prozess nicht benötigte Programmteile können ausgelagert sein
  - ▶ sie liegen im **Hintergrundspeicher**, z.B. auf der Festplatte
- ▶ der Prozessadressraum könnte über ein Rechnernetz verteilt sein
  - ▶ Programmteile sind über die Arbeitsspeicher anderer Rechner verstreut

Zugriffe auf nicht eingelagerte Programmteile fängt der Prozessor ab: **Trap**

- ▶ sie werden stattdessen **partiell interpretiert** vom Betriebssystem
- ▶ der unterbrochene Prozess wird in einen E/A-Stoß gezwungen
  - ▶ er erwartet die erfolgreiche Einlagerung eines Programmteils
  - ▶ ggf. sind andere Programmteile aus dem Arbeitsspeicher zu verdrängen
- ▶ Wiederaufnahme des CPU-Stoßes führt zur Wiederholung des Zugriffs

## Seiten- bzw. Segmentdeskriptor (Forts.)

Zusätzliche Attribute

Adressumsetzung unterliegt einer **Steuerung**, die „transparent“ für den zugreifenden Prozess die Einlagerung auslöst

- ▶ die **Gegenwart** eines Segments/einer Seite wird erfasst: **present bit**
  - 0 ↳ ausgelagert; *Trap*, partielle Interpretation, Einlagerung
    - ▶ die Basisadresse ist eine Adresse im Hintergrundspeicher
    - ▶ wird nach der Einlagerung vom Betriebssystem aus 1 gesetzt
  - 1 ↳ eingelagert; Befehl abrufen, Operanden lesen/schreiben
    - ▶ die Basisadresse ist eine Adresse im Vordergrundspeicher
    - ▶ wird nach der Auslagerung vom Betriebssystem aus 0 gesetzt
- ▶ das „Gegenwartsbit“ dient verschiedentlich noch anderen Zwecken:
  - ▶ um z.B. Zugriffe zu zählen oder ihnen einen Zeitstempel zu geben
  - ▶ Betriebssystemmaßnahmen zur Optimierung der Ein-/Auslagerung

# Zugriffsfehler

Seitenfehler (engl. *page fault*) bzw. Segmentfehler (engl. *segment fault*)

*present bit = 0* je nach Befehlssatz und Adressierungsarten der CPU kann der **Behandlungsaufwand** im Betriebssystem und der damit verbundene **Leistungsverlust** für die Programme beträchtlich sein

```
void hello () {
    printf("Hi!\n");
}

void (*moin)() = &hello;

main () {
    (*moin)();
}
```

```
main:
    pushl %ebp
    movl %esp,%ebp
    pushl %eax
    pushl %eax
    andl $-16,%esp
    call *moin
    leave
    ret
```

FF15080494E8

# Zugriffsfehler (Forts.)

Beispiel des schlimmsten Falls eines Seitenfehlers...

`call *moin` (x86) Aufruf einer indirekt adressierten Prozedur

- der Operationskode (FF 15) wurde bereits gelesen



1. Operandenadresse holen (08 04 94 E8)
2. Funktionszeiger lesen (08)
3. Funktionszeiger weiterlesen (04 83 A0)
4. Rücksprungadresse stapeln (08 04)
5. Rücksprungadresse weiterstapeln (83 9E)
6. Operationskode holen (83)
7. Operanden holen (EC 18)

- Seitenfehler 6. und 7. sind eigentlich bereits der Ausführung des ersten Maschinenbefehls der aufgerufenen Prozedur zuzurechnen

# Aufwandsabschätzung eines Seitenfehlers

Seitenfehler sind nicht-funktionale Programmeigenschaften

effektive Zugriffszeit (*effective access time, eat*) auf den Arbeitsspeicher

- ▶ hängt stark ab von der **Seitenfehlerwahrscheinlichkeit ( $p$ )** und verhält sich direkt proportional zur **Seitenfehlerrate**:

$$eat = (1 - p) \cdot pat + p \cdot pft, 0 \leq p \leq 1$$

- ▶ angenommen, folgende Systemparameter sind gegeben:

- ▶ 50 ns Zugriffszeit auf den RAM (*physical access time, pat*)
- ▶ 10 ms mittlere Zugriffszeit auf eine Festplatte (*page fault time, pft*)
- ▶ 1 % Wahrscheinlichkeit eines Seitenfehlers ( $p = 0,01$ )

- ▶ dann ergibt sich:

$$eat = 0,99 \cdot 50 \text{ ns} + 0,01 \cdot 10 \text{ ms} = 49,5 \text{ ns} + 10^5 \text{ ns} \approx 0,1 \text{ ms}$$

☞ Einzelzugriffe sind im Ausnahmefall um den Faktor 2000 langsamer

# Aufwandsabschätzung eines Seitenfehlers (Forts.)

Seitenfehler sind nicht wirklich transparent

mittlere Zugriffszeit (*mean access time, mat*) auf den Arbeitsspeicher

- ▶ hängt stark ab von der effektiven **Seitenzugriffszeit** und der **Seitengröße** (in Bytes pro Seite bzw. Seitenrahmen):

$$mat = (eat + (\text{sizeof}(page) - 1) \cdot pat) / pat$$

- ▶ angenommen, folgende Systemparameter sind gegeben:

- ▶ Seitengröße von 4 096 Bytes (4 KB)
- ▶ 50 ns Zugriffszeit (*pat*) auf ein Byte im RAM
- ▶ effektive Zugriffszeit (*eat*) wie eben berechnet bzw. abgeschätzt

- ▶ dann ergibt sich:

$$mat = (eat + 4\,095 \cdot 50 \text{ ns}) / 50 \text{ ns} = 6\,095,99 \text{ ns} \approx 6 \mu\text{s}$$

☞ Folgezugriffe sind im Ausnahmefall im Ø um den Faktor 122 langsamer

# Seitenüberlagerung „Considered Harmful“

Pro und Contra

**Virtuelle Adressräume** sind ...

- vorteilhaft** wenn „übergröße“ bzw. gleichzeitig/nebenläufig viele Programme in Anbetracht zu knappen Arbeitsspeichers auszuführen sind
- ernüchternd** wenn der eben durch die Virtualisierung bedingte Mehraufwand zu berücksichtigen ist und sich für ein gegebenes Anwendungsszenario als problematisch bis unakzeptabel erweisen sollte

**Seitenfehler** sind ...

- ▶ nicht wirklich transparent, wenn zeitliche Aspekte relevant sind
  - ▶ z.B. im Fall von Echtzeitverarbeitung oder Hochleistungsrechnen
- ▶ erst zur Laufzeit ggf. entstehende nicht-funktionale Eigenschaften

# Adressräume

Ebenen der Abstraktion

**physischer Adressraum** enthält gültige und ungültige Adressen

**ungültige Adressen** Zugriff führt zum Busfehler

**gültige Adressen** Zugriff gelingt, ist jedoch zu bedenken...

- ▶ reservierte Adressbereiche sind ggf. zu schützen

**logischer Adressraum** enthält gültige Adressen

- ▶ **Zugriffsrechte** der Prozesse bestimmen, welche Adressen gültig sind
  - ▶ Zugriff auf reservierte Adressen führt ggf. zum Schutzfehler
- ▶ Prozesse sind in ihrem Programmadressraum abgeschottet, isoliert
  - ▶ Zugriff auf „fremde“ freie Adressen führt zum Schutzfehler

**virtueller Adressraum** enthält „flüchtige Adressen“

- ▶ die **Bindung** der Adressen zu den Speicherzellen ist nicht fest
- ▶ sie variiert phasenweise zwischen Vorder- und Hintergrundspeicher

# Adressraumdeskriptoren

Seitennumerierte und segmentierte Adressräume

Abbildung steuernde **Verbunde** zur Beschreibung einzelner Adressraumteile

- ▶ speichern Attribute von **Seiten** oder **Segmente**
  - ▶ d.h., Relocations- und Zugriffsdaten, Zugriffsrechte
- ▶ bilden Seiten fester Größe auf gleichgroße Seitenrahmen ab
  - ▶ Seitennummerierter Adressraum
- ▶ bilden Segmente variabler Größe auf Byte- oder Seitenfolgen ab
  - ▶ segmentierter und ggf. Seitennummerierter Adressraum

**Abbildungstabellen** fassen Deskriptoren (eines Adressraums) zusammen

- ▶ die Tabellen werden vom Betriebssystem im Arbeitsspeicher verwaltet
  - ▶ der dafür erforderliche Speicherbedarf kann beträchtlich sein
- ▶ im TLB sind **Arbeitsmengen** von Deskriptoren zwischengespeichert
  - ▶ ein Cache der MMU, ohne dem **Adressumsetzung** ineffizient ist

**Zugriffsfehler** sind intransparente, nicht-funktionale Eigenschaften