

**BP 2****Software-gestützte Pufferung: Virtueller Speicher**

**3** In Software realisierte Pufferspeicher

**3.1** Virtueller Speicher

- Pufferung auf externen Speichern (vorwiegend Plattenspeichern) angelegter 'virtueller' Adressraums im Arbeitsspeicher (paging)
- ◆ Speicherplatz wird nur für tatsächlich belegte Teile der virtuellen Adressräume angelegt
- ◆ Adressierung der Puffer erfolgt in der Terminologie der Hardwareüberlegungen physikalisch! Ist also für Betriebssystemfunktionen unproblematisch
- ◆ Interpretation von Befehls- und Datenadressen erfolgt bezüglich des jeweils eingestellten Adressraums
- ◆ Virtuelle Adressräume können überlappend sein!
- ◆ Betreiben gemeinsamer Bereiche unproblematisch
- ◆ Zur Vereinheitlichung des Speicherzugriffs im Betriebssystem, werden Dateien beim Öffnen in den virtuellen Adressraum gelegt (memory mapped files); können also in mehrere Adressräume eingeblendet sein oder in einem Adressraum mehrfach

09.06.99 Universität Erlangen-Nürnberg, IMMD IV, F. Hofmann  
Reproduktion jeder Art oder Verwendung dieser Unterlage zu Lehrzwecken außerhalb der Universität Erlangen-Nürnberg ist ohne Genehmigung des Autors unzulässig

**3.1**

**BP 2****Software-gestützte Pufferung: Virtueller Speicher**

|                       |                                    |                                                                               |
|-----------------------|------------------------------------|-------------------------------------------------------------------------------|
| Ersetzungsstrategie   | LRU                                | Second Chance                                                                 |
| Plazierungsstrategie  | durch Adr. festgelegt              | Vermeidung von Bedeutungsgleichheit und Mehrdeutigkeit; Effizienzüberlegungen |
| Mehrdeutigkeit        | falls virtuell adressiert, möglich | durch Wahl des Plazierungsortes vermieden                                     |
| Bedeutungsgleichheit: | falls virtuell adressiert, möglich | durch Wahl des Plazierungsortes vermieden                                     |

09.06.99 Universität Erlangen-Nürnberg, IMMD IV, F. Hofmann  
Reproduktion jeder Art oder Verwendung dieser Unterlage zu Lehrzwecken außerhalb der Universität Erlangen-Nürnberg ist ohne Genehmigung des Autors unzulässig

**3.3**

**BP 2****Software-gestützte Pufferung: virtueller Speicher**

◆ Vergleich der Vorgehensweisen bei 'caching' und 'paging'!

|                          |                                                               |                                                           |
|--------------------------|---------------------------------------------------------------|-----------------------------------------------------------|
| Ebene E <sub>i</sub>     | Arbeitsspeicher                                               | Plattenspeicher                                           |
| Ebene E <sub>i-1</sub>   | Cache                                                         | Arbeitsspeicher                                           |
| Pufferadr.               | kontextbezogen (virtuell) oder speicherbezogen (physikalisch) | kontextbezogen                                            |
| Speicheradr.             | physikalische Adr.                                            | Blockadr. am Plattenspeicher                              |
| Index                    | Teil der Adresse                                              | ermittelt über Tabelle                                    |
| Index bestimmter Adresse | zeitl. unveränderlich                                         | zeitl. veränderlich                                       |
| Zeile                    | Pufferzeile                                                   | Kachel                                                    |
| Zeilenlänge              | Pufferzeilenlänge                                             | Kachelgröße                                               |
| Markierung               | versch. Varianten                                             | physikalische Markierung                                  |
| write on hit             | write-back/through                                            | write-back                                                |
| write on miss            | allocating/nonallocating                                      | allocating                                                |
| Bedeutungsgleichheit     | möglich, falls virtuell                                       | vermieden durch geeignete Kachelwahl                      |
| Mehrdeutigkeit           | möglich, falls virtuell                                       | vermieden durch geeignete Kachelwahl                      |
| Holstrategie             | auf Anforderung                                               | auf Anforderung oder (evtl. nur teilweise) vorausschauend |

09.06.99 Universität Erlangen-Nürnberg, IMMD IV, F. Hofmann  
Reproduktion jeder Art oder Verwendung dieser Unterlage zu Lehrzwecken außerhalb der Universität Erlangen-Nürnberg ist ohne Genehmigung des Autors unzulässig

**3.2**

**BP 2****Software-gestützte Pufferung: Virtueller Speicher**

◆ Wahl der Strategien

- Holstrategie:
  - Vorausschauend (prefetching)
  - Bei Fehlzugriff (on demand, demand paging)
- Plazierungsstrategie:
  - Wo frei (derzeit Normalfall)
  - Unter Berücksichtigung von Erfordernissen effizienter Pufferspeichernutzung
  - Bei NUMA-Architekturen Berücksichtigung der Threadaffinität
- Ausräum-(Ersetzungs-)Strategie:
  - Siehe Systemprogrammierung I

09.06.99 Universität Erlangen-Nürnberg, IMMD IV, F. Hofmann  
Reproduktion jeder Art oder Verwendung dieser Unterlage zu Lehrzwecken außerhalb der Universität Erlangen-Nürnberg ist ohne Genehmigung des Autors unzulässig

**3.4**

BP 2

## Software-gestützte Pufferung: Virtueller Speicher

- Kann durch vorausschauende Einlagerung die Zahl der Einlagerungen eines Prozesses reduziert werden?
- Satz: Zu jeder vorausschauend einlagernden Strategie kann eine Strategie konstruiert werden, die nur auf Anforderung einlagert und dabei höchstens so viele Einlagerungen verursacht wie die vorausschauende.

Beweis:

Sei A eine vorausschauende Strategie und  $r_0, r_1, r_2, \dots$  eine Referenzfolge.  
 Es sei  $S_t$  die Menge der nach dem  $t$ -ten Zugriff im Arbeitsspeicher befindlichen Seiten.  
 $X_t$  bzw.  $Y_t$  seien die beim Übergang von  $S_{t-1}$  zu  $S_t$  ein- bzw. ausgelagerten Seiten, d. h.  
 $S_t = S_{t-1} + X_t - Y_t$  mit  $X_t \cap Y_t = \emptyset$ ,  $X_t \cap S_{t-1} = \emptyset$  und  $Y_t \subseteq S_{t-1}$ .

09.06.99

Universität Erlangen-Nürnberg, IMMD IV, F. Hofmann  
 Reproduktion jeder Art oder Verwendung dieser Unterlage zu Lehrzwecken außerhalb der Universität Erlangen-Nürnberg ist ohne Genehmigung des Autors unzulässig

3.5

BP 2

## Software-gestützte Pufferung: Verteilter gemeinsamer Speicher

3.2

### Verteilter, gemeinsam genutzter Speicher

#### Hardwarestruktur



09.06.99

Universität Erlangen-Nürnberg, IMMD IV, F. Hofmann  
 Reproduktion jeder Art oder Verwendung dieser Unterlage zu Lehrzwecken außerhalb der Universität Erlangen-Nürnberg ist ohne Genehmigung des Autors unzulässig

3.7

BP 2

## Software-gestützte Pufferung: virtueller Speicher

Konstruktion einer Anforderungsstrategie A':

$P_t$  seien die zum Zeitpunkt  $t$  von A aber nicht von A' eingelagerten Seiten.

$R_t$  seien die zum Zeitpunkt  $t$  von A wieder ausgelagerten Seiten, die aber noch nicht von A' ausgelagert wurden, also  $R_t = (R_{t-1} + Y_t - X_t) \cap S'_t$ .

Mit diesen Bezeichnungen gilt  $S'_t = S_t + R_t - P_t$ .

- Bis erstmalig alle Kacheln belegt sind, muß A mindestens so viele Einlagerungen wie A' gemacht haben, da ja A' nur angesprochene Seiten einlagert.
- Sind zu einem Zeitpunkt unter A' alle Kacheln belegt sind und es muß eine Einlagerung erfolgen, so wird eine Seite aus  $R_{t-1} + Y_t$  ausgelagert.
- Angenommen diese Vorgehensweise funktioniere bis  $t$  und es sei eine Seite einzulagern, die unter A bereits im Arbeitsspeicher ist und nicht zu  $Y_t$  gehört. Dann kann  $R_{t-1}$  nicht leer sein, denn es muß unter A eine der Seiten aus  $S'_{t-1}$  ausgelagert worden sein, um Platz für  $r_t$  zu haben. Wenn A' eine der Seiten aus  $R_{t-1} + Y_t$  auslagert, so muß diese bis zum nächsten Ansprechen auch von A wieder eingelagert werden.
- Also ist auch bis zum nächsten Zeitpunkt die Zahl der Einlagerungen unter A mindestens so groß wie unter A'.

09.06.99

09.06.99

Universität Erlangen-Nürnberg, IMMD IV, F. Hofmann  
 Reproduktion jeder Art oder Verwendung dieser Unterlage zu Lehrzwecken außerhalb der Universität Erlangen-Nürnberg ist ohne Genehmigung des Autors unzulässig

3.6

BP 2

## Software-gestützte Pufferung: Verteilter gemeinsamer Speicher

#### Programmierparadigmen

##### Nachrichtensysteme

Prozesse (Threads) versenden und empfangen Nachrichten

##### Gemeinsamer Speicher

Prozesse benutzen den ASP als Pufferspeicher

#### Anforderungen für gemeinsam genutzten Speicher

##### Beispiel: parallele Bearbeitung von Satellitendaten mit evtl. unterschiedlichen Programmen

- Differenzierte Behandlung der Regionen bei fork: 'text'-Segmente können gemeinsam genutzt werden
- Manche Regionen (z. B. solche die Dateien beherbergen) können für den erzeugten Prozeß irrelevant sein
- Bei manchen Regionen kann der Anfangszustand relevant sein, aber es sollen erzeugender und erzeugter Prozeß eigene Kopien besitzen
- Algorithmen für Realisierung von gemeinsam genutzten Speicher sowohl für NORMA- als auch für NUMA-Architekturen von Interesse

09.06.99

09.06.99

Universität Erlangen-Nürnberg, IMMD IV, F. Hofmann  
 Reproduktion jeder Art oder Verwendung dieser Unterlage zu Lehrzwecken außerhalb der Universität Erlangen-Nürnberg ist ohne Genehmigung des Autors unzulässig

3.8

BP 2

## Software-gestützte Pufferung: Verteilter gemeinsamer Speicher

- Wichtige Gesichtspunkte
  - Struktur und Granularität
  - Kohärenz-Semantik
  - Skalierbarkeit
  - Implementierung
    - Datenlokalisierung und Zugriff
    - Kohärenzprotokoll (write-invalidate, write-update)
    - Ersetzungsstrategie
    - Seitenflattern (Thrashing)
    - Interaktionsmechanismen

09.06.99

3.9

BP 2

## Software-gestützte Pufferung: Verteilter gemeinsamer Speicher

- Probleme?
  - ◆ Performanz: Eine Seite könnte ständig zwischen zwei oder mehr Prozessoren hin- und hergeschoben werden
    - ➡ Seitenflattern (thrashing)
  - ◆ Lösung: Replizieren von Seiten
    - ➡ Kohärenzprotokoll erforderlich
  - ◆ Frage: Anforderungen an das Kohärenzprotokoll anwendungsabhängig
    - ➡ abgestufte Kohärenzprotokolle

09.06.99

3.11

BP 2

## Software-gestützte Pufferung: Verteilter gemeinsamer Speicher

- Grundsätzliche Vorgehensweise

Zuletzt von A angesprochene Seite wird von B lesend angesprochen



- ① Zugriff mit Seitenfehler
- ② data\_request
- ③ lock\_request (read only)
- ④ lock\_completed
- ⑤ data\_provided (read only)

09.06.99

3.10

BP 2

## Software-gestützte Pufferung: Verteilter gemeinsamer Speicher

- Kohärenzarten



09.06.99

3.12

## BP 2 Software-gestützte Pufferung: Verteilter gemeinsamer Speicher

### Präzisierung der Vorstellungen

Gharachorloo, K.; Lenoski, D.; Laudon J.; Gibbons, P.; Gupta, A.; Hennessy, J.: *Memory Consistency and Event Ordering in Scalable Shared-Memory Multiprocessors*. Proc. 17th Annual Int. Symp. on Computer Architecture, May 28-31, 1990, Seattle Washington, pp.15-26.

### Bezeichnungen

- Eine **Load-Operation** eines Prozessors  $P_i$  wird zu einem Zeitpunkt als *ausgeführt bezüglich  $P_k$*  betrachtet, wenn ein späterer Anstoß einer Store-Operation durch  $P_k$  das Ergebnis der Load-Operation nicht beeinflussen kann.
- Eine **Store-Operation** eines Prozessors wird zu einem Zeitpunkt als *ausgeführt bezüglich  $P_k$*  betrachtet, wenn ein späterer Anstoß einer LOAD-Operation durch  $P_k$  den Wert liefert, den die Store-Operation oder eine spätere, die gleiche Speicherstelle betreffende geschrieben hat.
- Eine **Speicheroperation** gilt als *ausgeführt*, wenn sie bezüglich aller Prozessoren ausgeführt ist.
- Eine **Load-Operation** gilt als *global ausgeführt*, wenn sie ausgeführt ist und die Store-Operation, die die Ursache für den erhaltenen Wert ist, ausgeführt ist.

## BP 2 Software-gestützte Pufferung: Verteilter gemeinsamer Speicher

### Graphische Charakterisierung verschiedener Konsistenzmodelle



### Sequentielle Konsistenz



### Prozessor-Konsistenz



## BP 2 Software-gestützte Pufferung: Verteilter gemeinsamer Speicher

### Strikte Konsistenz

Lesen liefert zuletzt geschriebenen Wert



Kaum realisierbar in einem verteilten System

## BP 2 Software-gestützte Pufferung: Verteilter gemeinsamer Speicher

### Klassifikation von Speicherzugriffen

Mehrere Speicherzugriffe sind

- **kollidierend** (conflicting), wenn sie den gleichen Speicherort betreffen und wenigstens einer eine STORE-Operation ist;
- **konkurrierend** (competing), wenn sie in Konflikt stehen und gleichzeitig zur Ausführung anstehen können,
- **koordinierend** (synchronizing), wenn sie zur Erzwingung von Ausführungsreihenfolgen konkurrierender Zugriffe benutzt werden.

Sie sind unterteilbar in

- Belegoperationen (acquire) und
- Freigabeoperationen (release)



**BP 2 Software-gestützte Pufferung: Verteilter gemeinsamer Speicher**

- ◆ Jede Speicheroperation eines Programms sei mit einer der Marken **m\_kollidierend**, **m\_konkurrierend**, **m\_nicht\_konkurrierend**, **m\_koordinierend**, **m\_nicht\_koordinierend**, **m\_belegt** oder **m\_freigebend** markiert.

## ◆ Definition

Ein Programm enthält genügend koordinierende Zugriffe, wenn folgendes gilt:

Es seien u und v zwei beliebige, kollidierende Zugriffe der beiden Fäden  $P_u$  und  $P_v$ , von denen wenigstens einer mit m\_nicht\_konkurrierend markiert ist. Dann muß bei jedem Ablauf in dem v nach (vor) u ausgeführt wird, wenigstens ein mit m\_koordinierend markierter Schreibzugriff (Lesezugriff) von  $P_u$  existieren und ein Lesezugriff (Schreibzugriff) von  $P_v$ , die u und v so trennen, daß der Schreibauftrag vor dem Leseaufruf erfolgt. Der Schreibauftrag muß mit m\_freigebend, der Leseaufruf mit m\_belegend markiert sein.

09.06.99 Universität Erlangen-Nürnberg, IMMD IV, F. Hofmann  
Reproduktion jeder Art oder Verwendung dieser Unterlage zu Lehrzwecken außerhalb der Universität Erlangen-Nürnberg ist ohne Genehmigung des Autors unzulässig

3.17

## BP 2 Software-gestützte Pufferung: Verteilter gemeinsamer Speicher

#### ◆ Freigabe-Konsistenz



09.06.99 Universität Erlangen-Nürnberg, IMM IV, F. Hofmann  
Reproduktion jeder Art oder Verwendung dieser Unterlage zu Lehrzwecken außerhalb der Universität Erlangen-Nürnberg ist ohne Genehmigung des Autors unzulässig

3.19

**BP 2 Software-gestützte Pufferung: Verteilter gemeinsamer Speicher**

- ◆ Ein Programm heißt **richtig markiert**, wenn gilt:
    - Alle kollidierenden Zugriffe sind mit `m_kollidierend` markiert,
    - alle konkurrierenden Zugriffe sind mit `m_konkurrenz` markiert und
    - das Programm enthält genügend mit `m_koordinierend` markierte Zugriffe.

### Weitere Konsistenzmodelle:

#### ◆ Schwache Konsistenz



09.06.99 Universität Erlangen-Nürnberg, IMMD IV, F. Hofmann  
Reproduktion jeder Art oder Verwendung dieser Unterlage zu Lehrzwecken außerhalb der Universität Erlangen-Nürnberg ist ohne Genehmigung des Autors unzulässig

3.18

**BP 2 Software-gestützte Pufferung: Verteilter gemeinsamer Speicher**

#### ◆ Freigabe-Konsistenz



09.06.99 Universität Erlangen-Nürnberg, IMM IV, F. Hofmann  
Reproduktion jeder Art oder Verwendung dieser Unterlage zu Lehrzwecken außerhalb der Universität Erlangen-Nürnberg ist ohne Genehmigung des Autors unzulässig

3.19

**BP 2 Software-gestützte Pufferung: Verteilter gemeinsamer Speicher**

P 2 Software-gestützte Pufferung: Verteilter gemeinsamer Speicher

Modellhafte Beispiele



## Sequentielle Konsistenz

## Prozessor-Konsistenz

09.06.99 Universität Erlangen-Nürnberg, IMMD IV, F. Hofmann  
Reproduktion jeder Art oder Verwendung dieser Unterlage zu Lehrzwecken außerhalb der Universität Erlangen-Nürnberg ist ohne Genehmigung des Autors unzulässig

3.20

BP 2

## Software-gestützte Pufferung: Verteilter gemeinsamer Speicher



09.06.99

3.21

BP 2

## Software-gestützte Pufferung: Verteilter gemeinsamer Speicher

**Satz:** Richtig markierte Programme liefern bei Freigabe-Konsistenz dieselben Ergebnisse wie bei sequentieller Konsistenz.

Beweis:

09.06.99

3.23

BP 2

BP 2

## Software-gestützte Pufferung: Verteilter gemeinsamer Speicher

Überlappung bei der Bearbeitung einer verteilten Hash-Tabelle



09.06.99

3.22

BP 2

## Software-gestützte Pufferung: Verteilter gemeinsamer Speicher

Algorithmen für die Plazierung von Seiten

|                  | nicht vervielfachend              | vervielfachend                                          |
|------------------|-----------------------------------|---------------------------------------------------------|
| Nicht migrierend | zentralisiert<br>(central server) | allgemein vervielfachend<br>(full-replication)          |
| migrierend       | migrierend<br>(migration)         | vervielfachend für<br>Lesezugriff<br>(read-replication) |

09.06.99

3.24

BP 2

## Software-gestützte Pufferung: Verteilter gemeinsamer Speicher

- ◆ Zentraler Server (Central-server algorithm)



| Client                  | zentraler Server                                                         |
|-------------------------|--------------------------------------------------------------------------|
| Datenanforderung senden | Anforderung entgegennehmen<br>Datenzugriff durchführen<br>Antwort senden |
| Antwort entgegennehmen  |                                                                          |

09.06.99 Universität Erlangen-Nürnberg, IMMD IV, F. Hofmann  
Reproduktion jeder Art oder Verwendung dieser Unterlage zu Lehrzwecken außerhalb der Universität Erlangen-Nürnberg ist ohne Genehmigung des Autors unzulässig 3.25

BP 2

## Software-gestützte Pufferung: Verteilter gemeinsamer Speicher

- ◆ Migrationsalgorithmus



| Client                                                                      | Verwalter                                  |
|-----------------------------------------------------------------------------|--------------------------------------------|
| Falls Block nicht lokal,<br>Speicherort ermitteln<br>und Anforderung senden | Anforderung entgegennehmen<br>Block senden |
| Antwort entgegennehmen<br>Datenzugriff durchführen                          |                                            |

09.06.99 Universität Erlangen-Nürnberg, IMMD IV, F. Hofmann  
Reproduktion jeder Art oder Verwendung dieser Unterlage zu Lehrzwecken außerhalb der Universität Erlangen-Nürnberg ist ohne Genehmigung des Autors unzulässig 3.26

BP 2

## Software-gestützte Pufferung: Verteilter gemeinsamer Speicher

- ◆ Vervielfachung für lesenden Zugriff (Schreibauftrag)



| Client                                                                      | Verwalter                                  |
|-----------------------------------------------------------------------------|--------------------------------------------|
| Falls Block nicht lokal,<br>Speicherort ermitteln<br>und Anforderung senden | Anforderung entgegennehmen<br>Block senden |
| Antwort entgegennehmen<br>Invalidierung an alle anderen                     | Invalidierung vollziehen                   |
| Zugriff                                                                     |                                            |

09.06.99 Universität Erlangen-Nürnberg, IMMD IV, F. Hofmann  
Reproduktion jeder Art oder Verwendung dieser Unterlage zu Lehrzwecken außerhalb der Universität Erlangen-Nürnberg ist ohne Genehmigung des Autors unzulässig 3.27

BP 2

## Software-gestützte Pufferung: Verteilter gemeinsamer Speicher

- ◆ Allgemein vervielfachend



| Client                                 | Sequencer                                 | Verwalter                         |
|----------------------------------------|-------------------------------------------|-----------------------------------|
| Falls 'write'<br>Daten an<br>Sequencer | Sequenznummer<br>anfügen<br>Multicast     | Daten empfangen<br>'update' lokal |
|                                        | Ausführung<br>bestätigt<br>'update' lokal |                                   |

09.06.99 Universität Erlangen-Nürnberg, IMMD IV, F. Hofmann  
Reproduktion jeder Art oder Verwendung dieser Unterlage zu Lehrzwecken außerhalb der Universität Erlangen-Nürnberg ist ohne Genehmigung des Autors unzulässig 3.28

◆ Vergleichende Analyse

**Stumm, M.; Zhou, S.: Algorithms Implementing Distributed Shared Memory.**  
**Computer, May 1990, pp. 54-64.**

pZeit für Versenden oder Empfangen einer kurzen Nachricht (einige Byte)  
typischerweise einige msec

PZeit für Versenden oder Empfangen einer langen Nachricht (8 KByte)  
typischerweise 20 bis 40 msec

SZahl beteiligter Knoten

rZahl der Leseaufrufe relativ zur Zahl der Schreibauftrufe

fWahrscheinlichkeit für einen Zugriff fehler bei Zugriff zu nicht-replizierten Datenblöcken unter dem Migrationsalgorithmus

fWahrscheinlichkeit für einen Zugriff fehler bei Zugriff zu nicht-replizierten Datenblöcken bei Vervielfachung für lesenden Zugriff

$$\text{Zentraler Server } C_z = \left(1 - \frac{1}{S}\right)4p \text{ Migration } C_m = f(2P + 4p)$$

$$\text{Lesevervielfachung } C_{lv} = f\left(2P + 4p + \frac{Sp}{r+1}\right) \text{ Allg. Vervielf. } C_{av} = \frac{1}{r+1}(S+2)p$$

Typischerweise:  $P \approx 20p$

