Friedrich-Alexander-Universität Erlangen-Nürnberg  /   Technische Fakultät  /   Department Informatik

Masterseminar AKSS im WS 2014/15
Fehlertolerante Systeme

Übersicht / Overview

Ausgewählte Kapitel der Systemsoftwaretechnik: Fehlertolerante Systeme (MS_AKSS)

Dozentinnen/Dozenten
Dr.-Ing. Peter Ulbrich, PD Dr.-Ing. habil. Daniel Lohmann, Akad. ORat, Dr.-Ing. Volkmar Sieh, Akad. ORat

Angaben
Masterseminar, 4 SWS
für Gasthörer zugelassen, Sprache Deutsch
Zeit und Ort: Di 12:15 - 13:45, 0.031-113

Studienfächer / Studienrichtungen
WPF INF-MA ab 1 (ECTS-Credits: 5)

Inhalt des Seminars / Seminar content

Ob wir kommunizieren, Geld überweisen oder zum Arzt fahren, Software ist aus dem täglichen Leben nicht mehr wegzudenken. Ihre Zuverlässigkeit ist dabei eine grundlegende Forderung in einer Vielzahl von Anwendungsfällen: von den Verkehrsmitteln über Medizintechnik bis zur Anlagenautomatisierung. Deren Fehlfunktion ist mindestens unangenehm, kostet meistens Geld und kann teilweise zu Gefahren für Leib und Leben führen. Neben der funktionalen Korrektheit der Systeme ist hierbei vor allem auch ein hohes Maß an Fehlertoleranz gegenüber äußeren Störeinflüssen wichtig. Ein aktuelles Problem stellt beispielsweise die durch die voranschreitende Miniaturisierung schwindende Zuverlässigkeit der Hardware dar. In der Folge eine der fundamentalsten Grundannahmen der Softwaretechnik in Gefahr: Die korrekte Ausführung von Programmcode durch das darunterliegende Rechensystem.

Dieses Seminar beleuchtet das Thema Fehlertoleranz aus Sicht der Systemsoftware (Betriebssystem, Kommunikation, Laufzeitumgebung) und klärt die Frage wie sich sichere Systeme aus unsicheren (Hardware-)Komponenten aufbauen lassen. Hierfür werden sowohl die Grundlagen der Fehlertoleranz, grundlegende Gegenmaßnahmen und Testverfahren, als auch aktuelle Entwicklungen aus der Forschung aufgegriffen und diskutiert.

Die Seminarteilnehmer können frei wählen, ob sie den Vortrag und die Ausarbeitung auf Deutsch oder Englisch erstellen.

Whether we communicate, transfer money or go to the doctors: software is essential to everyday life. Its reliability is a fundamental requirement in a variety of applications: from transportation, over medical systems to plant automation. Their malfunction is at least unpleasant, usually costly and sometimes may even be dangerous to life. Besides functional correctness, fault-tolerance is a mandatory feature of safety-critical systems. Dwindling robustness and reliability, caused by the ongoing miniaturization of hardware, is one of the most urgent issues in this context as it jeopardizes the most fundamental assumptions of software engineering: the correct execution of program code by the underlying computing system.

This seminar illuminates fault tolerance from a system-software (operating system, communication, runtime) perspective and shows how to build reliable systems from unreliable (hardware-)components. Therefore, both the basics of fault tolerance as well as current developments in research are taken up and discussed.

The seminar's participants are free to choose German or English as language for their presentation and paper.

Themen und Termine / Topics and Dates

Termin Thema Vortragende(r) Ausarbeitung Folien Betreuer
07.10.2014 Organisation und Einführung
Prelude and organisational issues
Peter Organisation und Einführung
Botschaft angekommen?
Message received?
Botschaft angekommen?
14.10.2014 Lesen und Begutachten von Fachliteratur in der systemnahen Informatik
Reading and reviewing of papers in systems
Daniel
21.10.2014 Fehlertolerante Systeme: Einführung, Klassifikation, Fehlermodell
Fault-tolerance: introduction, classification , basic fault model
Peter
28.10.2014 Seminarvorbereitungen
Seminar preparations
04.11.2014 Seminarvorbereitungen
Seminar preparations
11.11.2014 Thema: DRAM Speicherfehler im Betriebssystem – Problem und Gegenmaßnahmen
Topic: DRAM errors inside the OS – problem scoping and counter measures
Robert de Temple Daniel
18.11.2014 Seminarvorbereitungen
Seminar preparations
25.11.2014 Thema: Redundanz und Replikation — Fehlertoleranz auf Systemebene
Topic: Redundancy and replication
Kurt Kanzenbach Peter
02.12.2014 Gastvortrag: Concurrent, Redundant Multithreading
Invited Talk: Concurrent, Redundant Multithreading
Björn Döbel
(TU Dresden)
09.12.2014 Vortrag: A Practitioner's Guide to Software-based Soft-Error Mitigation Using AN-Codes
Topic: A Practitioner's Guide to Software-based Soft-Error Mitigation Using AN-Codes
Peter
16.12.2014 Thema: Fehlertoleranz in verteilten Systemen
Topic: fault-tolerance in distributed systems
Gona Fatah Volkmar
Jahreswechsel
Holidays
13.01.2014 Thema: Fehlertoleranz in Mehrkernsystemen
Topic: multi-core fault tolerance
Stefan Reif Peter
20.01.2015 Thema: Wiederherstellung und Wiedereingliederung von Komponenten
Topic: component recovery and reintegration
Philipp Erhardt Peter
27.01.2015 Semesterabschluss
Roundup
Peter
Vortrag: dOSEK: Ein zuverlässiges Echtzeitbetriebssystem für sicherheitskritische Anwendungen
Topic: dOSEK: The Design and Implementation of a Dependability-Oriented Static Embedded Kernel
Martin

Evaluationsergebnisse WS 2014/15

Organisatorisches / Organisational Matters

Jeder Teilnehmer fertigt eine Ausarbeitung mit mindestens sechs Seiten an und hält einen 40-minütigen Vortrag. Eine erste Version der Ausarbeitung sollte spätestens zwei Wochen vor dem Vortrag dem jeweiligen Betreuer zur Durchsicht vorliegen. Eine Vortragsfassung für die restlichen Seminarteilnehmer muss eine Woche vor dem Vortrag abgegeben werden. Die Vortragsfolien sind eine Woche vor dem Vortragstermin und die endgültige Fassung der Ausarbeitung spätestens eine Woche nach dem Vortrag beim jeweiligen Betreuer abzugeben. Die Ausarbeitungen sind im ACM SIG Style anzufertigen. Die Ausarbeitung und der Vortrag müssen unter Zuhilfenahme der Wissensbasis erstellt werden. Die Teilnehmer können sich über Waffel für das Seminar anmelden.

Each attendee writes a paper with at least six pages and gives a 40-minute presentation. For reviewing, a first version of the paper should be sent to the respective supervisor no later than two weeks before the presentation. A preliminary version for the other attendees of the seminar should be submitted no later than one week before the presentation. The presentation slides shall be submitted no later than one week before the presentation; the final version of the paper shall be submitted no later than one week after the presentation. All papers should be in single-spaced, two-column ACM SIG style format. The supplied knowledge base has to be used for creating the presentation and writing the paper. The attendees can sign up for the seminar using Waffel.

Betreuer / Supervisors

Peter Ulbrich Daniel Lohmann Volkmar Sieh