Die Natur hat schon früh den Beweis dafür geliefert, dass modulare Konstruktionen in komplexen Systemen überdauern und überlegen sind. Ein wichtiger Grund für diesen Erfolg ist der für die Zuverlässigkeit entscheidende Vorteil der Fehlertoleranz, die es einem modularen System ermöglicht, den Betrieb von fehlerhaften Modulen auf ordnungsgemäß arbeitende Module zu verlagern, während Reparaturen durchgeführt werden. In Datencentern hat die modulare Konstruktion in neuen fehlertoleranten Architekturen für Server und Speichersysteme bereits Einzug gehalten. In dem Maße, in dem Datencenter sich weiterentwickeln und sich dabei an Vorgaben aus der Natur orientieren, muss sich auch die physikalische Infrastruktur für hochverfügbare Netzwerke (NCPI) weiterentwickeln, um neue Verfügbarkeits-, Wiederherstellungs- und Wachstumsstrategien unterstützen zu können.

Die physikalische Infrastruktur für hochverfügbare Netzwerke (NCPI) im Datencenter befindet sich in einer solchen Übergangsphase. Während die in physikalischer Hinsicht offenkundigen Eigenschaften der Baustein-Architektur – Skalierbarkeit, Flexibilität, Einfachheit und Mobilität – problemlos erkennbar sind und nicht ernsthaft in Frage gestellt werden, ist ein Aspekt der modularen Konstruktion in der Branche zum Diskussionsthema geworden: die Zuverlässigkeit.
Die Anwendung der klassischen, einfachen Zuverlässigkeitsanalyse („Eine größere Anzahl von Komponenten bedeutet ein höheres Ausfallrisiko“) auf dieses neue Konzept ist im besten Fall unvollständig, im schlimmsten Fall jedoch irreführend. Ziel dieses Dokuments ist es, anhand von Fallstudien zu veranschaulichen, dass die Modularität nicht nur offenkundige und leicht erkennbare Vorteile zu bieten hat, sondern auch einen weniger offenkundigen, weniger leicht erkennbaren Vorteil, der jedoch im Hinblick auf die Zuverlässigkeit entscheidend ist: die Fehlertoleranz. Die inhärente Fehlertoleranz der modularen Konstruktion bietet einen leistungsstarken Ausfallschutz, indem sie in komplexe Systeme eine Strategie für Zuverlässigkeit einbringt, die nicht nur angepasst, sondern einfach besser ist.

Die Geschichte der Modularität ist viel älter als Datencenter oder Taschenlampenbatterien. Vor drei Milliarden Jahren gab es auf der Erde bereits Leben in Form von nicht-modularen Systemen (Einzeller). Die fossilen Reste dieser Organismen zeigen, dass sie Schalen, Tentakel, Münder, Arme, Greifer und eine Vielzahl weiterer komplizierter Gebilde entwickelten. Einige wuchsen sogar zu erstaunlicher Größe heran und erreichten Durchmesser von bis zu 15 Zentimetern. Diese komplexen monolithischen Einzellerorganismen dominierten während Milliarden von Jahren die wesentliche Nahrungskette der Erde.
Dann entstanden vor etwa 500 Millionen Jahren mehrzellige Organismen. In nur zehn Millionen Jahren machten sie eine so schnelle Entwicklung durch, dass sie die drei Milliarden Jahre Entwicklung der komplizierten einzelligen Organismen aufholten und diese als vorherrschende Konstruktion ablösten.
Der modulare Vorteil bei mehrzelligen Organismen
Warum hat sich die modulare mehrzellige Konstruktion gegen die festgefahrene monolithische Konstruktion durchgesetzt?
- Die Fähigkeit zu Skalierbarkeit und Wachstum.
Systemwachstum im Hinblick auf Größe und neue Funktionen wurde einfach durch das Hinzufügen neuer Module (Zellen) erreicht, die mit den vorhandenen Modulen (Zellen) über Standardschnittstellen zusammenwirken konnten.
- Einfacherer Duplikationsprozess.
Es war einfacher, schneller und zuverlässiger, einige kleinere, weniger komplizierte Zellen zu duplizieren, als eine komplizierte Einzelzelle.
- Die Fähigkeit zur Spezialisierung der Modulfunktion.
Die Zuweisung und Spezialisierung von Zellaufgaben ermöglichte die gleiche Effektivität und Effizienz wie sie bei der Teamarbeit charakteristisch ist. In den frühen mehrzelligen Organismen war eine Zellart für die Bewegung zuständig, eine andere für den Schutz, eine weitere für das Aufspüren von Nahrung usw.
- Rasche Anpassung an die Umgebung.
Durch Hinzufügen, Entfernen oder Modifizieren von Zellen konnten schrittweise Konstruktionsänderungen schneller erprobt und anschließend übernommen oder verworfen werden.
- Fehlertoleranz.
Aufgrund der Zellredundanz konnten einzelne Zellen ausfallen, ohne das System zu beeinträchtigen, während gleichzeitig eine Zellreparatur ohne Systemausfallzeit (in diesem Fall Behinderung oder Tod) durchgeführt werden konnte.


Der modulare Vorteil bei RAID-Arrays
Warum haben sich modulare RAID-Arrays gegenüber den alten monolithischen Speicherkomponenten durchgesetzt?
- Die Fähigkeit zu Skalierbarkeit und Wachstum.
Die Speicherkapazität lässt sich problemlos erhöhen, indem die Anzahl der Module pro Array erhöht wird oder indem Arrays hinzugefügt werden.
- Einfacherer Duplikationsprozess.
Es ist wesentlich einfacher, die vielen kleinen Laufwerke, die als RAID-Module dienen, herzustellen, als die bisherigen komplizierten großen Laufwerke.
- Die Fähigkeit zur Spezialisierung der Modulfunktion.
Die einzelnen Laufwerke eines Arrays können für zusätzliche Speicherkapazität, höhere Zugriffsgeschwindigkeit oder größere Redundanz genutzt werden, je nach der für das Array definierten RAID-Ebene. Darüber hinaus können die RAID-Arrays selbst als Module auf einer höheren Ebene betrachtet werden, wobei jedem RAID-Array eine andere Anwendung zugeordnet werden kann.
- Rasche Anpassung an die Umgebung.
Laufwerke können hinzugefügt oder entfernt werden, und die RAID-Ebene kann problemlos für die gewünschten Kompromisse im Hinblick auf Kapazität, Geschwindigkeit und Redundanz geändert werden. - Fehlertoleranz
RAID-Datenschreibverfahren enthalten Redundanzen, sodass Daten wiederhergestellt werden können, wenn eines der Laufwerke ausfällt.
Blade-Server stehen im Mittelpunkt des Übergangs zu einem modularen Konzept, ein Prozess, der bereits in Gange ist, während dieses Dokument verfasst wird. Viele Jahre lang sind herkömmliche Standalone-Server immer größer und schneller geworden und haben mit der zunehmenden Verbreitung des Netzwerk- Computings immer mehr Aufgaben übernommen. Neue Server wurden in Datencentern bei Bedarf hinzugefügt, häufig als Schnellmaßnahme ohne große Koordination oder Planung. Tatsächlich war es nicht ungewöhnlich, dass der für ein Datencenter verantwortliche Operator feststellen musste, dass ohne sein Wissen Server hinzugefügt worden waren. Die sich daraus ergebende komplexe Mischung aus Gehäusen und Verkabelungen öffnete Tür und Tor für Verwirrung, Fehler und mangelnde Flexibilität.
Die erstmals 2001 in Erscheinung getretenen Blade-Server sind ein sehr einfaches und klares Beispiel für modulare Architektur: die Blades in einem Blade-Server-Gehäuse sind physisch identisch, verfügen über identische Prozessoren und können für jeden vom Benutzer gewünschten Zweck konfiguriert und genutzt werden. Ihre Einführung brachte viele Vorteile der Modularität in die Serverlandschaft ein: Skalierbarkeit, problemloses Duplizieren, Funktionsspezialisierung und Anpassungsfähigkeit

Der modulare Vorteil bei Blade-Servern
Warum haben sich modulare RAID-Arrays gegenüber den alten monolithischen Speicherkomponenten durchgesetzt?
- Die Fähigkeit zu Skalierbarkeit und Wachstum.
Die Speicherkapazität lässt sich problemlos erhöhen, indem die Anzahl der Module pro Array erhöht wird oder indem Arrays hinzugefügt werden.
- Einfacherer Duplikationsprozess.
Es ist wesentlich einfacher, die vielen kleinen Laufwerke, die als RAID-Module dienen, herzustellen, als die bisherigen komplizierten großen Laufwerke.
- Die Fähigkeit zur Spezialisierung der Modulfunktion.
Die einzelnen Laufwerke eines Arrays können für zusätzliche Speicherkapazität, höhere Zugriffsgeschwindigkeit oder größere Redundanz genutzt werden, je nach der für das Array definierten RAID-Ebene. Darüber hinaus können die RAID-Arrays selbst als Module auf einer höheren Ebene betrachtet werden, wobei jedem RAID-Array eine andere Anwendung zugeordnet werden kann. - Rasche Anpassung an die Umgebung.
Laufwerke können hinzugefügt oder entfernt werden, und die RAID-Ebene kann problemlos für die gewünschten Kompromisse im Hinblick auf Kapazität, Geschwindigkeit und Redundanz geändert werden.
- Fehlertoleranz.
RAID-Datenschreibverfahren enthalten Redundanzen, sodass Daten wiederhergestellt werden können, wenn eines der Laufwerke ausfällt.

