DB Podcast

Serverlandschaft

IT-Infrastruktur: So erhöhte LifeinCloud Leistung und Zuverlässigkeit

< zurück

Seite: 2/2

Anbieter zum Thema

Frankfurt-Zone unterstützt Cloud- und IT-Infrastruktur 

Das Hauptziel bestand darin, eine stabile, leistungsstarke Zone im Herzen Europas zu schaffen, die die gesamte Produktpalette unterstützen kann: von Public-Cloud- und Bare-Metal-Servern bis hin zu Private Cloud, virtuellen Rechenzentren und GPU-Infrastruktur. Die Prioritäten lagen auf Zuverlässigkeit, konsistenter Netzwerkleistung und vollständiger Einhaltung europäischer Standards. „Bei der Implementierung lag der Fokus auf einer sauberen Integration in unsere bestehende Plattform, der Gewährleistung eines Routings mit geringer Latenz über DE-CIX und der Aufrechterhaltung der Redundanz über die Strom-, Kühlungs- und Netzwerkschichten hinweg“, erklärt Jerome Evans, Gründer und Geschäftsführer der firstcolo GmbH.

Jerome Evans ist Gründer und Geschäftsführer der firstcolo GmbH.(Bild:  André dalla Valle)
Jerome Evans ist Gründer und Geschäftsführer der firstcolo GmbH.
(Bild: André dalla Valle)

Rund 20 Ingenieure und technische Mitarbeiter arbeiten täglich direkt mit der Zone in Frankfurt. Sie ist vollständig in die internen Systeme von LifeinCloud integriert und verbindet IT-Infrastruktur-, Netzwerk- und Überwachungsteams. „Der Standort ist auch mit unseren anderen europäischen Zonen verbunden, was eine regionenübergreifende Verwaltung und Kommunikation über unser internes Mesh ermöglicht. Alle Abteilungen, die IT-Infrastruktur, Kundenplattformen und Support verwalten, verlassen sich in ihrem täglichen Betrieb darauf“, erklärt Lisandru.

Wir setzen auf eine redundante Strominfrastruktur mit doppelter Einspeisung und N+1-USV-Systemen, die auch bei Wartungsarbeiten oder Stromausfällen eine unterbrechungsfreie Verfügbarkeit gewährleisten.

Jerome Evans, firstcolo

Technische Verfügbarkeit als Grundlage

„Wir setzen auf eine redundante Strominfrastruktur mit doppelter Einspeisung und N+1-USV-Systemen, die auch bei Wartungsarbeiten oder Stromausfällen eine unterbrechungsfreie Verfügbarkeit gewährleisten“, sagt Evans. „Gleichzeitig sorgen Präzisionskühlsysteme und Umgebungsüberwachung für konstante Bedingungen für Rechen- und Speichercluster.“ Direkte DE-CIX-Konnektivität und Multi-Gigabit-IP-Transit bieten Routing mit geringer Latenz in ganz Europa und stabile Backbone-Kapazität für öffentliche und private Cloud-Plattformen

Darüber hinaus gibt es einen Arbor-basierten DDoS-Schutz und eine Filterung, die in Verbindung mit dem eigenen Mitigation-Stack von LifeinCloud zum Schutz der Kunden-Workloads eingesetzt werden können. Darüber hinaus bietet firstcolo einen technischen Vor-Ort-Service rund um die Uhr, vor allem für die Wartung der Hardware, den Austausch von Teilen und den Notfallzugang. Gleichzeitig gibt es einen sicheren Rack-Bereich mit kontinuierlicher Überwachung, Zugangskontrolle und Echtzeit-Umgebungswarnungen. „Diese Dienste bilden die physische und netzwerktechnische Grundlage unserer Zone in Frankfurt und ermöglichen es unseren Ingenieuren, sich ganz auf die Koordination des Betriebs der IT-Infrastruktur und der Kundenumgebungen zu konzentrieren und gleichzeitig die volle Verantwortung und Kontrolle über die Systeme zu behalten“, sagt Lisandru.

IT-Infrastruktur: Ressourcen schonen

In Frankfurt bietet die IT-Infrastruktur der firstcolo GmbH eine stabile Grundlage, was sich direkt in einer höheren Verfügbarkeit und schnelleren Reaktionszeiten bei Wartungs- oder Skalierungsvorgängen niederschlägt. Redundante Stromversorgungs- und Kühlsysteme reduzieren das Ausfallrisiko drastisch, während die Netzwerkleistung und der DE-CIX-Zugang die Latenzzeiten in ganz Europa konstant niedrig halten. 

„Da die Anlage von firstcolo die physische Zuverlässigkeitsebene so gut abdeckt, können sich unsere Ingenieure auf die Cloud-Plattform konzentrieren, anstatt sich um Umwelt- oder Konnektivitätsprobleme zu kümmern. Außerdem vereinfacht dies die Logistik. Vor-Ort-Bereitstellungen können beschleunigt werden, und wir müssen kein zusätzliches Personal für die Hardware-Handhabung oder die Wartung vor Ort einsetzen. Ohne diese Systeme würden wir deutlich mehr Zeit und Ressourcen aufwenden, um denselben deutschen Standard an Betriebskontinuität und Netzwerkzuverlässigkeit aufrechtzuerhalten“, sagt Lisandru.

Dies ist besonders wichtig für einige ihrer komplexeren Private-Cloud-Konfigurationen, bei denen Cluster auf HA-Knoten laufen, die über Apache CloudStack orchestriert werden und mit einem NVMe-basierten Ceph-SDS-Pool mit dreifacher lokaler Replikation verbunden werden können. Das System verwendet OOBM/IPMI für die Knotenisolierung und STONITH-basiertes Failover, um eine automatische Wiederherstellung im Falle von Hardwareausfällen zu gewährleisten.

Vermeidung von Netzwerkengpässen

firstcolo stellt die physikalische Schicht und die Netzwerkschicht bereit, die die Zone von LifeinCloud in Frankfurt unterstützen. Dank seines Dual-Feed-Stromversorgungsdesigns mit unabhängigen A/B-Schaltkreisen und N+1-USV-Redundanz kann LifeinCloud eine echte Fehlerisolierung über alle Racks hinweg aufrechterhalten. Die Kühlung erfolgt über ein geschlossenes Warmgang-Einhausungssystem mit adiabatischen Systemen, die auch unter Dauerlast für thermische Stabilität sorgen. „In Bezug auf die Vernetzung sorgen unsere Multi-Terabit-DE-CIX-Konnektivität und die redundanten Upstream-Carrier der Einrichtung für eine vorhersehbare Latenz – in der Regel weniger als 3 ms in ganz Deutschland und weniger als 15 ms in den meisten Teilen Westeuropas“, erklärt Evans.

Jetzt Newsletter abonnieren

Verpassen Sie nicht unsere besten Inhalte

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

LifeinCloud aggregiert mehrere 10-Gbit/s-Uplinks in seinen Edge-Routern und verbindet sie dann intern über eine 40-Gbit/s-Bonded-Fabric, sodass es keinen einzigen Netzwerkengpass gibt. Aus betrieblicher Sicht liegt der Vorteil in der Transparenz: Live-Daten zu Stromversorgung, Temperatur und Netzwerktelemetrie aus dem NOC von firstcolo werden direkt in den Monitoring-Stack von LifeinCloud eingespeist. Diese Daten helfen wiederum, Kapazitätsprobleme zu antizipieren, anstatt nur auf sie zu reagieren. Seit der Inbetriebnahme liegt die gemessene Verfügbarkeit für die Zone Frankfurt bei über 99,987 Prozent, und die Latenz zwischen den Zonen Frankfurt und Amsterdam beträgt im Durchschnitt weniger als 14 ms.

IT-Infrastruktur: Zuverlässigkeit als Selbstverständlichkeit

Die Zone Frankfurt ist nun voll funktionsfähig und in die LifeinCloud-Produktionsplattform integriert. Das unternehmenseigene Team für IT-Infrastruktur stellt neue Rechen- und Speicherknoten bereit und fügt sie über automatisierte Bereitstellungspipelines zu den bestehenden Clustern hinzu. Der Zustand der Hardware, der Stromverbrauch und die Netzwerkmetriken werden vom firmeneigenen zentralen NOC aus mit Tools wie Prometheus und Grafana kontinuierlich überwacht, wobei Live-Datenfeeds aus den Systemen von firstcolo genutzt werden. Wartungsarbeiten können außerhalb der Spitzenzeiten geplant und direkt mit dem firstcolo-Team vor Ort koordiniert werden. Die Zone Frankfurt ist täglich im Dauerbetrieb und wird aktiv genutzt. „Wir waren schon immer davon überzeugt, dass man das Ergebnis nur kontrollieren kann, wenn man die gesamte Infrastruktur unter Kontrolle hat. Wenn jede Ebene unter Kontrolle ist, ist Zuverlässigkeit kein Ziel mehr, sondern eine Selbstverständlichkeit. Was uns an firstcolo am meisten beeindruckt hat, war die Präzision, mit der sie ihre Infrastruktur betreiben. Von der Stromversorgung und den Kühlsystemen bis hin zur Netzwerktelemetrie ist alles dokumentiert, messbar und transparent“, fasst Lisandru zusammen.