DB Podcast

Datenmanagement Speicherplatz: Was bei KI-Nutzung zu beachten ist

Verantwortliche:r Redakteur:in: Stefan Girschner 2 min Lesedauer

Anbieter zum Thema

Künstliche Intelligenz benötigt nicht nur Rechenleistung, sondern auch Speicherplatz – doch wie viel eigentlich? Zwar verwendet KI große Datensätze vor allem während des Trainings, doch wie groß ist der konkrete Speicherplatz und wie kann KI überhaupt verlässlich gespeichert werden. Und wo können Engpässe entstehen?

(Bild:  Pixel Matrix/Adobe Stock)
(Bild: Pixel Matrix/Adobe Stock)

Christof Stührmann, Director Cloud Engineering bei Taiga Cloud, einem Unternehmen der Northern Data Group, beantwortet Fragen zum Speicherplatz bei der der Nutzung künstlicher Intelligenz. 

Naturgemäß fallen auch bei KI-Trainings Daten an. In welchem Ausmaß geschieht dies, und welche Anforderungen muss der Speicherplatz erfüllen?

Speicherplatz
Christof Stührmann ist Director Cloud Engineering bei Taiga Cloud, einem Unternehmen der Northern Data Group.
(Bild: Northern Data Group)

Christof Stührmann: An sich ist verglichen mit den eigentlichen Rechenressourcen, die für das Training benötigt werden, das aus dem KI-Training selbst resultierende Modell recht klein und benötigt daher auch nicht viel Speicherplatz. Allerdings können realistische Trainingsszenarien ein durchaus anspruchsvolles und damit speicherintensives Checkpointing erfordern. Daher empfiehlt sich vor dem Start einer jeden KI-Trainingskampagne, eine Checkpointing-Strategie und deren Anforderungen in die Berechnungen für Durchsatz und Skalierung der KI einzubeziehen – gerade da viel vom verwendeten Modell und den Parametern abhängt.

Ist der Speicherplatz der Engpass bei KI-Trainingslasten? 

Grundsätzlich ist weniger der Speicher der Engpass für Trainingslasten großer Sprachmodelle (LLM) als vielmehr Rechenleistung und Vernetzungskapazitäten. Sehr wohl zu Engpässen führen kann allerdings das schon erwähnte Checkpointing, das LLMs absichert, aufgrund deren Größe. Und um diese kapazitäts- und durchsatzbedingten Speicherprobleme zu reduzieren, muss eben dieses Checkpointing so effizient wie möglich gestaltet werden.

All-Flash-Speicher für KI-Workloads

Zur Speicherverwaltung: Wie lassen sich Daten zugänglich machen, die sich teilweise drastisch unterscheiden – also an einer Vielzahl von Speicherorten, mit unterschiedlichen Datentypen und -altern, von archivierten Informationen bis zu Produktionsdaten?

Das kann grundsätzlich durch einen KI-Software-Stack in Benutzergröße oder eine Toolchain für maschinelles Lernen (MLOps) erreicht werden. Cloud-Anbieter wie Northern Data arbeiten nur mit grundlegenden gemeinsamen Speichern und deren internen Funktionen in Rechenzentren. Northern Data bietet gemeinsamen Dateispeicher und bald auch Objektspeicher an.

Und welche Art Speicher eignet sich am besten für KI-Workloads?

Ein shared-high-performance All-Flash-Speicher ist ideal für KI-Workloads und kommt aus genau diesem Grund auch in Rechenzentren verwendet. Denn so haben diese Netzwerkzugriff auf denselben gemeinsamen Datei- und/oder Objektspeicher.

Die Northern Data Group ist Anbieter von energieeffizienter High-Performance-Computing-Infrastruktur für Unternehmen und Forschungseinrichtungen, der GPU- und ASIC-basierte Lösungen einsetzt. Das Unternehmen betreibt drei Geschäftsbereiche: Taiga Cloud, Ardent Data Centers und Peak Mining. Mit der HPC-Infrastruktur will das Unternehmen Pionierarbeit bei anspruchsvollen Computing-Innovationen vorantreiben.

Jetzt Newsletter abonnieren

Verpassen Sie nicht unsere besten Inhalte

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung