DB Podcast

Offenes KI-Modell Nvidia präsentiert Nemotron: Der Bruch liegt im Machtwechsel

Ein Gastbeitrag von Dr. Joerg Storm 8 min Lesedauer

Anbieter zum Thema

Auf der GTC Taipei hat Nvidia Nemotron 3 Ultra präsentiert, ein offenes KI-Modell mit 550 Milliarden Parametern, 55 Milliarden aktiven Parametern und einem Kontext von einer Million Token. Die Modellgewichte sowie Technical Report, Tech Blog und GitHub Cookbook sind jetzt öffentlich verfügbar. 

Auf der GTC Taipei at Computex präsentierte CEO Jensen Huang Neuheiten von Nvidia.(Bild:  Nvidia)
Auf der GTC Taipei at Computex präsentierte CEO Jensen Huang Neuheiten von Nvidia.
(Bild: Nvidia)

Mit dem Open-Source-KI-Modell Nemotron 3 Ultra will Nvidia langlaufende, komplexe und autonome Agenten-Workloads wie Codegenerierung und umfangreiche Recherche ermöglichen. Das klingt zunächst nach technischer Weiterentwicklung. In Wahrheit ist es ein strategischer Angriff auf die alte Logik der Enterprise-KI. Nicht mehr der einzelne Prompt, sondern der dauerhaft laufende Bearbeitungsprozess wird zur ökonomischen Grundeinheit. Damit verändert sich nicht nur IT-Architektur, sondern auch Organisationsdesign, Kontrollmechanik und die Rolle von Fachabteilungen.

Mit Nemotron 3 Ultra gibt Nvidia ein strategisches Signal

Nemotron 3 Ultra von Nvidia bietet eine 5-fach schnellere Interferenz.(Bild:  Nvidia)
Nemotron 3 Ultra von Nvidia bietet eine 5-fach schnellere Interferenz.
(Bild: Nvidia)

Nemotron 3 Ultra ist weniger ein Produkt-Launch als ein strategisches Signal: Offene Frontier-Modelle werden jetzt als Infrastruktur für langfristige, autonome Agenten positioniert. Hierbei wird Modellarchitektur, NVFP4-Optimierung und das OpenMDW-1.1-Lizenzmodell der Linux Foundation zu einem Angebot kombiniert, das nicht nur leistungsstark, sondern auch operational anpassbar für Enterprise-Szenarien ist. Die wichtigste Veränderung ist nicht, dass ein weiteres Modell besser benchmarkt. Die Veränderung ist, dass sich die Kostenstruktur von agentischer Arbeit verschiebt: Weg von teuren, geschlossenen Einzelzugriffen hin zu kontrollierbaren, skalierbaren Modell-Stacks mit offenem Ökosystem.

Das größte Risiko für Unternehmen ist nicht, zu spät ein Modell zu testen. Das Risiko ist, die strategische Kontrolle über Daten, Governance, Rechenarchitektur und Entscheidungslogik an Plattformen auszulagern, bevor das Operating Model dafür bereit ist. Die größte Chance liegt in einer neuen Form von Skalierung: Unternehmen können anspruchsvolle Wissensarbeit, Code, Forschung und mehrstufige Agenten-Workflows wirtschaftlicher internalisieren, wenn sie Modellwahl, Infrastruktur und Governance als eine Einheit führen.

Nemotron 3 Ultra als sein größtes und bestes offenes Modell

Mit Nemotron 3 Ultra können Anwender bis zu 30 Prozent einsparen.(Bild:  Nividia)
Mit Nemotron 3 Ultra können Anwender bis zu 30 Prozent einsparen.
(Bild: Nividia)

Die falsche Frage lautet: Ist Nemotron 3 Ultra das beste offene Modell? Die richtige Frage lautet: Welche Art von Unternehmen entsteht, wenn autonome Agenten nicht mehr als Experiment, sondern als produktive Schicht in die Wertschöpfung wandern? Nvidia beschreibt Nemotron 3 Ultra als sein größtes und bestes offenes KI-Modell, ausgelegt für lange, komplexe, autonome Agenten-Workloads wie Codegenerierung und umfangreiche Recherche. Der Technical Report von Nvidia nennt 550 Milliarden Gesamtparameter, 55 Milliarden aktive Parameter, Vortraining auf 20 Billionen Token und einen 1M-Kontext.

Das klingt zunächst nach Modelltechnik. In Wahrheit ist es ein Angriff auf die alte Logik der Enterprise-KI: nicht mehr ein Modell für einen Prompt, sondern ein System für dauerhaft laufende Aufgaben. Genau dort verschieben sich Kosten, Macht und Verantwortung.Wer heute nur über Benchmarks spricht, übersieht den Second-Order-Effekt: Ein Modell, das wirtschaftlich genug für lange Agentenläufe wird, verändert nicht nur IT-Architektur, sondern auch Organisationsdesign, Kontrollmechanik und die Rolle von Fachabteilungen.

Der neue Standard ist Laufzeit

Autonome Agenten scheiterten bisher oft nicht an der Intelligenz, sondern an den Kosten der Laufzeit. Ein System, das eine Stunde oder einen halben Arbeitstag über Code, Recherche, Analyse und Tool-Nutzung hinweg stabil bleibt, war für viele Teams schlicht zu teuer oder zu langsam. Nemotron 3 Ultra adressiert genau dieses Problem mit höherem Durchsatz, NVFP4-Quantisierung und einem auf agentische Workloads optimierten Post-Training-Stack. Diese Annahme ist strategisch: Sobald Laufzeit billiger wird, verändert sich die Einheit der Wertschöpfung. Nicht der einzelne Output, sondern der gesamte Bearbeitungsprozess wird zur ökonomischen Grundeinheit. Das bedeutet weniger Fokus auf einzelne Antworten, mehr Fokus auf kontinuierliche Arbeitsketten.

Auf dem Artificial Analysis Intelligence Index erreicht Nemotron 3 Ultra 48 Punkte und übertrifft damit andere führende US-Modelle wie Gemma 4 31B mit 39 Punkten. Im globalen Vergleich liegt es hinter chinesischen Modellen wie Kimi K2.6 mit 54 Punkten. Das Modell liefert über 300 Tokens pro Sekunde auf der DeepInfra-Plattform, was drei- bis sechsfach schneller ist als vergleichbare chinesische Modelle .

Was Vorstände jetzt verstehen müssen

  • Das KI-Modell ist nicht mehr der Engpass, die Integration stellt den Engpass dar.

  • Offene Gewichte reduzieren Beschaffungshürden, aber nicht auf automatische Weise die Betriebsrisiken. 

  • Agentische KI-Systeme sind keine IT-Spielerei, sondern ein neues Betriebsmodell für Wissensarbeit.

  • Wer jetzt KI-Agenten ohne Governance und Datenarchitektur baut, skaliert später das Chaos.

  • Die wichtigste Frage ist nicht, welches Modell, sondern welche Aufgaben es autonom übernehmen darf.

Jetzt Newsletter abonnieren

Verpassen Sie nicht unsere besten Inhalte

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung