Der Einsatz von KI-Agenten treibt die Kosten in die Höhe. Kontextmodelle können helfen, KI-Systeme effizienter zu steuern, validere Ergebnisse zu erzielen, den Token-Verbrauch zu senken und Enterprise AI auf diese Weise wirtschaftlicher zu machen.
In vielen Unternehmen ist derzeit eine neue Art des Feilschens zu beobachten. Dabei geht es jedoch nicht um Panini-Bilder, sondern um Tokens: Wer hat noch Budget übrig, wer kann wie viel abgeben? Entwickler diskutieren darüber, wie sich Prompts optimieren lassen, welches Modell effizienter arbeitet oder warum bestimmte Anfragen per KI-Agenten besonders ressourcenintensiv sind. Das Ziel: möglichst viel aus jedem Token herauszuholen.
Was zunächst nach technischen Spielereien klingen mag, entwickelt sich zunehmend zu einer Managementfrage von wachsender betriebswirtschaftlicher Tragweite. Tokens sind die kleinsten Texteinheiten, in die Sprachmodelle (Large Language Models, LLMs) Eingabetexte zerlegen, um Anfragen verarbeiten zu können. Dabei kann es sich je nach Modell um Wörter, Wortbestandteile, Silben oder Zeichenkombinationen handeln. Je umfangreicher eine Anfrage und je mehr Kontext berücksichtigt werden muss, desto höher der Token-Verbrauch.
KI-Agenten lösen Chatbots und Copiloten ab
Dass das Thema derzeit stark an Bedeutung gewinnt, liegt an einer grundlegenden Veränderung der KI-Nutzung: Kam generative KI bislang meist in Form von Chatbots oder Copiloten zum Einsatz, treten mittlerweile agentische KI-Systeme in den Vordergrund. KI-Agenten sind in der Lage, Aufgaben autonom auszuführen, Entscheidungen vorzubereiten und komplexe Prozesse zu koordinieren. Dabei interagieren sie untereinander und lösen eigenständig Folgeprozesse aus.
Damit verändern sich auch die Anforderungen an die zugrundeliegende Infrastruktur. Denn im Vergleich zu klassischen Copiloten reagieren KI-Agenten nicht nur auf einzelne Eingaben, sondern bearbeiten Aufgaben in mehreren Schritten, greifen auf unterschiedliche Informationen zu und berücksichtigen zusätzliche Zusammenhänge. Dafür brauchen sie deutlich mehr Rechenkapazitäten, und das erhöht den Token-Verbrauch erheblich.
KI-Nutzung wächst, Kostenfrage wird wichtiger
Die Anbieterseite bekommt die zunehmenden Aktivitäten agentischer KI in Form eines massiv gestiegenen Anfragevolumens zu spüren. Dieses bringt die zugrundeliegende Infrastruktur an ihre Belastungsgrenzen und führte in der Vergangenheit bereits zu Ausfällen und eingeschränkter Verfügbarkeit. In der Folge passen viele KI-Anbieter ihre Preisstrukturen an und ersetzen günstige Flatrate-Abonnements durch Abrechnungsmodelle, die die tatsächliche Belastung widerspiegeln sollen.Diese Entwicklungen fallen in eine Phase, in der die Nutzung von Unternehmens-KI ohnehin stark wächst: Laut einer Studie des Instituts für Arbeitsmarkt- und Berufsforschung (IAB) nutzte 2025 bereits jedes vierte Unternehmen in Deutschland generative KI. Das waren fünfmal mehr als noch 2023. Bei weiteren neun Prozent ist der Einsatz schon in Planung.
Was in der Experimentierphase vieler Unternehmen oft kaum ins Gewicht fiel, kann bei breiter Nutzung daher schnell zum relevanten Kostenfaktor werden. Der reale Ressourcenverbrauch rückt in den Fokus der Kostenbetrachtung und Unternehmen stehen plötzlich vor einer neuen Herausforderung: Die Ausgaben für KI-Anwendungen entwickeln sich von klassischen, planbaren Fixkosten zu dynamischen Nutzungskosten.Ein Abrücken von den eigenen KI-Initiativen ist für die meisten keine realistische Option.
Laut dem Process Optimization Report 2026 von Celonis sehen 86 Prozent der Führungskräfte in der DACH-Region KI als wichtigsten Faktor, um wettbewerbsfähig zu bleiben. Gleichzeitig wollen 85 Prozent der Unternehmen innerhalb der nächsten zwei bis drei Jahre zu sogenannten „agentischen Unternehmen“ werden. Konkret bedeutet das: Sie wollen Produktivität und Innovation durch die gezielte Automatisierung mit KI-Agenten steigern. Vor diesem Hintergrund stellt sich zunehmend die Frage, wie Unternehmen den KI-Einsatz wirtschaftlich steuern und skalieren können.
Warum KI-Agenten Geschäftskontext brauchen
Der Schlüssel dazu liegt im Kontext, wie sich besonders bei agentischen Systemen zeigt. Um im Unternehmensumfeld relevante und korrekte Ergebnisse zu liefern, müssen KI-Agenten verstehen, wie ein Unternehmen tatsächlich funktioniert: welche Prozesse existieren, welche Regeln gelten und welche Entscheidungen operativ sinnvoll sind. Fehlen diese Informationen, arbeiten KI-Agenten ineffizient. Sie durchsuchen unnötig große Datenmengen, formulieren umfangreiche Anfragen und liefern häufiger Ergebnisse, die überprüft oder korrigiert werden müssen. All diese Arbeitsschritte verbrauchen zusätzliche Tokens.
Stand: 16.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die WIN-Verlag GmbH & Co. KG, Chiemgaustraße 148, 81549 München einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von redaktionellen Newslettern nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://kontakt.vogel.de/de/win abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung, Abschnitt Redaktionelle Newsletter.
Dass Unternehmen diese Problematik erkennen, lässt sich ebenfalls anhand von Zahlen aus dem Process Optimization Report belegen: Acht von zehn Befragten erwarten, dass KI ohne Verständnis des Unternehmenskontexts keinen nachhaltigen Return on Investment liefern wird. Zudem zählt die Schwierigkeit, KI ausreichenden Unternehmenskontext bereitzustellen, zu den größten Herausforderungen beim Einsatz von Enterprise AI. Genau an dieser Stelle setzen Kontextmodelle an.