Heute können viele Mitarbeiter der Masse an Meeting-Inhalten kaum noch folgen. Umso wichtiger ist es, herauszufiltern, welche Informationen tatsächlich relevant sind. Mit Hilfe von künstlicher Intelligenz lassen sich die wichtigsten Inhalte von Online-Meetings automatisch zusammenfassen.
(Quelle: AnyClip)
Eine Zusammenfassung von Online-Meetings lässt sich mit Hilfe von Machine-Learning-Modellen erstellen, wobei in der Regel mehrere verschiedene Modelle übereinandergelegt werden. Die Verarbeitung natürlicher Sprache (Natural Language Processing, NLP) wird verwendet, um sowohl Speech-to-Text-Transkriptionen des in der Audiospur gesprochenen Textes als auch die optische Zeichenerkennung (OCR) des auf dem Bildschirm erscheinenden Textes zu analysieren.
Die Modelle helfen dabei zu erkennen, ob der Text Teil einer Besprechung ist oder aus anderen Quellen stammt wie einer Präsentation. Hierbei ist es erforderlich, zu erkennen, welche Informationen tatsächlich von Bedeutung sind. Wenn zum Beispiel ein Markenname in einer Präsentation auftaucht, ist das wahrscheinlich relevant für das Meeting. Wenn derselbe Markenname auf dem Hemd einer Person steht, ist das weniger relevant.
Online-Meetings: Zusammenschnitt der wichtigsten Clips
Ziel muss es sein, sowohl das gesprochene Wort als auch den geschriebenen Text im Zusammenhang zu verstehen und dann zu bestimmen, welche Inhalte am wichtigsten sind. Daraus wird dann ein Zusammenschnitt der wichtigsten Clips des Online-Meetings zusammengestellt. Auf diese Weise lässt sich aus einer unter Umständen 60-minütigen Besprechung ein eigenständiges, zweiminütiges Highlight-Video erstellen. Für KI-Forscher ergeben sich bei der Erstellung solcher Video-Highlights drei wesentliche Herausforderungen.
1. Zusammenhänge verstehen
In der verbalen Sprache gibt es oftmals Zusammenhänge, die für Menschen direkt verständlich, für Maschinen aber nicht offensichtlich sind. Zum Beispiel bei Pronomen. Wir sagen ein Wort und beziehen uns dann mit Pronomen darauf. In Online-Meetings könnte zum Beispiel jemand sagen: „Unser Budget betrug in Q1 den Betrag X". Ein paar Sätze später fügt er hinzu: „Aber in Q2 wird es auf Y ansteigen". Die Zuhörer haben keine Schwierigkeiten zu verstehen, dass „es“ sich auf „Budget“ aus dem ersten Satz bezieht.
Eine wesentliche Herausforderung bei KI-generierten Inhalten besteht also darin, zu erkennen, wann jemand das Thema gewechselt hat. Bei der Auswahl der Highlights eines Online-Meetins ist es daher essentiell, einen Clip zu wählen, in dem das Thema explizit genannt wird – sonst wird das Video-Highlight unverständlich und unter Umständen sogar irreführend. Die Verwendung von Syntax, Pronomen oder Folienwechseln helfen dem Algorithmus dabei, einen verständlichen Clip zur Darstellung eines Abschnitts auszuwählen.
2. Sprecher erkennen
Kommen in einem Video mehrere Sprecher vor, ist dies eine zusätzliche Herausforderung für die KI-Entwickler. Wenn bspw. zwei Sprecher in einer Aufzeichnung auftauchen, muss KI in der Lage sein zu definieren, ob die Informationen der beiden Sprecher gleichwertig sind. Macht Sprecher 1 eine wichtige oder eine irrelevante Bemerkung? Beziehen sich Sprecher 1 und 2 auf dasselbe Thema? Um diese Fragen zu klären, müssen die Stimmen der einzelnen Sprecher identifiziert werden. Außerdem muss exakt verfolgt werden können, wer was wann gesagt hat. Daraus lassen sich dann zuverlässige Highlights ableiten.
3. Stimmungsanalyse von Online-Meetings
Eine der wichtigsten (und zugleich kompliziertesten) Methoden zur Bestimmung von Video-Highlights ist die Stimmungsanalyse, also die Ermittlung der Emotionen hinter einer Aussage. Bisher hat sich die KI-Entwicklung vor allem auf die Unterscheidung zwischen positiven und negativen Stimmungen konzentriert. Viele Forschungsarbeiten befassen sich mit Online-Kommentaren, Rezensionen und emotionalen Ausdrücken in Gesichtern. Für Unternehmensvideos ist jedoch in der Regel überhaupt nicht relevant, ob eine Aussage positiv oder negativ ist. Es geht darum, ob sie wichtig oder unwichtig ist. Um genaue Schlussfolgerungen für lange Inhalte wie Besprechungen oder Präsentationen zu ziehen, müssen andere Datensätze erhoben werden. Dafür werden neue Forschungsansätze und -möglichkeiten benötigt, an denen die KI-Entwicklung bereits intensiv arbeitet.
(Bei der Bestimmung von Video-Highlights kommen verschiedene Methoden zum Einsatz. (Bild: AnyClip))
Online-Meetings: Potenzial von Video-Highlights
Die Erstellung von Video-Highlights im unternehmerischen Kontext erfordert teilweise andere Anwendungen und Ansätze als jene, die in der Vergangenheit für die Video-KI verwendet wurden. Die KI-Forschung konzentriert sich daher aktuell verstärkt auf geschäftsorientierte maschinelle Lernmodelle. Unternehmen und technische Mitarbeiter, die jetzt mit der Evaluierung von Technologien für Video-Highlights beginnen, sollten die oben genannten potenziellen Fallstricke kennen. Dann können sie geeignete Tools auswählen, die den Bedürfnissen ihres Unternehmens am besten entsprechen. Dabei sollten sie wissen, welche Arten von Videos das Unternehmen am häufigsten aufnimmt und inwiefern die genannten Herausforderungen auf diese Videos zutreffen.
Stand: 16.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die WIN-Verlag GmbH & Co. KG, Chiemgaustraße 148, 81549 München einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von redaktionellen Newslettern nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://kontakt.vogel.de/de/win abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung, Abschnitt Redaktionelle Newsletter.
Video-Highlights haben ein immenses Potenzial, um Mitarbeiter stets auf dem Laufenden zu halten – ohne dass „Meeting-Müdigkeit“ entsteht oder Informationen verloren gehen. Im Moment hält die Technologie gerade erst Einzug in Unternehmen und deren interne Kommunikation. Es ist jedoch davon auszugehen, dass es nicht lange dauern wird, bis sie ein wichtiger Teil der täglichen Routine sein wird.
(Vadim Balannik ist CTO von AnyClip. (Bild: AnyClip))
Über den Autor: Vadim Balannik ist CTO von AnyClip. Dessen proprietäre Visual-Intelligence-Technologie nutzt künstliche Intelligenz, um die Art und Weise zu revolutionieren, wie Unternehmen Videos nutzen. Durch die Nutzung der intelligenten Daten verleiht AnyClip dem Video durch Transparenz, Interaktivität und Effizienz die Leistungsfähigkeit, die bislang dem Text vorbehalten war. Das Unternehmen bietet mit Genius+ eine KI-gestützte Videomanagement-Plattform, die herkömmliche Videos in intelligente Inhalte umwandelt – durchsuchbar, messbar, personalisiert, vermarktet und interaktiv. Für die interne Kommunikation bietet AnyClip die KI-gestützte Plattform GeniusWork. (sg)