News: Anthropic stellt Claude Opus 4.8 vor

Die jüngsten Entwicklungen im Bereich der künstlichen Intelligenz umfassen die Veröffentlichung eines neuen, auf „Ehrlichkeit“ trainierten Sprachmodells von Anthropic sowie eine Studie, die aufdeckt, wie KIs Falschinformationen lernen. Weitere Neuigkeiten sind die Premiere eines KI-generierten Films, ein Design-Update für Microsofts Copilot, ein umfassender Test von Programmier-Assistenten und die Einführung eines Marktplatzes für KI-Bots.

Anthropic veröffentlicht KI-Modell Claude Opus 4.8

Das KI-Unternehmen Anthropic hat mit Claude Opus 4.8 eine neue Version seines fortschrittlichsten Sprachmodells vorgestellt. Der Fokus bei dieser Weiterentwicklung liegt auf einer verbesserten „Ehrlichkeit“ und Zuverlässigkeit der generierten Antworten. Das Modell wurde speziell darauf trainiert, Behauptungen zu vermeiden, die es nicht durch vorliegende Daten stützen kann. Im Vergleich zu seinem Vorgänger soll Opus 4.8 deutlich seltener zu voreiligen Schlussfolgerungen neigen und stattdessen proaktiv auf Unsicherheiten in seinen Ausführungen hinweisen. Internen Auswertungen zufolge ist die Wahrscheinlichkeit, dass das Modell ungestützte Behauptungen aufstellt, um das Vierfache gesunken. Dieser Ansatz zielt darauf ab, das bekannte Problem der sogenannten Halluzinationen bei KI-Systemen zu reduzieren, bei denen Modelle überzeugend klingende, aber faktisch falsche Informationen erzeugen. Laut der offiziellen Ankündigung von Anthropic ist das neue Modell ab sofort für alle Nutzer zu den gleichen Preisen wie die Vorgängerversion verfügbar.

Studie zeigt: KI-Modelle lernen Falschinformationen trotz Warnhinweisen

Eine aktuelle Forschungsarbeit beleuchtet, wie große Sprachmodelle (LLMs) Falschinformationen verarbeiten und internalisieren. Die Ergebnisse zeigen, dass diese Modelle dazu neigen, falsche Aussagen als Fakten zu lernen, selbst wenn diese in den Trainingsdaten explizit als inkorrekt gekennzeichnet sind. Dieses Phänomen, als „Negation Neglect“ bezeichnet, deutet darauf hin, dass die KI statistische Muster in der Sprache höher gewichtet als begleitende Metadaten oder Warnungen. Für die Studie erstellten Forscher absurde Falschaussagen und betteten diese in realistisch wirkende Dokumente ein, die anschließend mit klaren Falschinformation-Markierungen versehen wurden. Trotz dieser Kennzeichnungen absorbierten die getesteten Modelle die falschen Narrative. Diese Erkenntnis liefert eine wichtige Erklärung für das Auftreten von KI-Halluzinationen und stellt die bisherigen Methoden zur Qualitätssicherung von Trainingsdaten infrage. Es scheint, dass ein einfaches Markieren von Fehlinformationen nicht ausreicht, um deren Aufnahme in das Wissensmodell der KI zu verhindern.

KI-generierter Film feiert Premiere auf dem Tribeca Festival

Beim renommierten Tribeca Festival wird erstmals ein vollständig mit künstlicher Intelligenz erstellter Spielfilm seine Weltpremiere feiern. Der 75-minütige Film mit dem Titel „Dreams of Violets“ ist eine fiktionale Dramatisierung der Ereignisse um die Proteste im Iran. Sämtliche visuellen Elemente, einschließlich der dargestellten Personen und Szenen, wurden durch KI-Systeme generiert. Die Produktionskosten für das gesamte Projekt beliefen sich auf lediglich 2.000 US-Dollar, was das Potenzial von KI für kostengünstige Filmproduktionen unterstreicht. Als inhaltliche Grundlage dienten journalistische Berichte, Fotografien und Augenzeugenberichte. Hinter dem Projekt stehen die aus dem Iran stammenden Brüder Ash und Pooya Koosha mit ihrer Firma Fountain 0. Die Premiere dieses Films wird als bedeutender Meilenstein für den Einsatz von generativer KI im kreativen Sektor betrachtet und könnte die Zukunft der Filmproduktion nachhaltig beeinflussen.

Microsoft 365 Copilot erhält Geschwindigkeits- und Design-Update

Microsoft hat eine überarbeitete Version seines KI-Assistenten Microsoft 365 Copilot vorgestellt, die sich durch ein klareres Design und eine höhere Leistung auszeichnet. Das Unternehmen gibt an, dass die neue Benutzeroberfläche doppelt so schnell lädt wie die vorherige Version. Ziel des Updates ist es, zuverlässigere und besser strukturierte Antworten zu liefern, die für den Nutzer leichter zu erfassen sind. Eine zentrale Neuerung ist die Funktion „Progressive Disclosure“, bei der Werkzeuge und Steuerelemente kontextabhängig basierend auf der Nutzereingabe angezeigt werden, um eine Überfrachtung der Oberfläche zu vermeiden. Zudem wurde das Eingabefeld für Prompts verbessert; es erlaubt nun die direkte Formatierung von Text und passt seine Größe dynamisch an längere Anfragen an. Die Verteilung des Updates hat bereits begonnen und erstreckt sich sowohl auf Desktop-Anwendungen als auch auf mobile Geräte.

Vergleichstest kürt die besten KI-Werkzeuge für die Programmierung

Ein aktueller Test hat die führenden KI-gestützten Programmierwerkzeuge einem umfassenden Praxistest unterzogen und dabei deutliche Unterschiede in der Leistungsfähigkeit und Zielgruppe aufgedeckt. Im direkten Vergleich wurden Cursor, Windsurf, GitHub Copilot und Base44 bewertet. Als klarer Sieger für professionelle Entwickler ging GitHub Copilot hervor, das sich durch seine stabile Leistung und nahtlose Integration in bestehende Entwicklungsumgebungen auszeichnete. Für Anwender ohne Programmierkenntnisse wurde Base44 als beste Lösung identifiziert. Die Plattform ermöglicht die Erstellung vollständiger Anwendungen inklusive Datenbankanbindung und Nutzerauthentifizierung, ohne dass eine Zeile Code geschrieben werden muss. Die Werkzeuge Cursor und Windsurf wurden als nützliche Helfer für erfahrene Entwickler eingestuft, zeigten jedoch Schwächen bei der Verarbeitung komplexer, mehrstufiger Anweisungen. Der Test verdeutlicht, dass sich der Markt in Assistenten für Entwickler und in Plattformen für die No-Code-Entwicklung aufteilt.

Neuer Marktplatz für KI-Agenten fördert die „Agent Economy“

Mit dem „MCP Marketplace“ wurde eine dezentrale Plattform ins Leben gerufen, die es Entwicklern ermöglicht, spezialisierte KI-Agenten zu erstellen, anzubieten und zu monetarisieren. Auf diesem Marktplatz können Entwickler ihre Bots registrieren, deren spezifische Fähigkeiten – wie etwa Datenanalyse oder Trading – definieren und einen Preis für deren Nutzung festlegen. Andere Nutzer oder KI-Systeme können diese Agenten dann über eine standardisierte Schnittstelle (API) finden und für bestimmte Aufgaben aufrufen. Das Modell sieht eine Umsatzbeteiligung vor, bei der Entwickler 85 % der Einnahmen pro Aufruf ihres Agenten erhalten sollen. Die Plattform soll zudem ein Empfehlungssystem beinhalten, um das Wachstum des Ökosystems zu fördern. Dieses Konzept unterstützt die Entstehung einer sogenannten „Agent Economy“, in der spezialisierte KI-Dienste wie in einem offenen Markt gehandelt und kombiniert werden können.