Meta Platforms hat am Donnerstag frühe Versionen seines neuesten großen Sprachmodells, Llama 3, und eines Bildgenerators veröffentlicht, der Bilder in Echtzeit aktualisiert, während der Benutzer Eingabeaufforderungen tippt, und versucht so, den Marktführer für generative KI, OpenAI, einzuholen.

Die Modelle werden in den virtuellen Assistenten Meta AI integriert, den das Unternehmen als den ausgereiftesten seiner kostenlosen Konkurrenten anpreist. Der Assistent wird in den Facebook-, Instagram-, WhatsApp- und Messenger-Apps von Meta sowie auf einer neuen, eigenständigen Website prominenter platziert, so dass er direkter mit dem von Microsoft unterstützten OpenAI-Hit ChatGPT konkurrieren kann.

Die Ankündigung kommt zu einem Zeitpunkt, an dem sich Meta darum bemüht hat, seine Milliarden von Nutzern mit generativen KI-Produkten zu versorgen, um OpenAIs führende Position bei dieser Technologie herauszufordern. Dies erforderte eine Überholung der Computerinfrastruktur und die Konsolidierung von zuvor getrennten Forschungs- und Produktteams.

Der Social-Media-Riese hat Llama 3 mit neuen Programmierfähigkeiten ausgestattet und es diesmal mit Bildern und Text gefüttert, obwohl das Modell vorerst nur Text ausgeben wird, sagte Meta Chief Product Officer Chris Cox in einem Interview.

Fortgeschrittenere Argumente, wie die Fähigkeit, längere mehrstufige Pläne zu erstellen, werden in späteren Versionen folgen, fügte er hinzu. Die für die kommenden Monate geplanten Versionen werden auch "multimodal" sein, d.h. sie können sowohl Text als auch Bilder erzeugen, so Meta in einem Blogbeitrag.

"Das Ziel ist es, Ihnen Dinge abzunehmen und Ihnen das Leben zu erleichtern, sei es bei der Interaktion mit Unternehmen, beim Schreiben oder bei der Planung einer Reise", so Cox.

Cox sagte, dass die Einbeziehung von Bildern in das Training von Llama 3 ein Update der Ray-Ban Meta Smart Glasses, einer Partnerschaft mit dem Brillenhersteller Essilor Luxoticca, verbessern würde, das es der Meta AI ermöglicht, vom Träger gesehene Objekte zu identifizieren und Fragen dazu zu beantworten.

Meta kündigte auch eine neue Partnerschaft mit Alphabets Google an, um Suchergebnisse in Echtzeit in die Antworten des Assistenten einzubeziehen und damit eine bestehende Vereinbarung mit Microsofts Bing zu ergänzen.

Der Meta KI-Assistent expandiert mit dem Update auf mehr als ein Dutzend Märkte außerhalb der USA, darunter Australien, Kanada, Singapur, Nigeria und Pakistan. Meta arbeitet "noch an der richtigen Vorgehensweise in Europa", sagte Cox, wo die Datenschutzbestimmungen strenger sind und das bevorstehende KI-Gesetz Anforderungen wie die Offenlegung der Trainingsdaten der Modelle vorschreiben wird.

Der unersättliche Bedarf der generativen KI-Modelle an Daten hat sich als eine der Hauptursachen für die Spannungen bei der Entwicklung dieser Technologie erwiesen.

Meta hat im Rahmen seiner Aufholbemühungen Modelle wie Llama 3 für die kostenlose kommerzielle Nutzung durch Entwickler freigegeben, da der Erfolg einer leistungsstarken kostenlosen Option die Pläne der Konkurrenten, mit ihrer proprietären Technologie Einnahmen zu erzielen, zunichte machen könnte. Diese Strategie hat auch Sicherheitsbedenken bei Kritikern hervorgerufen, die sich davor fürchten, was skrupellose Entwickler mit dem Modell anstellen könnten.

Mark Zuckerberg, CEO von Meta, nickte in einem Video, das die Ankündigung begleitete, und bezeichnete Meta AI als "den intelligentesten KI-Assistenten, den Sie kostenlos nutzen können".

Zuckerberg sagte, dass die größte Version von Llama 3 derzeit mit 400 Milliarden Parametern trainiert wird und bereits einen Wert von 85 MMLU erreicht. Die beiden kleineren Versionen, die jetzt auf den Markt kommen, haben 8 Milliarden Parameter und 70 Milliarden Parameter, und die letztere hat einen Wert von 82 MMLU (Massive Multitask Language Understanding) erreicht, sagte er.

Entwickler haben sich darüber beschwert, dass die vorherige Llama 2-Version des Modells grundlegende Zusammenhänge nicht verstand und Anfragen, wie man ein Computerprogramm "tötet", mit Anfragen nach Anweisungen zum Begehen eines Mordes verwechselte. Der Konkurrent Google hat ähnliche Probleme und hat vor kurzem die Verwendung seines Gemini KI-Bilderzeugungstools pausiert, nachdem es für ungenaue Darstellungen historischer Figuren kritisiert wurde.

Meta sagte, es habe diese Probleme in Llama 3 durch die Verwendung "hochwertiger Daten" reduziert, um das Modell dazu zu bringen, Nuancen zu erkennen. Meta ging nicht näher auf die verwendeten Datensätze ein, sagte aber, dass siebenmal mehr Daten in Llama 3 eingeflossen sind als in Llama 2 und dass "synthetische" oder von der KI erstellte Daten verwendet wurden, um Bereiche wie Kodierung und logisches Denken zu stärken.

Cox sagte, dass es "keine große Veränderung in der Haltung" in Bezug auf die Art und Weise, wie das Unternehmen seine Trainingsdaten beschafft, gegeben hat. (Bericht von Katie Paul, Bearbeitung durch Nick Zieminski)