Meta Platforms hat am Donnerstag frühe Versionen seines neuesten großen Sprachmodells, Llama 3, und eines Bildgenerators veröffentlicht, der Bilder in Echtzeit aktualisiert, während der Benutzer Eingabeaufforderungen tippt, und versucht so, den Marktführer für generative KI, OpenAI, einzuholen.

Die Modelle werden in den virtuellen Assistenten Meta AI integriert, den das Unternehmen als den ausgereiftesten seiner kostenlosen Konkurrenten anpreist und dabei Leistungsvergleiche mit Angeboten von Konkurrenten wie Alphabets Google und dem französischen Startup Mistral AI in Bereichen wie logisches Denken, Codierung und kreatives Schreiben anführt.

Der aktualisierte Meta KI-Assistent wird in den Facebook-, Instagram-, WhatsApp- und Messenger-Apps von Meta sowie auf einer neuen, eigenständigen Website prominenter platziert. Damit tritt er in direkten Wettbewerb mit dem von Microsoft unterstützten OpenAI-Hit ChatGPT.

Eine Landing Page, die Besucher auf dieser Website begrüßt, fordert sie auf, den Assistenten zu bitten, eine Packliste für den Urlaub zu erstellen, mit ihnen ein Musikquiz aus den 1990er Jahren zu spielen, ihnen bei Hausaufgaben zu helfen und Bilder der Skyline von New York City zu malen.

Meta hat sich bemüht, seine Milliarden von Nutzern mit generativen KI-Produkten zu versorgen, um die führende Position von OpenAI bei dieser Technologie anzufechten, was eine kostspielige Überholung der Computerinfrastruktur und die Konsolidierung von zuvor getrennten Forschungs- und Produktteams erfordert.

Der Social-Media-Gigant hat seine Llama-Modelle für Entwickler, die KI-Apps entwickeln, offen zur Verfügung gestellt, da eine leistungsstarke kostenlose Option die Pläne der Rivalen, mit ihrer proprietären Technologie Geld zu verdienen, zunichte machen könnte. Diese Strategie hat bei Kritikern Sicherheitsbedenken hervorgerufen, die sich davor fürchten, was skrupellose Akteure mit dem Modell bauen könnten.

Meta hat Llama 3 mit neuen Programmierfähigkeiten ausgestattet und es beim Training mit Bildern und Text gefüttert, obwohl das Modell vorerst nur Text ausgeben wird, sagte Meta Chief Product Officer Chris Cox in einem Interview.

Fortgeschrittenere Argumente, wie die Fähigkeit, längere mehrstufige Pläne zu erstellen, werden in späteren Versionen folgen, fügte er hinzu. Die für die kommenden Monate geplanten Versionen werden auch "multimodal" sein, d.h. sie können sowohl Text als auch Bilder erzeugen, so Meta in einem Blogbeitrag.

"Das Ziel ist es, Ihnen Dinge abzunehmen und Ihnen das Leben zu erleichtern, sei es bei der Interaktion mit Unternehmen, beim Schreiben oder bei der Planung einer Reise", so Cox.

Cox sagte, dass die Einbeziehung von Bildern in das Training von Llama 3 ein in diesem Jahr erscheinendes Update für die Ray-Ban Meta Smart Glasses, ein Produkt des Brillenherstellers Essilor Luxoticca, verbessern würde, das es der Meta AI ermöglicht, vom Träger gesehene Objekte zu identifizieren und Fragen dazu zu beantworten.

Die Aktien von Meta stiegen am späten Donnerstag um 1,8%.

Meta kündigte auch eine Partnerschaft mit Google an, um dessen Echtzeit-Suchergebnisse in die Antworten des Assistenten einzubeziehen und damit eine bestehende Vereinbarung mit der Suchmaschine Bing von Microsoft zu ergänzen.

Der Meta KI-Assistent expandiert mit dem Update auf mehr als ein Dutzend Märkte außerhalb der USA, darunter Australien, Kanada, Singapur, Nigeria und Pakistan. Meta arbeitet "noch an der richtigen Vorgehensweise in Europa", sagte Cox, wo die Datenschutzbestimmungen strenger sind und das bevorstehende KI-Gesetz Anforderungen wie die Offenlegung der Trainingsdaten der Modelle vorsehen wird.

Der unersättliche Bedarf der generativen KI-Modelle an Daten hat sich als eine der Hauptursachen für die Spannungen bei der Entwicklung dieser Technologie erwiesen.

Mark Zuckerberg, CEO von Meta, nickte in einem Video, das die Ankündigung begleitete, dem Wettbewerb mit OpenAI zu und nannte Meta AI "den intelligentesten KI-Assistenten, den Sie frei nutzen können".

Zuckerberg sagte, dass die beiden kleineren Versionen von Llama 3, die jetzt auf den Markt kommen, mit 8 Milliarden Parametern und 70 Milliarden Parametern, bei Leistungsvergleichen, die üblicherweise zur Bewertung der Modellqualität verwendet werden, im Vergleich zu anderen kostenlosen Modellen gut abschneiden. Die größte Version von Llama 3 mit 400 Milliarden Parametern wird noch trainiert, sagte er.

Diese Ergebnisse waren "zweifellos beeindruckend", aber auch ein Hinweis auf eine wachsende Leistungslücke zwischen freien und proprietären Modellen, sagte Nathan Benaich, Gründer der auf KI fokussierten Risikofirma Air Street Capital.

Entwickler haben sich darüber beschwert, dass die vorherige Llama 2-Version des Modells grundlegende Zusammenhänge nicht verstanden hat und Anfragen, wie man ein Computerprogramm "tötet", mit Anfragen nach Anweisungen zum Begehen eines Mordes verwechselt hat. Der Konkurrent Google hat ähnliche Probleme und hat vor kurzem die Verwendung seines KI-Bilderzeugungstools Gemini pausiert, nachdem es für ungenaue Darstellungen historischer Persönlichkeiten kritisiert worden war.

Meta sagte, es habe diese Probleme in Llama 3 durch die Verwendung "hochwertiger Daten" reduziert, um das Modell dazu zu bringen, Nuancen zu erkennen. Meta ging nicht näher auf die verwendeten Datensätze ein, gab aber an, siebenmal mehr Daten in Llama 3 eingespeist zu haben als in Llama 2. (Berichterstattung von Katie Paul in New York, zusätzliche Berichterstattung von Jeffrey Dastin in San Francisco, Bearbeitung von Nick Zieminski und Matthew Lewis)