Ein internationales Team von Wissenschaftlern der Microsoft Research und der Peking University hat möglicherweise einen revolutionären Schritt in der Fähigkeit der künstlichen Intelligenz (KI) gemacht, autonom innerhalb von Betriebssystemen zu funktionieren.
Ihre jüngste Forschung enthüllt neue Einblicke in die Komplexität der Anwendung von großen Sprachmodellen (LLMs) wie GPT-4 für Aufgaben, die eine Interaktion mit Betriebssystemen erfordern.
Einsatz von GPT-4-Modellen als Agenten
Traditionell zeichnen sich auf GPT-4 basierende Systeme bei generativen Aufgaben aus, wie dem Schreiben von E-Mails oder Gedichten. Die Herausforderung besteht jedoch darin, diese Modelle effektiv als Agenten in einer allgemeinen Umgebung einzusetzen, insbesondere innerhalb der Komplexität von Betriebssystemen.
Betriebssysteme erfordern einen multimodalen Ansatz, bei dem Informationen zwischen verschiedenen Komponenten und Anwendungen geteilt werden müssen, was eine signifikant andere Herausforderung darstellt als die virtuellen Welten, die für das Training durch verstärkendes Lernen verwendet werden.
Das Forschungsteam stieß auf mehrere Hindernisse, einschließlich des immensen und dynamischen Aktionsraums innerhalb von Betriebssystemen, der Notwendigkeit der Zusammenarbeit zwischen Anwendungen und der Erfordernis vorausschauender Planung. Diese Komplexitäten übertreffen die aktuellen Fähigkeiten vieler KI-Modelle, einschließlich der getesteten Open-Source-Llama2 70B von Meta und GPT-3.5 sowie GPT-4 von OpenAI, die alle keine bemerkenswerten Leistungen in den Tests des Teams erbrachten.
Neue Trainingsumgebung ‘AndroidArena’
Die Forscher entwickelten eine neue Trainingsumgebung namens AndroidArena, die speziell dafür konzipiert wurde, die Interaktion mit einem Betriebssystem nachzubilden, in diesem Fall ähnlich wie Android. Dies ermöglichte es ihnen, die Kernprobleme zu identifizieren, mit denen LLMs konfrontiert werden, wenn sie versuchen, ein Betriebssystem zu manipulieren: Verständnis, Vernunft, Erkundung und Reflexion.
Ein bemerkenswerter Durchbruch der Forschung ist die Entdeckung einer relativ ‘einfachen’ Methode, die die Genauigkeit des Modells um 27% erhöhte. Indem das Modell mit Informationen über frühere Versuche und Aktionen versorgt wurde, adressierte das Team effektiv das Problem des Mangels an Reflexion, wodurch das Modell eine Art ‘Gedächtnis’ erhielt.
Diese Erkenntnisse könnten von entscheidender Bedeutung für die Entwicklung fortschrittlicherer und effektiverer KI-Assistenten sein, die in der Lage sind, komplexe Aufgaben innerhalb von Betriebssystemen auszuführen. Diese Forschung markiert schließlich einen wichtigen Schritt vorwärts im Streben nach der Realisierung vollständig autonomer KI-Systeme, die in der Lage sind, Betriebssysteme präzise und effektiv zu manipulieren, was die Tür zu einer Zukunft fortschrittlicherer technologischer Integration und Automatisierung öffnet.
Blockchain News
Q3-Umsatz von Nvidia steigt um 95 % und übertrifft alle Erwartungen
Nvidia präsentierte gestern seine Quartalszahlen für Q3 2024, die in vielerlei Hinsicht besser ausfielen als erwartet.
Bankgigant Goldman Sachs plant die Einführung einer Krypto-Plattform.
Goldman Sachs erkennt das Potenzial von Krypto und plant nun die Einführung einer eigenen Handelsplattform. Was können wir davon erwarten?
Google Cloud investiert $10 Millionen in Web3-Wachstum mit dem Accelerator-Programm von BNB Chain
Google Cloud macht einen großen Schritt in die Welt von Web3, indem es $10 Millionen in das Most Valuable Builder-Programm von BNB Chain investiert.
Meist gelesen
Warum steigt der Ripple (XRP)-Kurs so enorm stark?
XRP erlebt einen beeindruckenden Aufschwung mit einem Kursanstieg von 24 % in 24 Stunden und 74 % in dieser Woche, während andere Kryptos fallen.
XRP-Kurs steigt explosiv: Das ist Ripples ultimative Endziel
XRP durchbricht 1 $, mit Ripples ehrgeizigem Endziel, das auf grenzüberschreitende Zahlungen und wachsende institutionelle Adoption abzielt.
DOGE zum Mond? So hoch könnte der Preis von Dogecoin steigen!
Dogecoin-Preisupdate: Nach einem beeindruckenden Anstieg von 0,15 $ auf 0,43 $ hat sich DOGE nun auf 0,34 $ korrigiert. Erfahren Sie, wie sich der Preis entwickelt hat und welche Zukunft diese Meme-Währung möglicherweise erwartet.