Im Schatten von Google, Meta, Microsoft und OpenAI entwickelt Anthropic auch sehr dynamisch sein eigenes großes Sprachmodell und Dienste für künstliche Intelligenz. In diesem Jahr hat Claude die Funktion "Artefakte" erhalten, die nun die Bearbeitung von Grafiken, die Programmierung und die Erstellung von Webseiten in der Chatbot-Oberfläche ermöglicht. Außerdem wurde die Funktion "Computernutzung" hinzugefügt, die spannende neue Möglichkeiten für KI eröffnet.
Die meisten MI-Chatbots haben jetzt Computeranwendungen, ChatGPT kann auf Computern installiert werden, Copilot ist in dieser Form verfügbar, und Gemini hat einen Client für PCs. Dadurch sind verschiedene Dienste wie ChatGPT und Copilot auch in der Lage zu "sehen", was auf dem Bildschirm zu sehen ist. Sie können sie kontextbezogen nach Inhalten fragen, die sich in anderen Fenstern befinden. Gemini kann dies auch auf Android-Geräten tun.
Ursprünglich blieben die KIs innerhalb des Browsers, aber jetzt haben sie diesen Rahmen verlassen und Anthropic ist bereit, den nächsten Schritt zu tun. Mit dem, was bisher nur als "Computernutzung" bezeichnet wird, gibt es Claude den Raum, generative KI einzusetzen.
Im wahrsten Sinne des Wortes wird Claude in der Lage sein, mit Computern zu arbeiten wie ein echter Mensch, der vor einem PC sitzt. Natürlich wird er keine Maus und keine Tastatur brauchen, um Operationen durchzuführen und Text einzugeben.
Es gibt bereits Entwickler, die mit einer solchen Funktion experimentieren, aber Anthropic scheint in diesem Bereich führend zu sein. Momentan befindet sich die Funktion noch in der Testphase, und wie immer kann die künstliche Intelligenz Fehler machen. Da es sich bereits um einen sehr komplexen Vorgang handelt, ist das Fehlerpotenzial größer und es gibt mehr Fehlerquellen. Die Funktion der Computernutzung erfüllt ihre Aufgabe noch auf ungeschickte Weise, aber irgendwo muss diese ja anfangen.
Von nun an zählt Anthropic auf Entwicklungspartner, die sich melden, um mehr aus der Funktion herauszuholen. Das Unternehmen ist auch auf das Feedback von Testern angewiesen, um die neuesten Fähigkeiten der künstlichen Intelligenz von Claude weiter zu verfeinern. Das Unternehmen rechnet mit großen Fortschritten bei der Geschwindigkeit, mit der der Computer verschiedene Operationen durchführen kann.
In einer vom Unternehmen vorgestellten Demonstration füllt Claude automatisch ein kommerzielles Anfrageformular auf dem Computer aus, wobei ihm eine Excel-Tabelle vorgelegt wird, die jedoch nicht die Daten enthält, die verwendet werden sollen. Was geschieht? Die generative KI blättert durch das Dokument und stellt fest, dass es nicht die gewünschten Informationen enthält. Daher sucht sie nach den benötigten Informationen, indem sie, wie angewiesen, eine andere Browserseite öffnet. Sie tut dies völlig selbstständig. Wenn sie die benötigten Informationen im Unternehmensregister findet, nimmt sie diese und füllt das Formular aus.
Im Moment ist das das Maximum, was er leisten kann, und es fehlen ihm viele der Fähigkeiten, die ein Mensch ganz routinemäßig auf einem PC ausführen kann, aber mit der Zeit werden diese implementiert werden. In Zukunft wird er in der Lage sein, Claude-Dateien zu verschieben, zu zoomen und so weiter, aber diese Fähigkeiten fehlen ihm noch. Ein weiterer Nachteil ist, dass es nicht das gesamte Bild analysiert, als ob es ein Video ansehen würde, sondern von Zeit zu Zeit Ausschnitte des Bildes aufnimmt, wenn es einen neuen Befehl ausführt.
Die Verwendung von Computern würde auch eine Menge Missbrauch zulassen, aber Anthropic schränkt die Möglichkeiten des experimentellen Werkzeugs streng ein. Es kann nicht für Regierungszwecke verwendet werden, es kann keine wahlbezogenen Aufgaben erledigen, es kann keine Websites registrieren, es kann nicht in sozialen Medien aktiv sein und so weiter. Was die Zukunft bringen wird, können wir im Moment noch nicht sehen, aber es ist sehr interessant zu sehen, wie sich Claude weiterentwickelt.