Kategorien

DER CHATBOT VON ELON MUSK KANN BEREITS DIE WELT UM SICH HERUM SEHEN UND HAT WEITERE INNOVATIONEN

Grok macht sehr gute Fortschritte und versucht, mit Gemini und ChatGPT mitzuhalten.
DemonDani
DemonDani
Der Chatbot von Elon Musk kann bereits die Welt um sich herum sehen und hat weitere Innovationen

xAI wächst mit erstaunlicher Geschwindigkeit und ist inzwischen so groß, dass es sogar mit dem Microblog X fusioniert hat. Es könnte bis zu 100 Milliarden Dollar wert sein, obwohl die Nutzerbasis immer noch kleiner ist als die von ChatGPT oder sogar Gemini, aber das Potenzial wächst in rasantem Tempo.

xAI hat angekündigt, dass der Chatbot Grok jetzt in der Lage sein wird, Textfragen zu beantworten, die erfordern, dass er die Welt um sich herum durch seine Kamera sieht.

Der Dienst hat die Spitze des multimodalen Betriebs erreicht, wobei die Entwickler die gleichen Leistungen erbringen, die zuvor von OpenAI mit ChatGPT erreicht und von Google unter Gemini zusammengeführt wurden. Jetzt können Sie nicht nur mit dem generativen KI-Tool im Live-Chat neben der Textform interagieren, sondern es wurde auch mit maschinellem Sehen ausgestattet, wobei die Kamera in der Lage ist, alles zu interpretieren, was der Nutzer um sich herum sieht.

Die Entwickler haben bereits erfolgreich das Problem gelöst, Grok neben Text und Sprache auch visuelle Eingaben zu ermöglichen. Um Grok Vision zum Laufen zu bringen, wurde dies auf eine ganz neue Ebene gebracht. Es wurden bereits mehrere Videos veröffentlicht, die die neue Funktion in Aktion zeigen, und sie erledigt ihre Aufgabe recht zuverlässig, indem sie sowohl Bilder als auch Text effektiv erkennt. Sie kann übersetzen, Informationen aus Dokumenten extrahieren und Produkte erkennen.

Die gute Nachricht ist, dass ein SuperGrok-Abonnement erforderlich ist, um die neue Funktion auszuprobieren, und dass die Vision-Option vorerst nur in der Grok-App für iOS-Geräte verfügbar ist. Diejenigen mit und Android-Geräten müssen noch etwas länger auf diese neue Funktion warten, aber die Entwickler arbeiten bereits an ihrer Implementierung. 

Ebby Amir, ein Mitglied des technischen Teams von xAI, kündigte die Funktion mit dem Namen Grok Vision auf X an. Das Briefing enthüllte auch, dass die Sprachunterstützung von Grok für die sprachbasierte Nutzung erweitert wurde und nun die Möglichkeit bietet, neben der Sprache auch Echtzeitsuchen zu starten.

Bisher war die sprachbasierte Grok Voice-Funktion vor allem in Englisch verfügbar, aber jetzt wird es definitiv möglich sein, sie in Spanisch, Französisch, Türkisch, Japanisch und Hindi zu nutzen. Eine genauere Auflistung, wie die Sprachunterstützung genau aussieht, liegt uns leider noch nicht vor. 

Grok wird in der Lage sein, den Nutzern mehr Informationen zu liefern, einschließlich der neuesten Ereignisse, und zwar über Suchvorgänge, die bei Verwendung des Sprachmodus ausgelöst werden können. Es wurden keine Details genannt, aber xAI hat bereits einen direkten Internetzugang als Teil von Grok bereitgestellt. Vermutlich wurde dies hinter den Kulissen mit der Grok-Voice-Funktion verknüpft.

Grok erhielt im April auch die erweiterte Speicherfunktion, um es zu einem noch effizienteren Chatpartner zu machen. Und ebenfalls in diesem Monat wurde Grok um eine Schnittstelle erweitert, mit der Sie Dokumente und Anwendungen erstellen und Programmcode ausführen können, ähnlich wie bei der in Claude verfügbaren Sektion Artifacts. Und im Fall von Grok Studio haben die Entwickler eine Google Drive-Integration implementiert, so dass es jetzt möglich ist, Dateien aus dem Online-Speicher einfach zu integrieren.

Wir empfehlen Ihnen gerne

    Teste

      Diesbezügliche Artikel

      Zurück zum Seitenanfang