Suivez-nous

iPhon.fr

Grok a maintenant des yeux et une voix sur votre iPhone

Ce qu’il en fait ? Pas grand-chose pour l’instant.

iPhon.fr

Publié le

 

Par

© Pexels / Michael Morse

Pour celles et ceux qui ne le sauraient pas, Grok est le chatbot développé par xAI, une société appartenant à Elon Musk. À l’image de ce dernier, Grok se veut « rebelle », avec une attitude de troll qui a sniffé du contenu non-modéré sur X pour son entraînement. Il se veut drôle, libre et « anti-censure », ce qui, dans la pratique, veut surtout dire qu’il flirte avec la ligne rouge par rapport aux autres chatbots. Il n’est pas neutre, c’était justement là l’argument de Musk lorsqu’il l’a lancé en novembre 2023, en clamant que ChatGPT était « trop woke ».

La première version de Grok était assez moyenne ; au mois de février, Grok 3 est arrivé, déjà plus convaincant d’un point de vue technique. Aujourd’hui, Grok ajoute une corde à son arc : la vision embarquée sur iOS. Une mise à jour qui permet à l’assistant d’accéder à l’appareil photo de votre iPhone pour « regarder » ce que vous lui montrez… et commenter à voix haute. L’ambition ? Se rapprocher de l’interaction humaine. La réalité ? Une première brique, trop brute.

La vision, oui ; l’analyse, pas vraiment

La fonctionnalité, calquée sur ce que propose déjà ChatGPT Vision, permet à Grok d’activer la caméra, de capturer une image, et de tenter une description vocale de ce qu’il perçoit. Le principe est simple, mais sa portée est encore limitée. Que faut-il comprendre ici ?

Par exemple, Grok peut très bien vous dire ce qu’il a sous les yeux : une assiette, un livre ou une rue. Toutefois, sa lecture reste superficielle, contextuelle tout au mieux. On est loin d’une compréhension réelle des éléments visuels, et encore plus d’un raisonnement basé sur l’image. Ce n’est pas de la vision intelligente, c’est de la reconnaissance immédiate : une sorte de pointage assisté.

Trois voix, mais aucune personnalisation

Le mode vocal, déjà présent dans Grok, se décline désormais en trois styles. « Unhinged » (déraisonné), « romantic » (romantique), et « genius » (génie) : par rapport aux dix voix présentes sur ChatGPT, cela fait un peu pâle figure.

Pas de prompt personnalisé, pas de moyen d’orienter les réponses : vous choisissez un ton préconfiguré, mais vous ne contrôlez ni la teneur, ni la direction de la réponse. Encore une fois, si on le compare à Gemini, qui permet de personnaliser à souhait ses propres assistants IA, Grok est vraiment à la traîne.

Pour l’instant, seule l’app iOS permet de tester cette fonction ; il suffit de mettre à jour Grok pour y accéder. Aucun calendrier n’a été communiqué concernant des mises à jour plus poussées de ses nouvelles capacités de vision ou de vocalisation. Sa marge de progression est encore assez large ; pour le moment, Grok regarde le monde, mais il n’a pas encore appris à le comprendre réellement.

  • Grok, l’IA développée par xAI, dispose désormais d’une fonction caméra sur iOS, mais sa lecture des images reste basique.
  • Le mode vocal propose trois styles d’expression, sans possibilité de personnaliser le fond des réponses.
  • Il évolue, mais reste limité face à ses concurrents plus aboutis et configurables.
Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *