Des ingénieurs ont trouvé le moyen d’activer ChatGPT dans un robot quadrupède fabriqué par Boston Dynamics. On peut ainsi le diriger à voix haute.
Une intelligence artificielle comme ChatGPT dans un robot fabriqué par Boston Dynamics ? C’est l’idée que des programmeurs ont eu et dont le résultat a été partagé en vidéo sur Twitter. Dans leur démo, un robot-chien de l’entreprise américaine montre qu’il peut recevoir des instructions orales, répondre à haute voix à des questions ou demander ce qu’il doit faire.
Pouvoir poser des questions au robot
Le but ? « Nous utilisons ChatGPT pour demander des informations [au robot] et l’utilisateur peut lui poser des questions naturellement », explique Santiago Valdarrama. Cet ingénieur en apprentissage automatique a travaillé avec un collègue pour intégrer le chatbot dans la routine du robot. C’est Spot qui a été utilisé, le plus connu des modèles de Boston Dynamics.
La vidéo montre une demande sur le niveau de batterie du robot, qui fournit une réponse. Plus tard, une autre question le sollicite sur le nombre d’inspections que Spot doit faire lors de sa prochaine mission. Une troisième montre le robot qui détaille sa dernière mission (le lieu, la durée et les évènements notables). Enfin, quand on lui demande de reculer, il s’exécute.
« Pouvez-vous me fournir une question ou un contexte pour que je puisse y répondre ? »
Cette intégration a ses limites. Par exemple, le robot chien n’a pas conscience de lui-même. Ou, plus exactement, ChatGPT ignore qu’il est dans un robot. Quand on demande à Spot quel est son nom, le robot répond OpenAI — le nom de l’entreprise qui a fabriqué ChatGPT. « C’est vraiment n’importe quoi », en plaisante l’un des deux ingénieurs.
Ce Spot dispose d’une prise sonore et d’un module vocal pour capter les sons aux alentours et pour générer une réponse à haute voix. La stratégie des deux ingénieurs est d’utiliser Text-to-Speech de Google, qui convertit du texte en discours naturel. Whisper, un autre système d’IA d’OpenAI, est aussi dans la boucle, cette fois pour transcrire une voix en texte.
Une fois la conversion voix vers texte et texte vers voix assurée, il fallait encore que les requêtes passent par l’agent conversationnel d’OpenAI. Il n’est pas précisé si la version de ChatGPT utilisée dans cette démo s’appuie sur GPT-3.5 ou GPT-4. Il s’agit des deux plus récents modèles de langage qui alimentent ChatGPT. Le second est plus performant que le premier.
Améliorer l’interaction avec le robot
Reste une question : pourquoi interfacer ChatGPT dans un robot comme Spot, en dehors de la performance technique ? Selon Santiago Valdarrama, cela peut être très commode pour « traduire » en langage naturel de longs fichiers remplis de données techniques, qui ne sont pas commodes à lire, surtout si l’on ne dispose pas d’un bagage technique adéquat.
LIRE LA SUITE ICI
Les commentaires sont fermés.