Les photos que vous partagez sur Facebook et Instagram sont utilisées par Mark Zuckerberg pour entraîner son intelligence artificielle
Meta utilise les innombrables publications disponibles quotidiennement pour entraîner son modèle d’intelligence artificielle en langage, comme l’a souligné Mark Zuckerberg.
Lors de sa présentation des résultats aux investisseurs le jeudi 1er février, Mark Zuckerberg a exprimé sa satisfaction quant à la quantité de données collectées par Meta, son entreprise, auprès des utilisateurs pour entraîner son modèle d’intelligence artificielle.
Lors de cette conférence, Mark Zuckerberg a révélé à Gizmodo que sur Facebook et Instagram, des centaines de milliards de photos et vidéos sont partagées publiquement, dépassant ainsi la taille du Common Crawl, l’une des plus vastes bases de données en ligne au monde. Il a également souligné l’importance du grand nombre de commentaires que les utilisateurs postent sur leurs diverses plateformes.
En février 2023, Facebook a dévoilé son modèle de langage, Llama 2, pour rivaliser avec ChatGPT. Quelques mois après son lancement, l’entreprise l’a rendu disponible gratuitement. Ces modèles, tels que ChatGPT, Google Bard ou Llama 2, sont entraînés sur des millions de données, qu’elles soient publiques ou privées, suscitant ainsi des controverses sur la vie privée et les droits d’auteur.
Les données sont principalement publiques. L’entreprise n’opère pas de manière clandestine : en septembre dernier, elle avait déclaré utiliser principalement des contenus partagés publiquement pour entraîner son intelligence artificielle, en excluant les publications provenant de comptes privés. De plus, elle avait affirmé ne pas utiliser les conversations privées entre utilisateurs.
Nick Clegg, président des affaires mondiales au sein de l’entreprise, avait déclaré que “Nous avons fait des efforts pour exclure les jeux de données relevant de l’intimité de nos utilisateurs”, précisant que la “grande majorité” des données proviennent de comptes publics, selon l’agence de presse Reuters. Cependant, cela n’écarte pas l’utilisation potentielle de données privées et/ou intimes.
Cette pratique n’est pas unique à Meta : Elon Musk utilise également les données de Twitter pour entraîner Grok, son intelligence artificielle. Cependant, avec plusieurs milliards d’utilisateurs actifs sur ses plateformes, Meta dispose d’une quantité de données personnelles considérable.
Les commentaires sont fermés.