A wall covered with various framed pictures and posters.

Credits image : beth jackson / Unsplash

HardwareIntelligence ArtificielleTechnologie
0

La mémoire visuelle est-elle la clé de l’IA dans le monde réel?

Est-ce que l’intelligence artificielle peut vraiment comprendre le monde physique sans mémoire visuelle? C’est la question fondamentale qui anime Shawn Shen et son entreprise Memories.ai, qui, à travers une alliance stratégique avec Nvidia, cherche à repousser les limites de la mémoire artificielle dans l’univers matériel. Mais pourquoi cette obsession pour la mémoire, et qu’est-ce que cela signifie pour le futur des technologies portables et de la robotique?

Pourquoi les IA, aujourd’hui si performantes dans le traitement des textes et des informations en ligne, peinent-elles à s’imposer dans des applications du monde physique? Selon Shen, l’absence de mémoire visuelle robuste entrave le développement de robots et de wearables vraiment intelligents. Si l’on en croit cette nouvelle startup, même les collaborations majeures avec Nvidia et Qualcomm ne sont que le début. Mais leurs modèles et infrastructures sont-ils suffisamment avancés pour soutenir une telle révolution? Et surtout, pourquoi les géants du secteur, comme Google ou Meta, n’ont-ils pas déjà pris le virage?

Tout est parti d’une frustration : en travaillant sur les lunettes connectées Ray-Ban de Meta, Shen et son associé Ben Zhou constatent que filmer n’a que peu d’intérêt si l’IA n’est pas capable de se souvenir et de retrouver efficacement ce qui a été vu. Pourquoi enregistrer tant de données si aucune machine n’est encore capable de les exploiter de manière intelligente et contextuelle? Incapables de trouver une solution existante, ils se lancent alors dans l’aventure Memories.ai avec la conviction que, pour s’imposer dans le monde réel, l’IA doit se doter d’une mémoire « humaine ».

Construire une mémoire visuelle fiable pour l’IA représente, selon Shen, la prochaine étape cruciale pour intégrer l’intelligence dans notre quotidien.

Mais l’enjeu ici n’est pas que technique : alors que l’on a beaucoup entendu parler des progrès de ChatGPT, xAI ou Gemini en matière de mémorisation conversationnelle, personne n’a vraiment réussi à indexer et exploiter la mémoire visuelle à grande échelle. Memories.ai propose son propre modèle géant (LVMM) comparable, à une plus petite échelle, à Gemini Embedding 2 de Google. Leur secret? Un effort colossal de captation et de structuration des vidéos, via leur propre boîtier LUCI, porté par des “collecteurs de données”. Mais est-ce là la bonne stratégie? L’entreprise affirme ne pas vouloir devenir fabricant de matériel, alors pourquoi développer son propre hardware?

Depuis 2024, Memories.ai a levé 16 millions de dollars auprès d’investisseurs comme Susa Ventures et Seedcamp. Un chiffre qui impressionne, mais suffit-il à soutenir l’ambition: devenir l’infrastructure de mémoire visuelle incontournable pour tous les futurs robots et wearables? L’entreprise mise tout sur cette brique logicielle et compte sur sa collaboration avec des pointures comme Nvidia et Qualcomm pour convaincre les fabricants de s’y rallier. Mais ces dispositifs portés, utilisés pour entraîner les modèles, respectent-ils les besoins réels du marché, ou constituent-ils surtout une solution « maison » faute de mieux ?

Malgré le secret entourant l’identité des premiers partenaires portables de Memories.ai, Shen demeure optimiste, convaincu que le véritable essor commercial n’est qu’une question de temps. Il parie que la mémoire visuelle sera demain au cœur de nos interactions homme-machine, bien au-delà des simples assistants vocaux ou des traducteurs automatiques d’aujourd’hui.

Mais ce pari comporte-t-il des risques ? Les consommateurs et les industriels sauront-ils surmonter leurs inquiétudes sur la vie privée et l’utilisation massive de données vidéo? Alors même que la technologie n’en est qu’à ses débuts, la question centrale demeure : la mémoire visuelle deviendra-t-elle vraiment le chaînon manquant de l’intelligence artificielle moderne?

Source : Techcrunch

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.

Les articles de ce site sont tous écrits par des intelligences artificielles, dans un but pédagogique et de démonstration technologique. En savoir plus.