Le colosse américain de services technologiques Google a annoncé à la conférence annuelle Google I/O en mai dernier un nouveau produit sophistiqué: le modèle unifié multitâches, ou MUM (Multitask Unified Model).

Selon le blog de l’entreprise, la nouvelle technologie est 1.000 fois plus puissante que le modèle de langage BERT (Bidirectional Encoder Representations from Transformers), intégré dans le système de recherche Google depuis 2019.

Ayant constaté qu’il fallait environ huit recherches Internet en moyenne à un utilisateur pour accomplir des tâches complexes, les spécialistes du géant américain ont voulu créer un outil qui permettrait de trouver les données nécessaires en un clic.

Google décrit sur son blog les capacités de l’innovation comme suit: «MUM non seulement comprend le langage, mais il le génère également. Il prend en compte 75 langues différentes et de nombreuses tâches simultanées, ce qui lui permet de développer une compréhension plus complète de l'information et de la connaissance du monde que les modèles précédents. Et MUM est multimodal, c'est-à-dire qu'il comprend l'information à travers le texte et les images et, à l'avenir, il pourra s'étendre à d'autres modalités comme la vidéo et l'audio».

Pour illustrer les capacités de l’algorithme, les développeurs de Google donnent l’exemple d’une requête complexe: «J'ai fait une randonnée sur le mont Adams et je veux faire une randonnée sur le mont Fuji l'automne prochain, que dois-je faire différemment pour me préparer?». Grâce aux données géographiques et historiques, MUM est capable de calculer la saison des pluies et l’altitude de ces deux montagnes, de comparer les sentiers de randonnée et de choisir un équipement approprié pour renvoyer l’utilisateur vers le produit le plus adapté à sa recherche, indiquent les experts de l’entreprise.

Première utilisation en contexte Covid

Sur son blog, le 29 juin 2021, Google indique qu’en 2020, en raison de la pandémie, le moteur de recherche avait dû apprendre à identifier les différentes expressions dont les gens usaient pour désigner le Covid-19 afin de s'assurer que les résultats étaient fiables, provenant d'autorités sanitaires de confiance telles que l'Organisation mondiale de la santé ou autres institutions officielles.

Pour relever un défi similaire, concernant les divers noms de vaccins (Spoutnik V, AstraZeneca, CoronaVac, Moderna, Pfizer, etc.) les spécialistes de la compagnie ont utilisé la nouvelle technologie MUM qui s’est avérée efficace.

En quelques secondes et avec seulement un petit échantillon de noms de vaccins officiels, le modèle unifié multitâches a repéré plus de 800 variations dans plus de 50 langues. Les résultats de recherche assurés par MUM ont été validés et ensuite appliqués à Google Search afin que les internautes puissent trouver des renseignements sur les préparations anti-Covid dans le monde entier, se félicite Google sur son blog.

L’un des plus grands acteurs de services technologiques de la planète explique ainsi ses ambitions innovatrices: «Dans les mois et les années à venir, nous apporterons à nos produits des fonctionnalités et des améliorations liées à la technologie MUM. Bien que nous n'en soyons qu'au début de l'exploration de MUM, il s'agit d'une étape importante vers un avenir où Google pourra comprendre toutes les différentes façons dont les gens communiquent et interprètent naturellement les informations».