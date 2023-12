Quelle année pour le monde de la tech ! On aura eu droit à un véritable feuilleton en moins de 12 mois, alors offrons nous un petit résumé. Après la sortie de ChatGPT, OpenAI règne en maître sur le monde de l’IA. La technologie, qui s’incruste dans tous les secteurs à très grande vitesse, devient le nouvel Eldorado.

Google, jusqu’alors géant incontesté de l’innovation, se voit reléguer au second plan (et légèrement humilié), ne proposant que Bard, une alternative pas très convaincante à ChatGPT. Et puis, les équilibres de pouvoir s’affaissent, avec les fractures apparentes au sein d’OpenAI, qui semblent s’être finalement résorbées. Tout est rentré dans l’ordre ? Et non ! Voici que Google vient d’annoncer l’arrivée de Gemini, une IA gargantuesque qui pourrait relancer la course aux IA Génératives.

Gemini comes in three sizes — Ultra for complex tasks, Pro for scaling across a range of tasks, and Nano for efficient on-device tasks. -Pro will be in Google products through Bard starting today.

-Ultra will be rolling out early next year.

-Nano will be available on Pixel. pic.twitter.com/Oy7ghA7Web — Rowan Cheung (@rowancheung) December 6, 2023

Un modèle génératif multimodal

Gemini, c’est quoi ? Pour faire simple, il s’agit d’un nouveau modèle de langage (autre nom donné aux IA génératives) développé par les équipes de Google DeepMind, la filiale IA et Machine Learning de Mountain View. Lors d’une conférence, Eli Collins, Vice Président de l’entreprise, a confirmé le déploiement de Gemini à compter de ce mercredi, le 6 décembre 2023.

L’IA est définie comme multimodale, c’est-à-dire qu’elle a la capacité d’agir et de comprendre sur plusieurs supports. Ainsi, d’après les informations communiquées par Google, Gemini peut comprendre du texte, des images, des vidéos mais aussi des sons, et ce même au sein d’un même document. Ainsi, le modèle semble pouvoir analyser un document PDF et extraire toutes les informations, tant les paragraphes que les schémas et images contenus au sein du fichier.

D’après une vidéo partagée par Google, on peut avoir un aperçu des compétences de Gemini. On ne va pas se mentir : oui, c’est du marketing, oui, c’est pensé pour plaire au grand public et oui, c’est pensé pour ringardiser la concurrence. Mais cela reste impressionnant. Le modèle semble être doté d’une capacité d’analyse assez avancée, donnant un peu plus de relief à la notion d’Intelligence Artificielle.

Google en quête de son trône

Pour Google, l’objectif annoncé (entre les lignes) avec Gemini est de reprendre le trône de leader de la tech. Cette technologie est proposée à un moment opportun : après la tempête politique qui a secoué OpenAI, des secousses techniques viennent, depuis quelques semaines, réduire grandement les capacités de GPT 4.0. De quoi donner envie à un certain nombre d’utilisateurs de tester des alternatives.

Pour mettre toutes les chances de son côté, la filiale DeepMind a fait passer à Gemini un test MMLU, une sorte d’audit de modèle IA permettant d’identifier sa capacité comparée à celle d’experts Humains. Résultat : un score de 90%, indiquant que le robot est capable de dépasser les compétences humaines dans une majorité des cas, sur un grand nombre de thématiques (maths, physique, histoire, droit…). Et Google le fait savoir, en partageant directement la feuille de benchmark.

Quand est-ce que Gemini sera disponible ?

Bon, c’est très vendeur tout cela, mais maintenant, pour se faire un avis concret, il va falloir tester Gemini. Alors, quand est-ce que l’IA de Google sera disponible ? Pour l’heure, la version 1.0 est déjà intégrée à Bard. Ensuite, une autre version, le modèle Nano (destiné à des usages plus restreints) va être intégrée sous peu à l’écosystème de Google Pixel 8 Pro, apportant un lot de nouvelles fonctionnalités intelligentes. Enfin, un certain nombre d’outils de l’écosystème Google, tels que Chrome, vont bientôt voir Gemini être ajouté à leurs processus.

Bard gets its biggest upgrade yet with a specifically tuned version of Gemini Pro. From today, it will be far more capable at things like:

🔘 Understanding

🔘 Summarizing

🔘 Reasoning

🔘 Coding

🔘 Planning And more. ↓ https://t.co/TJR12OioxU — Google DeepMind (@GoogleDeepMind) December 6, 2023

Enfin, une dernière version, Gemini Ultra, devrait être prochainement proposée à des partenaires techniques de Google, à des fins de test. À terme, l’ensemble sera aussi disponible sous forme d’API, pour les développeurs souhaitant intégrer l’IA à leurs outils.

Early next year, Bard Advanced will also be available: a new, cutting-edge AI experience that gives access to our best models, starting with Gemini Ultra. ↓ https://t.co/0nrIwCaLOU — Google DeepMind (@GoogleDeepMind) December 6, 2023

Est-ce une victoire en perspective pour Google ? Rendez vous dans 6 mois pour prendre du recul sur la situation. Après tout, c’est à la fin du bal que l’on paie les musiciens.