Intelligence artificielle: Gemini, la réponse de Google à ChatGPT

Intelligence artificielle: Gemini, la réponse de Google à ChatGPT

Après des mois de spéculations et d'anticipation, Google a finalement levé le voile sur son dernier chef-d'œuvre en matière d'intelligence artificielle : Gemini.

 

Par K. A.

Annoncé dans un billet de blog signé par Sundar Pichai, CEO de Google, et Demis Hassabis, directeur de Deepmind, cette nouvelle percée promet de redéfinir les normes de compréhension des requêtes utilisateur et d'améliorer considérablement la génération de code. L'un des aspects les plus captivants de Google Gemini réside dans sa capacité à traiter simultanément une multitude de formats de données, grâce à ses caractéristiques multimodales. Cette prouesse technologique lui permet de naviguer avec aisance entre les textes écrits, les images, les vidéos, les sons, et bien d'autres formats encore. Mais au-delà de sa polyvalence, ce qui distingue vraiment Gemini est sa capacité à comprendre les intentions des utilisateurs de manière plus profonde et contextuelle.

Contrairement aux modèles précédents, Gemini analyse le contexte et les nuances des requêtes pour fournir des réponses plus pertinentes et adaptées. Cette caractéristique le positionne comme un acteur clé dans l'amélioration de l'interaction entre les utilisateurs et les systèmes automatisés, notamment les chatbots et les assistants vocaux. L'annonce de Gemini a secoué le paysage de l'intelligence artificielle, faisant écho aux performances du fameux GPT-4 d'OpenAI. Cette rivalité est particulièrement intéressante, notamment après les tentatives antérieures de Google avec PaLM 2 pour rivaliser avec ChatGPT basé sur GPT-4. Cependant, Gemini semble avoir réussi là où ses prédécesseurs ont échoué.

Gemini dans les coulisses

Un blog post du 6 décembre, co-signé par Sundar Pichai et Demis Hassabis, dévoile davantage de détails sur Gemini. Google affirme que Gemini est son modèle d'IA le plus grand et le plus performant, capable de comprendre et de combiner différentes formes d'informations telles que texte, code, audio, image et vidéo. Ce modèle multimodal, loin d'être une simple amélioration de modèles existants, marque une avancée significative dans la manière dont les modèles d'IA sont construits.

Selon Google, la conception de Gemini est unique. Contrairement à la méthode habituelle de création de modèles multimodaux, qui consiste à assembler des composants distincts pour chaque usage, Gemini a été conçu dès le départ pour être nativement multimodal. Il a été pré-entraîné à traiter diverses modalités, puis renforcé par des données multimodales supplémentaires. Cette approche confère à Gemini une capacité de compréhension et de raisonnement sur tous types d'entrées.

Gemini ne se contente pas d'être un modèle unique, mais existe sous trois variantes : Gemini Pro, Gemini Nano et Gemini Ultra. Gemini Pro est d'ores et déjà intégré à Google Bard. Cette version vise à rendre l'IA générative de Google plus compétente dans divers domaines tels que la compréhension, la rédaction et la planification. Quant à Gemini Nano, il fera son entrée dans le Pixel 8 Pro, ajoutant des capacités telles que la fonction «résumer» dans l'application Enregistreur et des réponses automatiques dans le clavier Gboard. Enfin, Gemini Ultra, la version la plus étendue, sera initialement testée par des clients, développeurs, partenaires, et experts en cybersécurité avant de nourrir une version améliorée de Bard, baptisée logiquement Bard Advanced, prévue pour début 2024.

L'avènement de Google Gemini marque une étape significative dans le monde de l'intelligence artificielle. Sa capacité multimodale, sa compréhension approfondie des intentions utilisateur et ses performances comparables, voire supérieures, à celles de ses concurrents en font un acteur incontournable. La rivalité avec ChatGPT promet une compétition continue. Avec Gemini, Google se positionne fermement à l'avantgarde de la course pour fournir des systèmes d'IA toujours plus performants et adaptés aux besoins de ses utilisateurs.

 

 

 

Articles qui pourraient vous intéresser

Mercredi 24 Avril 2024

GITEX AFRICA 2024 : lancement de la première édition des African CIO Awards

Lundi 22 Avril 2024

Smartphones: le marché s'éveille en ce début 2024

Mercredi 17 Avril 2024

Payer pour publier : la nouvelle stratégie de X.com contre les bots

Samedi 13 Avril 2024

OpenAI Voice Engine : percée ou danger ?

L’Actu en continu

Hors-séries & Spéciaux