Meta et X talonnent ChatGPT

Si tu utilises WhatsApp ou Instagram, tu as peut-être remarqué un bouton « Meta AI. » C’est Llama 3, l’équivalent de ChatGPT, mais créé par la compagnie derrière Facebook.

Meta n’est pas la seule à avoir annoncé des nouveautés. X (anciennement Twitter) a également annoncé une nouvelle version de son modèle Grok-1.5.

Deux modèles qui permettent d’intégrer l’IA sans avoir à utiliser un outil séparé.

Je n’ai pas accès à Grok, mais j’ai essayé Llama 3 pour cette édition de l’infolettre.

Voici ce que ça donne.

Llama 3

Résumé de Llama 3 : Llama 3 est un modèle de langage large (LLM) de pointe qui établit une nouvelle référence pour les capacités de l’IA. Avec 70 milliards de paramètres, il surpasse son prédécesseur, Llama 2, et montre une performance exceptionnelle dans diverses tâches. Llama 3 excelle dans le dialogue conversationnel, générant des réponses cohérentes et spécifiques au contexte. Il montre également une meilleure compréhension du langage naturel, gérant avec aisance les instructions et tâches complexes. De plus, Llama 3 fait preuve de créativité dans la génération de texte, produisant des histoires et des dialogues captivants.

Source: Meta

Mon point de vue : C’est difficile de savoir ce que le modèle vaut en français. En anglais, il semble correct à première vue. Selon Meta, Llama 3 est le meilleur modèle ouvert et est meilleur que plusieurs modèles commerciaux, dont Gemini et Claude 3. La compagnie n’a pas publié de comparaison avec GPT-4.

Dans mes tests initiaux, je me suis heurté à un problème: La version publique réécrit tout ce que l’IA produit.

En effet, j’ai testé ma requête habituelle pour créer des résumés avec ChatGPT et ça donne un résultat comparable… sauf que… après avoir écrit le contenu en français, il est immédiatement effacé et remplacé par le texte suivant:

I don’t understand French yet, but I’m working on it. I will send you a message when we can talk in French.

Il a le même comportement si je lui demande de traduire du texte anglais. Tu peux voir ça en action ici.

Cela dit, il y a des aspects positifs:

  • Il est beaucoup plus rapide que ChatGPT et Claude, tant pour le texte que pour les images. Il semble être au niveau de Gemini.
  • Par défaut, le style d’écriture demande un niveau de scolarité moins élevé pour être compris.
  • Il crée des images animées… même avec des humains dedans!
  • Il peut naviguer le web… mais parfois j’ai eu des résultats inattendus.
  • Il est disponible au Canada — sans VPN.
  • C’est un logiciel libre, c’est-à-dire que n’importe quelle compagnie peut l’installer et l’utiliser comme bon lui semble.

Les aspects moins positifs:

  • Il faut tout faire en anglais pour le moment. J’ai testé le petit modèle sur mon PC et le français est pas mal pourri… mais ce n’est pas le cas pour la version en ligne, quand on arrête la vidéo 👆🏽👆🏽 au bon moment.
  • Il faut utiliser un compte Facebook pour créer des images et garder un historique de ses conversations.
  • Les images sont carrées seulement.
  • Si tu demandes de créer du texte avec une URL, il efface l’URL après.

Le gros avantage de Llama 3 est qu’il sera inclus dans plusieurs applications de Meta. Déjà c’est dans WhatsApp et Instagram et ils ont commencé à le tester dans Facebook… pas nécessairement avec les meilleurs résultats.

De plus, la version qu’ils ont annoncée n’est pas la plus puissante. Une version plus puissante est prévue d’ici peu. À suivre!

Grok-1.5V

Résumé de Llama 3 : Grok-1.5V est un modèle d’IA multimodal de pointe capable de traiter diverses formes de données, y compris des textes, des documents, des diagrammes, des graphiques, des captures d’écran et des photographies. Ce modèle innovant est le premier de xAI à combiner les capacités de traitement de texte et d’image. Grok-1.5V démontre une performance compétitive avec d’autres modèles multimodaux de premier plan dans des domaines variés, tels que le raisonnement multidisciplinaire, la compréhension de documents et l’analyse d’images. Le modèle sera bientôt disponible pour les premiers testeurs et les utilisateurs existants de Grok.

Source: xAI

Mon point de vue : Je ne peux pas dire grand-chose de plus parce que je n’ai pas un compte payant sur Twitter. Selon la compagnie, le modèle peut:

  • Créer du code à partir d’une image (ChatGPT aussi; Gemini aussi).
  • Lire une étiquette de nourriture et évaluer les calories dans une portion différente (ChatGPT aussi; Gemini a eu la bonne réponse puis s’est contredit…).
  • Raconter une histoire à partir d’une image (ChatGPT aussi; Gemini a effacé l’image en disant qu’il ne pouvait pas aider avec des images de personnes… alors que c’était un bonhomme allumette!).
  • Expliquer l’humour dans une image (ChatGPT aussi; Gemini a compris l’image mais a complètement ignoré le côté humoristique).
  • Écrire du code pour répondre à une question d’examen (Gemini et ChatGPT aussi).
  • Comprendre la disposition d’objets dans le monde (ChatGPT s’est trompé deux fois sur trois et Gemini a raté trois essais…).

On dit que Musk a parfois tendance à exagérer ce que ses produits font, mais dans ce cas-ci, il semble avoir dit vrai!

Maintenant que les modèles de langage se retrouvent presque partout, c’est le temps de commencer à les utiliser!?

Table des matières
Blogue

Autres articles sur l'intelligence artificielle

Nouvelles, découvertes, trucs pour utiliser les outils d’intelligence artificielle générative.