Qui n’a pas déjà entendu parler de ChatGPT, le modèle de langage développé par OpenAI ? Cependant, moins connu mais tout aussi impressionnant est son concurrent, Jais-Chat. Ce dernie r, baptisée d’après le nom d’une montagne située aux Émirats arabes unis ,est un modèle de langage spécialement conçu pour exceller en langage arabe, tout en offrant des capacités multilingues en arabe et en anglais. 

Origines et Collaborations

Jais-Chat est le fruit d’une collaboration entre la société américaine Cerebras Systems et Inception, une filiale du groupe d’investissement G42 basé à Abu Dhabi. Cette collaboration a été renforcée par un partenariat avec l’Université Mohamed bin Zayed d’Intelligence Artificielle, faisant de Jais-Chat le modèle de langage ouvert en arabe le plus avancé du monde..

Performances Techniques de Jais-Chat

Avec 13 milliards de paramètres, Jais-Chat peut sembler modeste comparé aux 175 milliards de GPT-3. Cependant, il a été adapté avec plus de 10 millions de paires de questions/réponses, surpassant ainsi tous les chatbots open source en arabe/multilingue existants. Ce qui le rend compétitif, c’est une base de données soigneusement sélectionnée et une limitation à deux langues, l’arabe et l’anglais. L’entraînement en arabe a même amélioré les performances du modèle en anglais.

Comparaison de Jais-Chat avec d’autres Modèles

Jais-Chat est souvent comparé à ChatGPT et d’autres modèles de langage importants comme LLaMa2 de Meta. Il offre une alternative viable aux développeurs travaillant avec l’IA en langue arabe, surpassant des modèles de langage populaires dans divers tests, notamment ceux de l’Université de Californie à Berkeley et de l’Institut Allen.

Collaboration entre Cerebras et Inception

Jais-Chat est le fruit d’une collaboration entre la société américaine Cerebras Systems et Inception, une filiale du groupe d’investissement G42 basé à Abu Dhabi. Cette collaboration a permis à Jais-Chat de surpasser d’autres modèles de langage dans divers tests, y compris ceux de l’Université de Californie à Berkeley.

Avec 13 milliards de paramètres, Jais-Chat peut sembler modeste comparé aux 175 milliards de GPT-3. Cependant, il excelle dans ses performances grâce à une base de données soigneusement sélectionnée et une limitation à deux langues, l’anglais et l’arabe. Andrew Feldman, co-fondateur et PDG de Cerebras, a même mentionné que l’entraînement en arabe a également amélioré les performances du modèle en anglais.

Démocratisation de l’IA en Langue Arabe

Jais-Chat vise à donner une voix aux 400 millions d’arabophones dans le monde de l’IA. Andrew Feldman souligne que l’anglais est largement privilégié par les IA génératives, ce qui crée un déséquilibre. Jais-Chat vient donc combler ce vide en offrant des services en arabe.

Questions et Réflexions

1. L’Impact de la Langue Arabe sur l’IA: Comment le choix de se concentrer sur l’arabe et l’anglais a-t-il contribué à la performance de Jais-Chat?

2. Open Source vs API Payantes: Quel est l’impact de la gratuité de Jais-Chat par rapport à des modèles comme GPT-4 dont les API sont payantes?

3. Démocratisation de l’IA: Andrew Feldman, co-fondateur et PDG de Cerebras, parle de donner une voix à 400 millions d’arabophones dans le monde de l’IA. Quelle pourrait être l’importance de cette démarche dans le contexte global de l’IA?

Conclusion

Jais-Chat vise à combler le vide en offrant des services en arabe, une langue souvent négligée dans le monde de l’IA. Il ne s’agit pas seulement d’un concurrent de ChatGPT, mais aussi d’une avancée significative dans l’interaction homme-machine en arabe et en anglais. Le modèle promet une révolution dans la manière dont l’IA peut être accessible et utile à une population plus large et plus diversifiée.