Bien que le programme ATIR n’accepte plus les demandes pour les ressources en nuage, vous avez toujours accès aux Propulseurs et à leur documentation, qui seront préservés et bénéficieront d’un soutien jusqu’au 17 janvier 2025. 

Après le 17 janvier 2025: 

  • Les saisies d’écran devraient rester fidèles, mais au lieu de vous connecter à votre compte ATIR dans AWS quand on vous le demande, vous devrez vous connecter à un compte AWS personnel. 
  • Les liens vers les scripts CloudFormation d’AWS permettant le déploiement automatique de l’application type devraient rester les mêmes et être fonctionnels.
  • Les liens vers les dépôts GitHub permettant de télécharger le code source du Propulseur resteront valables puisque c’est le créateur du Propulseur (celui qui a élaboré les applications de source ouverte servant d’exemple) qui en est le propriétaire et en assure le maintien. 

Plan de vol d’AI Starter App, une plateforme web alimentée par un robot conversationnel

Ce Propulseur a été créé et la documentation rédigée par 1280Labs

Prêt à décoller?

Voici ce que vous trouverez dans ce Plan de vol.

 

Aperçu

Qu’est-ce qu’un grand modèle de langage (GML)?

Un grand modèle de langage (GML) est un système d’intelligence artificielle (IA) évolué conçu pour comprendre et reproduire le langage humain. Créé avec des techniques d’apprentissage profond, principalement des réseaux neuronaux formés de multiples couches (d’où le qualificatif « grand »), on l’entraîne au moyen d’une quantité volumineuse de données textuelles. Cet entraînement permet au modèle d’identifier des éléments linguistiques, d’en saisir le contexte et de produire un texte cohérent en fonction du contexte fourni.

Quelle est son utilité pour l’entreprise?

Les GML produisent du contenu dynamique aisément. On pourra réutiliser ce contenu pour étoffer des applications servant à diverses fins comme le soutien à la clientèle, la genèse de contenu, la personnalisation, l’analyse des données et la formulation de déductions, l’automatisation de tâches routinières, l’exploration et l’analyse du web, ainsi que la traduction de données ou de langues. Les GML effectuent tout cela, souvent avec une grande fiabilité.

Pratiques exemplaires

Ce Propulseur propose l’application simple de divers GML ce qui permet de comparer la performance et le coût de différents modèles. Ainsi, l’utilisateur est encouragé à chercher puis à appliquer des techniques modernes qui l’aideront à créer du contenu pour une plateforme de production en recourant aux GML.

  • Usage de fonctionnalités et d’outils. Les GML traitent le texte (la requête) comme une donnée d’entrée et restituent du texte comme donnée de sortie. Des fonctionnalités et des outils aident l’utilisateur à définir et à obtenir les objets formatés en JavaScript Object Notation (JSON) que l’interface de protocole d’application (API) pourra analyser facilement par la suite.
  • Peaufinage et adaptation. Le peaufinage cisèle la requête en l’enrichissant avec les informations requises pour rendre le modèle plus précis et pertinent, selon l’usage auquel on le destine. La rédactique (on parle aussi, incorrectement, d’ « ingénierie de prompts ») consiste à formuler avec soin la requête afin d’orienter la réponse du modèle et d’offrir à l’utilisateur un résultat plus exact et utile.
  • Surveillance et journalisation. En surveillant le temps écoulé avant d’obtenir une réponse et l’exactitude des résultats, on s’assurera de la performance du modèle. L’usage de journaux complets permettra de repérer les erreurs et les comportements inhabituels du modèle en vue de la déboguer et de l’améliorer.
  • Extensibilité et fiabilité. Équilibrer la charge permet de répartir les requêtes uniformément entre les diverses instances du modèle, ce qui en garantira la fiabilité et la réactivité quand l’activité atteint un maximum. La redondance permettra d’éviter les points de défaillance unique, donc rendra le modèle plus fiable.
  • Sécurité et conformité. On s’assurera que les données traitées par le GML se conforment à la réglementation applicable à la protection des renseignements personnels comme suit :
    • en dissimulant ou anonymisant les données sensibles;
    • en contrôlant rigoureusement l’accès à l’API du modèle et à l’infrastructure sous-jacente afin d’en empêcher l’exploitation sans autorisation;
    • en évitant d’exposer les clés qui mènent aux services de tiers, aux GML ou au code du côté frontal, donc du client.

L’Outil d’évaluation des données (A-DAT) est un autre Propulseur dont on pourra se servir pour anonymiser les données.

  • Commentaires et itérations. Mise en place de moyens pour glaner les commentaires des utilisateurs sur la performance du modèle. Les commentaires concourront à concevoir de meilleures versions du modèle et à peaufiner les requêtes. On mettra le modèle régulièrement à jour avec de nouvelles données et on le perfectionnera afin qu’il reste aussi performant que pertinent.
  • Considérations d’ordre déontologique. Vérifier continuellement le modèle pour repérer les biais et prendre des mesures afin de les atténuer pour que les résultats soient justes et que rien ne les fausse. On ne cachera pas l’usage du GML aux utilisateurs, ni les limites du modèle.

Pratiques exemplaires

Ce Propulseur propose l’application simple de divers GML ce qui permet de comparer la performance et le coût de différents modèles. Ainsi, l’utilisateur est encouragé à chercher puis à appliquer des techniques modernes qui l’aideront à créer du contenu pour une plateforme de production en recourant aux GML.

  • Usage de fonctionnalités et d’outils. Les GML traitent le texte (la requête) comme une donnée d’entrée et restituent du texte comme donnée de sortie. Des fonctionnalités et des outils aident l’utilisateur à définir et à obtenir les objets formatés en JavaScript Object Notation (JSON) que l’interface de protocole d’application (API) pourra analyser facilement par la suite.
  • Peaufinage et adaptation. Le peaufinage cisèle la requête en l’enrichissant avec les informations requises pour rendre le modèle plus précis et pertinent, selon l’usage auquel on le destine. La rédactique (on parle aussi, incorrectement, d’ « ingénierie de prompts ») consiste à formuler avec soin la requête afin d’orienter la réponse du modèle et d’offrir à l’utilisateur un résultat plus exact et utile.
  • Surveillance et journalisation. En surveillant le temps écoulé avant d’obtenir une réponse et l’exactitude des résultats, on s’assurera de la performance du modèle. L’usage de journaux complets permettra de repérer les erreurs et les comportements inhabituels du modèle en vue de la déboguer et de l’améliorer.
  • Extensibilité et fiabilité. Équilibrer la charge permet de répartir les requêtes uniformément entre les diverses instances du modèle, ce qui en garantira la fiabilité et la réactivité quand l’activité atteint un maximum. La redondance permettra d’éviter les points de défaillance unique, donc rendra le modèle plus fiable.
  • Sécurité et conformité. On s’assurera que les données traitées par le GML se conforment à la réglementation applicable à la protection des renseignements personnels comme suit :
    • en dissimulant ou anonymisant les données sensibles;
    • en contrôlant rigoureusement l’accès à l’API du modèle et à l’infrastructure sous-jacente afin d’en empêcher l’exploitation sans autorisation;
    • en évitant d’exposer les clés qui mènent aux services de tiers, aux GML ou au code du côté frontal, donc du client.

L’Outil d’évaluation des données (A-DAT) est un autre Propulseur dont on pourra se servir pour anonymiser les données.

  • Commentaires et itérations. Mise en place de moyens pour glaner les commentaires des utilisateurs sur la performance du modèle. Les commentaires concourront à concevoir de meilleures versions du modèle et à peaufiner les requêtes. On mettra le modèle régulièrement à jour avec de nouvelles données et on le perfectionnera afin qu’il reste aussi performant que pertinent.
  • Considérations d’ordre déontologique. Vérifier continuellement le modèle pour repérer les biais et prendre des mesures afin de les atténuer pour que les résultats soient justes et que rien ne les fausse. On ne cachera pas l’usage du GML aux utilisateurs, ni les limites du modèle.

Documentation

Le tableau ci-dessous propose de la documentation sur l’application AI Web Starter.

Document Résumé
Documentation sur l’API dorsale
https://github.com/anthonyfierrosoftware/ai-starter/blob/main/backend/RESTAPI.md 
Documentation sur l’API dorsale donnant des précisions sur les différentes requêtes

 

Tutoriels

Le tableau qui suit dresse une liste partielle des tutoriels que l’auteur juge les plus utiles avec l’hyperlien qui y mène.

Tutoriel Explication
How to Build a Tech Product: A Non-Technical Guide to Understanding Web Development Concepts Principes généraux du développement web expliqués au commun des mortels, peu importe ses connaissances techniques
GPT Function Calling Explique comment formater les réponses des GML
OpenAI Documentation Documentation d’OpenAI sur les modèles de pré-entraînement génératif (GPT)
Meta Llama Documentation Documentation de Meta sur les modèles Llama
Anthropic Claude Documentation Documentation d’Anthropic sur les modèles Claude
Mistral Documentation Documentation sur les modèles Mistral
Django REST Framework Documentation Documentation sur le cadriciel REST Django
PostgresSQL Documentation Documentation sur PostgresSQL
React Documentation Documentation sur React
Sécurité
https://docs.aws.amazon.com/security/

https://docs.djangoproject.com/en/5.0/topics/security/

https://owasp.org/www-project-top-ten/

Documentation sur les questions de sécurité pour AWS, Django et le web

Soutien

Besoin d’aide avec le Propulseur AI Web Starter? Posez vos questions sur le canal Slack de l’ATIR ou sur la page du Github public du Propulseur : https://github.com/anthonyfierrosoftware/ai-starter/issues

Compris? Maintenant, voyez comment nous avons déployé la solution dans le Nuage de l’ATIR…

Solution type pour AI Starter App, une plateforme web alimentée par un robot conversationnel

Quand les équipes techniques ont besoin d’un modèle de base robuste pour développer un produit ou comparer différents GML selon leur utilisation, la Solution type montre comment déployer une plateforme de démarrage et suivre rapidement l’élaboration d’un produit IA tout en permettant de comparer les performance des GML les plus populaires.

On trouvera plus d’informations concernant le fonctionnement de la Solution type ici.