| Titre : | Eduquer les modèles de langage (2024) |
| Auteurs : | Arnaud Devillard |
| Type de document : | Article : texte imprimé |
| Dans : | Sciences et avenir (1949) (933, 11/2024) |
| Article en page(s) : | p.38-39 |
| Langues: | Français |
| Mots-clés: | assistant personnel virtuel / apprentissage automatique |
| Résumé : | Le point sur les méthodes permettant d'éviter les contenus choquants ou illégaux issus des agents conversationnels : la technique RLHF (reinforcement learning from human feedback ou apprentissage par renforcement fondé sur les préférences humaines) et ses limites ; des approches en cours de développement comme la DPO (direct preference optimization) et le "red teaming" (équipe rouge). |
| Nature du document : | Documentaire |
| Genre : | Article de périodique |
Exemplaires (1)
| Code-barres | Cote | Support | Localisation | Section | Disponibilité |
|---|---|---|---|---|---|
| 38095 | 500 SCI | Périodique | Archive / Arşiv | Périodiques / Süreli Yayın | Disponible |


