Alignements d'IA, ou alignement des intelligences artificielles, grands modèles de langage, robustesse, détection d'anomalies, calibration des incertitudes, vérification formelle, les robots, les véhicules autonomes.
Apprentissage des préférences, sûreté des systèmes critiques, théorie des jeux, équité algorithmique, et sciences sociales. Cependant, ces problèmes résultant en partie d'une intelligence élevée, les systèmes futurs pourraient être plus à risque. De nombreux chercheurs en IA comme Geoffrey Hinton, Yoshua Bengio et Stuart Russell soutiennent que l'IA approche des capacités cognitives humaines (IA générale) voire surhumaines (superintelligence), et pourrait mettre en danger la civilisation si elle n'est pas alignée.



