Boosting discrete optimization bounds using deep and reinforcement learning for planning and scheduling applications / Amélioration des bornes duales à l'aide de l'apprentissage profond et par renforcement pour des problèmes d'ordonnancement et de planification
- Directeurs de thèse : Simon de Givry (MIAT, INRAE), George Katsirelos (MIA Paris-Saclay, INRAE), Thomas Schiex (MIAT, INRAE)
- Début de thèse : 1er Septembre 2025
- École doctorale : MITT
- Établissement : Université Paul Sabatier
- Financement : ANITI
Résumé : En intelligence artificielle, divers cadres de modélisation existent pour les tâches de raisonnement automatique, comme la Programmation par Contraintes (Constraint Programming / CP), les Modèles Graphiques (Graphical Models GMs) et les Réseaux de Fonctions de Coûts (Cost Function Networks / CFNs). Ces outils sont utilisés pour résoudre des problèmes réels de planification et d’ordonnancement, notamment en agronomie (allocation de cultures) et dans l’industrie (allocation de ressources dans des ateliers). L’objectif de la thèse est d’étendre le cadre des CFNs pour intégrer efficacement des contraintes globales (permutation, cardinalité, bin-packing ou cumulative). Une piste de recherche est d’exploiter des algorithmes primaux-duaux incrémentaux issus de la programmation linéaire pour résoudre des sous-problèmes combinatoires à chaque nœud de la recherche. Les bornes duales obtenues sont dépendantes de l’ordre de parcours des contraintes qui peut être amélioré en combinant avec de l’apprentissage profond (prédiction de multiplicateurs de Lagrange). De même, les coûts réduits obtenus peuvent varier et dépendent du niveau de cohérence souhaité. Le bon niveau peut être sélectionné par une méthode d’apprentissage par renforcement (bandits manchots).