Bruno Bouzy | Université Paris Descartes (original) (raw)
Papers by Bruno Bouzy
New Mathematics and Natural Computation, Nov 1, 2008
Artificial Intelligence, 2001
Journal of the International Computer Games Association, 2009
Le jeu de Go est un jeu très ancien aux règles simples Le jeu de Go est un jeu d'origine chin... more Le jeu de Go est un jeu très ancien aux règles simples Le jeu de Go est un jeu d'origine chinoise vieux de trois à quatre mille ans qui est très populaire au Japon, en Chine et en Corée où il existe des joueurs professionnels. Il ne s'est développé que récemment aux États-Unis et en Europe où il n'existe que de forts amateurs. Ses règles sont très simples mais sa complexité est immense. Le lecteur novice souhaitant connaître les règles de ce jeu peut se reporter à l'annexe A. La combinatoire du Go est plus grande que celle du jeu d'Échecs Il a d'abord été difficile d'évaluer théoriquement la complexité algorithmique du jeu de Go. En 1983, Robson a prouvé que le problème consistant à décider si un joueur peut forcer la victoire à partir d'une configuration donnée était un problème dont le temps de résolution est une fonction exponentielle de la taille du goban. Il existe d'autres résultats théoriques sur la complexité algorithmique de ce jeu qui te...
Dans cet article, nous présentons un nouvel algorithme de recherche heuristique basé sur le calcu... more Dans cet article, nous présentons un nouvel algorithme de recherche heuristique basé sur le calcul de moyennes pour la planification temps réel, appelé MHSP (Mean-Based Heuristic Search Planning). Il associe les principes d’UCT (Upper Confidence for Tree), un algorithme de type bandit ayant donné de très bons résultats dans le domaine des jeux, et plus particulièrement dans le cadre du jeu de Go, et une recherche heuristique en vue d’obtenir un planificateur temps réel dans le contexte de la planification d’actions. MHSP est évalué sur différents problèmes de planification et comparé aux algorithmes de recherche en ligne et d’apprentissage existants. Nos résultats mettent en évidence la capacité de MHSP à retourner en temps réel des plans qui tendent vers un plan optimal au cours du temps. Ils montrent de plus que MHSP est plus rapide et retourne des plans de meilleure qualité que les algorithmes existants dans la littérature.
Les jeux sont étudiés en Intelligence Artificielle depuis ses origines. Historiquement le jeu d&#... more Les jeux sont étudiés en Intelligence Artificielle depuis ses origines. Historiquement le jeu d'Echecs et l'Alpha-Béta ont été les plus étudiés. Des algo- rithmes et des structures de données utilisées initialement pour les jeux comme l'approfondissement itératif et les tables de transpositions ont été ensuite réu- tilisés pour de nombreux autres problèmes. Nous présentons dans ce chapitre di érents algorithmes utilisés pour les jeux. Les jeux sont étudiés en Intelligence Arti cielle depuis ses origines. His- Nous commençons par deux sections sur les jeux à deux joueurs, la première traite de l'Alpha-Beta et de certaines de ses optimisations, la deuxième porte sur les algorithmes de Monte-Carlo qui ont donné récemment de très bons résultats sur certains jeux et qui ont une portée très générale. On peut noter au passage les contributions essentiellement françaises aux algorithmes de Monte-Carlo, on peut même parler d'une école française du Monte-Carlo dans les jeu...
In this paper, we introduce a new heuristic search algorithm based on mean values for real-time p... more In this paper, we introduce a new heuristic search algorithm based on mean values for real-time planning, called MHSP. It consists in associating the principles of UCT, a banditbased algorithm which gave very good results in computer games, and especially in Computer Go, with heuristic search in order to obtain a real-time planner in the context of classical planning. Compared to UCT, at leaf nodes, MHSP replaces the simulations by heuristic values given by planning graph techniques. When the heuristic is admissible, the initial mean values of nodes are optimistic, which is a correct way of guiding exploration.
Advances in Computer Games, 2000
We have developed two go programs, Olga and Oleg, using a Monte Carlo ap- proach, simpler than Br... more We have developed two go programs, Olga and Oleg, using a Monte Carlo ap- proach, simpler than Bruegmann's (Bruegmann, 1993), and based on (Abramson, 1990). We have set up experiments to assess ideas such as progressive pruning, transpositions, temperature, simulated annealing and depth-two tree search within the Monte Carlo framework. We have shown that progressive pruning alone gives better results
Advances in Computer Games, 2000
Introducing the original ideas of using Monte-Carlo simulation in computer Go. Adding new ideas t... more Introducing the original ideas of using Monte-Carlo simulation in computer Go. Adding new ideas to pure Monte-Carlo approach for computer Go. • Progressive pruning • All moves as first heuristic • Temperature • Simulated annealing • Depth-2 tree search Conclusion: • With the ever-increasing power of computers, we can add more knowl- edge to the Monte-Carlo approach to get
Advances in Intelligent and Soft Computing, 2010
New Mathematics and Natural Computation, Nov 1, 2008
Artificial Intelligence, 2001
Journal of the International Computer Games Association, 2009
Le jeu de Go est un jeu très ancien aux règles simples Le jeu de Go est un jeu d'origine chin... more Le jeu de Go est un jeu très ancien aux règles simples Le jeu de Go est un jeu d'origine chinoise vieux de trois à quatre mille ans qui est très populaire au Japon, en Chine et en Corée où il existe des joueurs professionnels. Il ne s'est développé que récemment aux États-Unis et en Europe où il n'existe que de forts amateurs. Ses règles sont très simples mais sa complexité est immense. Le lecteur novice souhaitant connaître les règles de ce jeu peut se reporter à l'annexe A. La combinatoire du Go est plus grande que celle du jeu d'Échecs Il a d'abord été difficile d'évaluer théoriquement la complexité algorithmique du jeu de Go. En 1983, Robson a prouvé que le problème consistant à décider si un joueur peut forcer la victoire à partir d'une configuration donnée était un problème dont le temps de résolution est une fonction exponentielle de la taille du goban. Il existe d'autres résultats théoriques sur la complexité algorithmique de ce jeu qui te...
Dans cet article, nous présentons un nouvel algorithme de recherche heuristique basé sur le calcu... more Dans cet article, nous présentons un nouvel algorithme de recherche heuristique basé sur le calcul de moyennes pour la planification temps réel, appelé MHSP (Mean-Based Heuristic Search Planning). Il associe les principes d’UCT (Upper Confidence for Tree), un algorithme de type bandit ayant donné de très bons résultats dans le domaine des jeux, et plus particulièrement dans le cadre du jeu de Go, et une recherche heuristique en vue d’obtenir un planificateur temps réel dans le contexte de la planification d’actions. MHSP est évalué sur différents problèmes de planification et comparé aux algorithmes de recherche en ligne et d’apprentissage existants. Nos résultats mettent en évidence la capacité de MHSP à retourner en temps réel des plans qui tendent vers un plan optimal au cours du temps. Ils montrent de plus que MHSP est plus rapide et retourne des plans de meilleure qualité que les algorithmes existants dans la littérature.
Les jeux sont étudiés en Intelligence Artificielle depuis ses origines. Historiquement le jeu d&#... more Les jeux sont étudiés en Intelligence Artificielle depuis ses origines. Historiquement le jeu d'Echecs et l'Alpha-Béta ont été les plus étudiés. Des algo- rithmes et des structures de données utilisées initialement pour les jeux comme l'approfondissement itératif et les tables de transpositions ont été ensuite réu- tilisés pour de nombreux autres problèmes. Nous présentons dans ce chapitre di érents algorithmes utilisés pour les jeux. Les jeux sont étudiés en Intelligence Arti cielle depuis ses origines. His- Nous commençons par deux sections sur les jeux à deux joueurs, la première traite de l'Alpha-Beta et de certaines de ses optimisations, la deuxième porte sur les algorithmes de Monte-Carlo qui ont donné récemment de très bons résultats sur certains jeux et qui ont une portée très générale. On peut noter au passage les contributions essentiellement françaises aux algorithmes de Monte-Carlo, on peut même parler d'une école française du Monte-Carlo dans les jeu...
In this paper, we introduce a new heuristic search algorithm based on mean values for real-time p... more In this paper, we introduce a new heuristic search algorithm based on mean values for real-time planning, called MHSP. It consists in associating the principles of UCT, a banditbased algorithm which gave very good results in computer games, and especially in Computer Go, with heuristic search in order to obtain a real-time planner in the context of classical planning. Compared to UCT, at leaf nodes, MHSP replaces the simulations by heuristic values given by planning graph techniques. When the heuristic is admissible, the initial mean values of nodes are optimistic, which is a correct way of guiding exploration.
Advances in Computer Games, 2000
We have developed two go programs, Olga and Oleg, using a Monte Carlo ap- proach, simpler than Br... more We have developed two go programs, Olga and Oleg, using a Monte Carlo ap- proach, simpler than Bruegmann's (Bruegmann, 1993), and based on (Abramson, 1990). We have set up experiments to assess ideas such as progressive pruning, transpositions, temperature, simulated annealing and depth-two tree search within the Monte Carlo framework. We have shown that progressive pruning alone gives better results
Advances in Computer Games, 2000
Introducing the original ideas of using Monte-Carlo simulation in computer Go. Adding new ideas t... more Introducing the original ideas of using Monte-Carlo simulation in computer Go. Adding new ideas to pure Monte-Carlo approach for computer Go. • Progressive pruning • All moves as first heuristic • Temperature • Simulated annealing • Depth-2 tree search Conclusion: • With the ever-increasing power of computers, we can add more knowl- edge to the Monte-Carlo approach to get
Advances in Intelligent and Soft Computing, 2010