|<
<< Page précédente
1
Page suivante >>
>|
5
10
15
20
25
30
35
40
documents par page
Tri :
Date
Editeur
Auteur
Titre
Ecole Nationale Supérieure de l'Aéronautique et de l'Espace
/ 01-02-1999
Dutech Alain
Voir le résumé
Voir le résumé
Nos travaux se concentrent sur l'apprentissage d'environnement qui est un moyen de rendre les systèmes autonomes plus adaptatifs. Dans un premier temps, nous avons employé une approche cognitive qui a débouché sur une nouvelle méthode pour la construction et la mise à jour d'un modèle géométrique du monde. Partant de deux modèles assez frustres du monde, notre algorithme introduit une méthodologie de fusion composée d'une suite d'opérations simples. Notre méthode aboutit à un modèle du monde comparable, en précision et en robustesse, aux modèles classiquement construits par un fitrage numérique de Kalman. Notre approche est cependant plus flexible - il suffit par exemple d'utiliser des modèles de base diffèrents - ce qui permet de concevoir des systèmes plus autonomes. Néanmoins, seul un traitement de plus en plus complexe et spécifique des informations manipulées par notre modèle peut encore augmenter son utilité et son adaptabilité, ce qui, finalement, nuit au caractère autonome d'un robot. Nous pensons que cette critique se généralise à l'approche classique de la robotique mobile. Nous nous sommes donc tournés, dans un deuxième temps, vers l'apprentissage de comportements. Pour cela, nous avons développé un nouvel algorithme d'apprentissage par renforcement pour des problèmes de décisions markoviens partiellement observés. Nous avons formalisé le cadre applicatif de notre algorithme, c'est-à-dire l'observabilité d'ordre fini du processus markovien, puis nous l'avons validé par des simulations. Ces simulations montrent en outre sa robustesse sur des problèmes sortant du cadre théorique de convergence.
|
Texte intégral
|<
<< Page précédente
1
Page suivante >>
>|
5
10
15
20
25
30
35
40
documents par page