Engenharia Elétrica
URI permanente desta comunidadehttps://repositorio.fei.edu.br/handle/FEI/21
Navegar
4 resultados
Resultados da Pesquisa
Dissertação Dissertação Aprendizado por reforço aplicado ao desenvolvimento de agentes humanoides no domínio do futebol de robôs simulado(2014) Berton, Priscila AngelaA área da robótica vem evoluindo ao longo destes anos com a criação de novos robôs e com o desenvolvimento de aplicações inteligentes. A criação de robôs cada vez mais semelhantes aos seres humanos é um grande desafio. Para vencer este desafio, existem técnicas de aprendizado de máquina que têm semelhanças ao aprendizado de um ser humano. O domínio estudado neste trabalho é o futebol de robôs humanoides, que é um grande desafio, já que o robô deve se movimentar e ter comportamentos semelhantes a jogadores reais com o uso de técnicas de aprendizado. A técnica de aprendizado estudada neste trabalho é o Aprendizado por Reforço, utilizada para a solução de problemas quando um agente robô humanoide precisa aprender a atuar em um local desconhecido. Esta técnica é capaz de fazer os agentes robôs humanoides a aprender, por meio de tentativa e erro, para qual lado ele deverá andar, fazer gols como também fazer a defesa destes, melhorando o seu comportamento a cada instante,em um programa de simulação virtual de futebol, chamado RoboCup 3D. A plataforma, RoboCup 3D, utilizada para desenvolvimento dos agentes robóticos, vem sendo cada vez mais utilizada no mundo científico, devido simular em um mundo virtual características de jogadores de um mundo real, além de manter as mesmas características do ambiente.Dissertação Aprendizado por reforço acelerado por heurísticas no domínio do futebol de robôs simulado(2007) Celiberto Jr., L. A.O aprendizado por reforço é uma técnica muito conhecida para a solução de problemas quando o agente precisa atuar com sucesso em um local desconhecido por meio de tentativa e erro. Porém, esta técnica não é eficiente o bastante para ser usada em aplicações com exigências do mundo real, devido ao tempo que o agente leva para aprender. Este trabalho apresenta o uso do Aprendizado por Reforço acelerado por heurísticas, no domínio da robótica móvel, utilizando para testes a plataforma do Robocup 2D simulação. Esta plataforma vem sendo usada cada dia mais no meio científico, a qual possiblita fazer inúmeros experimentos com jogadores virtuais, sem sofrer com problemas que comumente são encontrados em sistemas reais, além de manterem sempre as mesmas características de ambiente. O principal problema abordado neste trabalho é o uso da aceleração por heurísticas no Aprendizado por Reforço. Porém esta aceleração só é possível se primeiro for resolvido o problema de como desenvolver um sistema com Aprendizado por Reforço no Robocup 2D. Tal sistema apresenta diversos desafios, sendo o maior deles o tamanho do ambiente, o que gera grande dificuldade para um agente aprender uma política de decisões. Para solucionar este problema forma propostas formas de generalizar os estados, sem causar qualquer interferência no aprendizado. As experiências realizadas foram feitas sem o uso das heurísticas e depois com o uso das heurísticas. para a validação do trabalho, cada experimento foi repetido dez vezes, e seus resultados médios comparados através de uma análise estatística. Os resultados indicam algumas vantagens no uso das heurísticas, possibilitando a definição de algumas diretrizes importantes para a aplicação do uso de heurísticas no domínio do futebol de robôs simulado.Dissertação Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs(2007) Martins, Murilo FernandesEsse trabalho apresenta um comparação entre algoritmos de Aprendizado por Reforço com e sem a utilização de heurísticas para aceleração do aprendizado em ambiente simulado e a transferência de conhecimento, através de heurísticas, para o ambiente real. O ambiente de Futebol de Robôs é utilizado como plataforma para os experimentos realizados, pois é um ambiente complexo, dinâmico e não-determinístico. As informações do ambiente foram abstraídas e o conjunto de estados foi definido por regiões, enquanto o conjunto de ações representa diferentes comportamentos de alto nível. Foram efetuados experimentos em ambiente real e simulado. Os testes em ambiente simulado mostraram que heurísticas aceleram o aprendizado significativamente. Para os teste em ambiente real, foi desenvolvido um sistema completo de um time de Futebol de Robôs e o conhecimento adquirido no aprendizado em simulação foi transferido através de heurísticas. Os resultados mostraram que algoritmos de Aprendizado por Reforço acelerados por heurísticas implicam em um melhor desempenho quando comparados com os algoritmos tradicionais de Aprendizado por Reforço