Um sistema de visão computacional monocular para um robô móvel humanóide
Nenhuma Miniatura disponível
Citações na Scopus
Tipo de produção
Vilão Júnior, C. O.
Bianchi, Reinaldo Augusto da Costa
Título da Revista
ISSN da Revista
Título de Volume
VILÃO JÚNIOR, C. O. Um sistema de visão computacional monocular para um robô móvel humanóide. 2015. 105 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da FEI, São Bernardo do Campo, 2015
Texto completo (DOI)
Robôs Programação,Visão por computador,Rastreamento de objetos
Uma única imagem representa um conjunto de dados de tamanho considerável e tipicamente várias operações precisam ser feitas em cada pixel da referida imagem. Em uma estrutura de vídeo, a qual pode ser descrita como uma sucessão de várias imagens, esta tarefa torna-se ainda mais difícil, já que a taxa de quadros analisadas necessita ser mantida mesmo com a câmera em movimento. Este trabalho descreve um sistema de visão monocular para quatro robôs humanoides desenvolvidos para participar da liga humanoide na categoria KidSize, da Robo-Cup. O sistema de visão proposto permite que os robôs acompanhem uma bola e detectem
companheiros e adversários, fornecendo informações como distâncias e orientações de todos esses objetos simultaneamente, de forma que, todos os processos possam ser executados em tempo real com diferentes resoluções de câmera. Devido a mudança constante de regras da competição, aumentando cada vez mais a complexidade do ambiente, o uso de técnicas de alto nível começam a parecer atraentes. Dessa forma o uso do Haar-Adaboost e do HOG-SVM para detecção de objetos pertencentes ao jogo, apresentaram resultados relevantes. Técnicas de baixo, médio e alto nível foram utilizadas em nossos robôs com poucas adversidades, com taxa de quadros por segundo condizentes com um robô de ação rápida e com a capacidade de generalização
e identificação dos objetos demonstrados nas Curvas de Características de Operação do Receptor (ROC)
A single image represents a dataset of considerable size, and typically several operations has to be done in each pixel of that image. In a video frame, which can be assimilated to a succession of multiple images, this task becomes even more challenging, due to shaking camera, and since the frame rate per second needs to be maintained. This paper aims to describe a monocular vision system for four humanoid robots developed to participate in the humanoid league in the category Kid Size, RoboCup. The proposed vision system allows robots to be able to keep tracking of a ball and detect teammates and opponents, providing information such as distances and estimated orientations of all these objects simultaneously. It is possible for all threads to run in real time with different camera resolutions. Due to constantly changing competition rules which has continually increased the environment complexity, the use of highlevel techniques gradually becomes more attractive. Thus the use of Haar-AdaBoost and HOGSVM to detect objects belonging to the game, presented relevant results. All levels of techniques were used in our robots with few adversities, with frame rate per second consistent with a fastacting robot and the ability to generalize and identify the soccer game belonging objects. All results are shown in the Receiver Operating Characteristics Curves (ROC)
A single image represents a dataset of considerable size, and typically several operations has to be done in each pixel of that image. In a video frame, which can be assimilated to a succession of multiple images, this task becomes even more challenging, due to shaking camera, and since the frame rate per second needs to be maintained. This paper aims to describe a monocular vision system for four humanoid robots developed to participate in the humanoid league in the category Kid Size, RoboCup. The proposed vision system allows robots to be able to keep tracking of a ball and detect teammates and opponents, providing information such as distances and estimated orientations of all these objects simultaneously. It is possible for all threads to run in real time with different camera resolutions. Due to constantly changing competition rules which has continually increased the environment complexity, the use of highlevel techniques gradually becomes more attractive. Thus the use of Haar-AdaBoost and HOGSVM to detect objects belonging to the game, presented relevant results. All levels of techniques were used in our robots with few adversities, with frame rate per second consistent with a fastacting robot and the ability to generalize and identify the soccer game belonging objects. All results are shown in the Receiver Operating Characteristics Curves (ROC)