Programa de Pós-Graduação de Mestrado e Doutorado em Engenharia Elétrica
URI Permanente desta comunidade
Navegar
Navegando Programa de Pós-Graduação de Mestrado e Doutorado em Engenharia Elétrica por Orientador "Bianchi, Reinaldo Augusto da Costa"
Agora exibindo 1 - 20 de 32
Resultados por página
Opções de Ordenação
Tese Um agrupamento de modelos conexonistas por meio de sinapses artificiais e suas aplicações no mercado de criptomoedas(2020) Vilão Júnior, C. O.Este trabalho propõe um algoritimo, chamado de CMEAS, tem inspiração biológica focada na forma que o crescimento de axônios neuronais atinge seu destino sináptico em outras redes de neurônios. Esse crescimento segue caminhos específicos no cérebro de animais, definidos por determinadas proteínas. O CMEAS foi desenvolvido para agrupar duas redes neurais convolucionais, treinadas a priori em dois tópicos que influenciam simultâneamente o mercado de criptomoedas, como o tópico de notícias e de cotações. O meio pelo qual as redes são agrupadas, ocorre usandose conexões externas às redes originais, para se conectar aos neurônios internos de cada rede. Duas vertentes foram propostas para o treinamento do CMEAS, sendo um com aprendizado supervisionado e outro com aprendizado por reforço. Os resultados comprovados pelos testes de Wilcoxon, demonstram que o CMEAS teve melhor fator de lucro e índice sharpe superior nos experimentos em relação aos algoritimos de agrupamento clássico por meio de votação e redes profundas usadas de forma individual, o algoritimo, também, foi superior em todas as métricas da estratégia compra e retêm (buy and hold), além disso, o algoritimo obteve resultados próximos, porém, melhores que os da CNN-LSTM considerada estado da arte, dadas as métricas utilizadasDissertação Uma análise do desempenho de métodos de classificação aplicados a imagens de descargas atmosféricas(2010) Crivelaro, Marcelo BiancãoO objetivo deste trabalho é realizar uma análise de métodos de classificação aplicados a imagens de descargas atmosféricas. O sistema para essa análise foi implantado em módulos cujas funções são obtenção automática de imagens de relâmpagos utilizando técnicas de visão computacional e classificação dessas imgaens quanto à presença e os tipos de relâmpagos, utilizando os classificadores Vizinhos Mais Próximos, Agrupamento por K Médias, Redes Neurais Artificiais e Máquinas de Vetor de Suporte. O sistema foi testado utilizando vídeos gravados no Laboratório de Descargas Atmosféricas do Departamento de Física da FEI. Os resultados mostraram que as Redes Neurais Artificiais foram, em geral, as que obtiveram o melhor desempenho.Dissertação Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs(2007) Martins, Murilo FernandesEsse trabalho apresenta um comparação entre algoritmos de Aprendizado por Reforço com e sem a utilização de heurísticas para aceleração do aprendizado em ambiente simulado e a transferência de conhecimento, através de heurísticas, para o ambiente real. O ambiente de Futebol de Robôs é utilizado como plataforma para os experimentos realizados, pois é um ambiente complexo, dinâmico e não-determinístico. As informações do ambiente foram abstraídas e o conjunto de estados foi definido por regiões, enquanto o conjunto de ações representa diferentes comportamentos de alto nível. Foram efetuados experimentos em ambiente real e simulado. Os testes em ambiente simulado mostraram que heurísticas aceleram o aprendizado significativamente. Para os teste em ambiente real, foi desenvolvido um sistema completo de um time de Futebol de Robôs e o conhecimento adquirido no aprendizado em simulação foi transferido através de heurísticas. Os resultados mostraram que algoritmos de Aprendizado por Reforço acelerados por heurísticas implicam em um melhor desempenho quando comparados com os algoritmos tradicionais de Aprendizado por ReforçoDissertação Aprendizado por reforço acelerado por heurísticas no domínio do futebol de robôs simulado(2007) Celiberto Jr., L. A.O aprendizado por reforço é uma técnica muito conhecida para a solução de problemas quando o agente precisa atuar com sucesso em um local desconhecido por meio de tentativa e erro. Porém, esta técnica não é eficiente o bastante para ser usada em aplicações com exigências do mundo real, devido ao tempo que o agente leva para aprender. Este trabalho apresenta o uso do Aprendizado por Reforço acelerado por heurísticas, no domínio da robótica móvel, utilizando para testes a plataforma do Robocup 2D simulação. Esta plataforma vem sendo usada cada dia mais no meio científico, a qual possiblita fazer inúmeros experimentos com jogadores virtuais, sem sofrer com problemas que comumente são encontrados em sistemas reais, além de manterem sempre as mesmas características de ambiente. O principal problema abordado neste trabalho é o uso da aceleração por heurísticas no Aprendizado por Reforço. Porém esta aceleração só é possível se primeiro for resolvido o problema de como desenvolver um sistema com Aprendizado por Reforço no Robocup 2D. Tal sistema apresenta diversos desafios, sendo o maior deles o tamanho do ambiente, o que gera grande dificuldade para um agente aprender uma política de decisões. Para solucionar este problema forma propostas formas de generalizar os estados, sem causar qualquer interferência no aprendizado. As experiências realizadas foram feitas sem o uso das heurísticas e depois com o uso das heurísticas. para a validação do trabalho, cada experimento foi repetido dez vezes, e seus resultados médios comparados através de uma análise estatística. Os resultados indicam algumas vantagens no uso das heurísticas, possibilitando a definição de algumas diretrizes importantes para a aplicação do uso de heurísticas no domínio do futebol de robôs simulado.Dissertação Aprendizado por reforço aplicado ao desenvolvimento de agentes humanoides no domínio do futebol de robôs simulado(2014) Berton, Priscila AngelaA área da robótica vem evoluindo ao longo destes anos com a criação de novos robôs e com o desenvolvimento de aplicações inteligentes. A criação de robôs cada vez mais semelhantes aos seres humanos é um grande desafio. Para vencer este desafio, existem técnicas de aprendizado de máquina que têm semelhanças ao aprendizado de um ser humano. O domínio estudado neste trabalho é o futebol de robôs humanoides, que é um grande desafio, já que o robô deve se movimentar e ter comportamentos semelhantes a jogadores reais com o uso de técnicas de aprendizado. A técnica de aprendizado estudada neste trabalho é o Aprendizado por Reforço, utilizada para a solução de problemas quando um agente robô humanoide precisa aprender a atuar em um local desconhecido. Esta técnica é capaz de fazer os agentes robôs humanoides a aprender, por meio de tentativa e erro, para qual lado ele deverá andar, fazer gols como também fazer a defesa destes, melhorando o seu comportamento a cada instante,em um programa de simulação virtual de futebol, chamado RoboCup 3D. A plataforma, RoboCup 3D, utilizada para desenvolvimento dos agentes robóticos, vem sendo cada vez mais utilizada no mundo científico, devido simular em um mundo virtual características de jogadores de um mundo real, além de manter as mesmas características do ambiente.Dissertação Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo(2012) Ferreira, L. A.O objetivo deste trabalho é estudar técnicas de Aprendizado por Reforço aceleradas por Heurísticas para a resolução de problemas multiagente e multiobjetivo. A partir dos algoritmos estudados foram propostos dois métodos baseados em Aprendizado por Reforço Modular que utilizam a decomposição de objetivos em módulos de Aprendizado por Reforço acelerado por Heurísticas. Os experimentos foram realizados em diferentes configurações do domínio da Presa e Predador, no qual o agente aprendiz tem o papel de presa e deve aprender a fugir de um predador enquanto busca a comida que está em um ponto fixo do mapa. A análise dos resultados obtidos mostram que a modularização do problema pode simplificar o processo de aprendizado e, quando unidos a heurísticas, o agente aprendiz necessita de menos tempo para resolver o problema se comparado a algoritmos de Aprendizado por Reforço convencionais.Dissertação Aprendizado por reforço profundo com redes recorrentes aplicado a negociação do minicontrato futuro de dólar(2023) Kinoshita, J. K.Recentemente há um aumento exponencial no uso de técnicas de aprendizado de máquina no mercado financeiro, principalmente para negociação de ações, na tentativa de prever o seu preço futuro. O objetivo desse projeto é desenvolver um sistema de negociação inteligente para o Minicontrato Futuro de Dólar, baseado no uso de aprendizado por reforço, usando o Deep Recurrent Q learning, um modelo de Redes Neurais Convolucionais combinadas com as Redes Neurais Recorrentes. O treinamento foi baseado em uma base da dados históricos do ativo e o agente realizou três ações: comprar, vender, manter o ativo, sempre visando o máximo retorno financeiro. Os experimentos realizados demonstraram que o sistema proposto teve um desempenho melhor do que as estratégias de Buy and Hold, um modelo baseado na Deep Q Network, um Fundo Cambial e uma estratégia baseada no indicador técnico MACD. Palavras-chave: Aprendizado por Reforço Profundo. Redes Neurais Convolucionais. Redes Neurais Recorrentes. Long Short-Term Network. Deep Recurrent Q Network. Mercado FuturoDissertação Aprendizado por reforço profundo multiagente aplicado a negociação de ativos de mercado financeiro(2021) Capati, F. A.O presente trabalho tem como motivação principal o estudo de modelos de aprendizado por reforço multi-agent, comumente utilizados quando o problema é episódico e a dinâmica do sistema é complexa de ser descrita analiticamente, aplicado à negociação de ações na bolsa de valores, desenvolvendo um sistema cooperativo composto por um agente que representa a força de compra dos ativos, e outro agente a força de venda. Os agentes devem interagir para decidir quanto será comprado ou vendido, de modo a optimizar o lucro obtido, criando o que foi denominado de: “gestor de carteira de investimentos”. Ao término do desenvolvimento foram feitas análises do modelo single-agent e multi-agent, avaliações do impacto da modelagem do ator-crítico utilizando redes recorrentes e propostas de melhoria do projeto desenvolvido. O modelo multi-agent obteve resultados positivos, em sua maioria, sendo superiores ao buy-andhold em mais de 88% no experimento executado com o ativo ITSA4, porém os resultados de forma geral não são suficientes para a construção de um modelo comercial. Ao término do projeto foram propostas melhorias e possíveis trabalhos futuros com o intuito de auxiliar o desenvolvimento da área.Dissertação Uma arquitetura com persistência visual para o rastreamento de objetos no domínio dos robôs móveis autônomos(2018) Ferreira, V. N.Na atualidade, existe uma grande variedade de robôs autônomos utilizados em diversas áreas, seja para cumprir procedimentos de alto risco ou trazer entretenimento. Os robôs interagem com os mais diversos tipos de objetos, e para que essa seja uma boa interação, existe a necessidade de localizá-los no ambiente. Um exemplo é a liga humanoid da RoboCup, uma competição com robôs autônomos que devem jogar futebol. Para realizar tal tarefa, eles precisam ser capazes de localizar diversos objetos, como bola, robôs e landmarks, através de uma câmera. Mesmo realizando seus movimentos, o robô ainda deve ser capaz de manter a localização destes objetos. O objetivo deste trabalho é definir e implementar um sistema de rastreamento de objetos para o robô humanoide da Fundação educacional Inaciana (FEI), considerando os requisitos da competição que a equipe participa. Para isso, foi remodelada a estrutura do sistema de visão, pois o sistema anterior estava defasado e não realizava a detecção de robôs, somente da bola. Utilizando uma arquitetura de threads, a visão passa a detectar simultaneamente múltiplos objetos e transmitir essa informação para o sistema de rastreamento. Este sistema gera um mapa egocêntrico e, utilizando o filtro de Kalman, realiza o rastreamento do objeto neste mapa, sempre levando em consideração os movimentos do robô e do objeto para fazer a predição da posição, velocidade e aceleração deste objeto. Com a implementação deste novo sistema, espera-se ter uma melhora de desempenho quanto à tomada de decisão, pois as informações de todos os objetos sempre estarão disponíveis, e mesmo quando possivelmente ocorrer uma falha na detecção, ainda haverá a predição.Dissertação Uma arquitetura de alocação de tarefas para sistemas multi-robôs utilizando aprendizado por reforço(2011) Gurzoni Junior, José AngeloAgentes operando em domínios multiagentes precisam cooperar e coordenar suas ações, e em alguns casos, competir com adversários ao mesmo tempo. Muitos destes domínios são também dinâmicos, como o futebol de robôs, a exploração submarina, planetária ou os ambientes com presença humana, criando a necessidade de que os agentes sejam capazes de tomar decisões complexas e se adaptar rapidamente a novas condições. Na literatura existem resultados positivos à respeito da aplicação do Aprendizado por Reforço em problemas complexos, em parte porque os agentes que utilizam esta técnica aprendem por experiência, sem a necessidade de modelos do ambiente em que operam. Porém, os requisitos computacionais do Aprendizado por Reforço são ainda restritivos, especialmente em domínios que necessitam de resposta em tempo real. Por outro lado, muitos dos sistemas de alocação de tarefas em multi-robôs encontrados na literatura tem tempos de execução e custo computacional baixos, ideais para estas aplicações. Este trabalho apresenta uma arquitetura de alocação de tarefas em sistemas multi-robôs em que os agentes participam de leilões pelas funções de alto nível disponíveis e utilizam Aprendizado por Reforço para aprender o valor de cada uma destas funções, dada a situação em que a equipe de robôs se encontra. A arquitetura foi aplicada a uma equipe de futebol de robôs da categoria RoboCup Small Size. Foram comparados os desempenhos do mecanismo de alocação de tarefas quando agentes utilizavam valores de seus lances ajustados manualmente, quando os valores eram aprendidos por aprendizado por reforço e também por aprendizado por reforço com heurísticas. Os resultados dos experimentos mostram que,o sistema de alocação de tarefas proposto é capaz de aumentar significativamente o desempenho da equipe, quando comparado com algoritmos em que o comportamento da equipe é pré-programado.Dissertação Avaliação do uso de modelos de aprendizado de máquina estatístico para previsão de diagnóstico para doenças infecciosas(2022) Fragoso, R. A.Nos últimos anos o mundo se deparou com a pandemia do COVID-19 e consequentemente com o avanço de tecnologias e campos de estudo em relação a doenças infecciosas. Com isso, a área de Inteligência Artificial, especificamente dentro da medicina, ganhou mais visibilidade e trouxe avanços e novos estudos, como sobre classificação de pacientes, a partir dos seus dados e exames clínicos, estarem potencialmente infectados pela doença. Isso pode ser explorada para melhorar as tomadas de decisões médicas, principalmente em situações em que os exames específicos para a doença não estejam disponíveis. Neste trabalho, é proposto o desenvolvimento de uma solução de Aprendizado de Máquina que visa realizar essa classificação entre paciente infectados e não infectados. Para isso, foram utilizados para treino e avaliação os dados disponibilizados por instituições de saúde em parceria com a (FAPESP, 2020). O processo de modelagem estatística passa por todas etapas do seu desenvolvimento, tendo o foco na métrica de sensibilidade, dando maior importância nos resultados dos exames para as pessoas que realmente estão infectadas. Os resultados obtidos mostraram que esse campo de estudo tem um potencial promissor e que com a presença de um exame de hemograma completo e outros exames complementares é possível alcançar até 80% de sensibilidade, indicando que a cada 100 pacientes realmente infectados, 80 deles seriam diagnosticados como positivos. Com isto, a medicina pode se beneficiar dessas metodologias para auxiliar no combate em situações de surtos, epidemias ou até outras pandemiasTese Especialização de comunicação e políticas em aprendizado por reforço com múltiplos agentes heterogêneos utilizando redes neurais de grafos(2021) Meneghetti, D. R.Esta tese apresenta uma arquitetura de rede neural voltada ao aprendizado de políticas em sistemas multi-agentes totalmente cooperativos, compostos de agentes heterogêneos e comunicativos. O ambiente é formalizado como um Processo de Decisão de Markov Parcialmente Observável Descentralizado e os estados transformados em grafos direcionados rotulados atribuídos de agentes e entidades. Vértices representam agentes e entidades; os rótulos dos vértices, suas classes, sendo todos os agentes dentro de uma mesma classe considerados homogêneos entre si; arcos direcionados representam a capacidade dos agentes de adquirir informação de outras entidades; e vetores armazenados nos vértices representam as características que descrevem agentes e entidades, ou as observações dos agentes. A topologia de rede neural proposta usa camadas totalmente conectadas para codificar as observações dos agentes; convoluções relacionais em grafos para aprender mecanismos de comunicação específicos para diferentes pares de classes; e diferentes redes neurais treinadas utilizando aprendizado por reforço para modelar as políticas das classes de agentes. A tese apresenta dois métodos. No primeiro, os módulos de codificação e aprendizado de funções valor-ação são modelados como redes neurais distintas para cada classe de entidade e agente, e o treinamento do modelo é feito utilizando uma memória de repetição de transições. O segundo método usa compartilhamento de parâmetros entre as classes de agentes para obter uma rede neural com menos parâmetros, assim como emprega camadas recorrentes e treinamento com amostras de uma memória de repetição de episódios. A comunicação relacional é comparada à comunicação realizada através de mecanismos de atenção e à ausência de comunicação entre os agentes. Também é testada a compatibilidade do método com outras contribuições disponíveis na literatura, como a regularização por relações temporais e o mixing aditivo. Testes realizados no ambiente do StarCraft Multi-Agent Challenge demonstram que o emprego de camadas de convolução relacionais para a especialização da comunicação entre agentes viabiliza desempenho comparável ou superior aos outros métodos em todos os cenários testados, principalmente naqueles com maior número de classes de agentes. Já a combinação da comunicação relacional com o mixing aditivo apresentou, geralmente, os melhores resultadosDissertação Estudo de técnicas de classificação de imagens para controle de qualidade na produção de amortecedores veiculares(2015) Pinto, W. T.Técnicas de visão computacional já são tradicionalmente aplicadas em inspeções para controle de qualidade em processos industriais, existindo diversos métodos já consolidados para reconhecer defeitos em componentes. Porém, uma das principais dificuldades nestes processos está exatamente na padronização do posicionamento destes componentes em relação a uma câmera fixa. esta condição limita ou dificulta bastante a aplicação de visão computacional em linhas de produção em série, onde os componentes estão em movimento e posicionados de forma não padronizada. O objetivo deste trabalho é testar e comparar três sistemas diferentes que utilizam técnicas de visão computacional para detecção e classificação de imagens de amortecedores, classificando automaticamente as peças com ausência da solda de fechamento. Dois destes sistemas foram desenvolvidos e testados no ambiente industrial, usados na entrada da linha de produção, buscando eliminar a necessidade de inspeção humana. Os resultados mostram que é possível a utilização de visão computacional para realizar com sucesso estas inspeções.Dissertação Filtro de partículas aplicado à localização de robôs móveis no domínio da Robocup Humanoide(2017) Almeida, A. C.Para que robôs humanoides possam jogar futebol competitivamente de maneira autônoma é necessário que os robôs conheçam suas posições no campo, essa informação é essencial para o desenvolvimento de estratégias. A posição pode ser estimada a partir do conhecimento de como o robô se move pelo domínio e por observações feitas pelo próprio robô. Mas isso não é uma tarefa trivial. Os movimentos executados pelos robôs são imprecisos, além de problemas não modeláveis que surgem por problemas da parte física do robô. As observações feitas pelo robô são ruidosas, o que impedem que informações precisas de direção e distância sejam obtidas, pois seus poucos sensores estão em constante movimento devido ao balanço necessário para manter o robô em movimento. É comum encontrar trabalhos acadêmicos sobre localização de robôs autônomos para diversos domínios, mas são poucos os trabalhos que lidam com um domínio tão restrito quanto o deste trabalho. Além disso, os trabalhos sobre este domínio apresentam algoritmos e resultados que não são reprodutíveis, devido às diferenças de hardware e software dos robôs utilizados. Assim, este trabalho implementa um sistema de localização, baseado no algoritmo de localização de Monte-Carlo, para que robôs humanoides autônomos sejam capazes de estimar suas posições no domínio. O sistema implementado apresenta um método para estimar o quanto o robô se move ao longo do tempo e métodos diferentes para calcular quanto cada partícula representa a posição do robô real, além de métodos para se recuperar de erros de estimativa, para alterar a quantidade de partículas conforme o necessário e para estimar qual a melhor observação que o robô poderá fazer em instantes futuros. Foram realizados experimentos simulados e em robôs reais que validam os métodos implementados e mostram que os métodos propostos são eficientes para resolver o problema de localização. Por fim, trabalhos futuros incluem verificar o funcionamento do sistema em situação de jogo, além da expansão do sistema para um domínio genérico para observar o funcionamento dos métodos propostos e compará-las à outros métodos do estado da arte.Tese Hipermutação e recombinação em sistemas imunológicos artificiais: um estudo aplicado à otimização multiobjetivo(2016) Destro, R. C.Este trabalho apresenta o MOHAIS (do inglês, Multiobjective Optimization Hybrid Artificial Immune Systems), um framework para desenvolvimento de algoritmos imuno-inspirados que, além dos operadores imunológicos tradicionais, disponibiliza dois operadores híbridos para hipermutação e recombinação. Foram implementados dois algoritmos no MOHAIS: um tradicional, sem a utilização dos operadores híbridos, e outro que utiliza ambos. Os operadores e as duas implementações foram avaliados utilizando-se dezessete problemas de teste padrão em um conjunto de três experimentos e mais de 900 testes, que mostraram o bom desempenho do algoritmo que utilizou os operadores híbridos quando comparado com o tradicional e também com outros algoritmos não imuno-inspirados. O algoritmo com operadores híbridos foi ainda utilizado em um estudo de caso para alocação de equipamentos de autoatendimento bancário. O estudo de caso é particularmente relevante não apenas na otimização multiobjetivo, pela necessidade em conciliar variáveis de custo, ociosidade e disponibilidade nos pontos de atendimento, como também a apresentação de uma modelagem inédita para este tipo de problema. Novamente os resultados mostraram o potencial da abordagem multiobjetivo proposta, por conseguir otimizar os objetivos apresentados e confirmaram o bom desempenho dos operadores híbridos propostos, não apenas pelos resultados apresentados, mas também pela capacidade de adaptação do algoritmo a um problema com muitos objetivos. Finalmente, este trabalho propõe seis pontos de extensão para o MOHAIS e a construção de um trabalho interdisciplinar com a área de administração e finanças para aprofundamento do estudo de caso.Dissertação Método de otimização da alocação de redes virtuais na estrutura física de uma rede substrato utilizando aprendizado por reforço(2021) Moreira, C. L.As tecnologias 5G possibilitaram novas aplicações em uma infraestrutura de computação de borda que visa atender uma demanda heterogênea e distribuída que unifica hardware, rede e software voltados para habilitação digital. Baseada nos requisitos da Indústria 4.0, esta infraestrutura habilitadora introduz o conceito de fatiamento da rede (Network Slicing), um recurso fundamental que transforma a rede de um paradigma estático em um novo paradigma onde as redes são lógicas, utilizando o modelo de compartilhamento de computação em nuvem e névoa, que deve atender às necessidades de acordos de nível de serviço de forma conveniente e otimizada, exigindo um mecanismo de orquestração para a alocação dinâmica de recursos. Entre esses mecanismos, a incorporação de redes virtuais (VNE) e o gerenciamento dinâmico de recursos (DRM) têm mostrado uma maneira de definir onde e como a tecnologia de computação em névoa deve ser usada. Este trabalho propõe um algoritmo de alocação de recursos, o VNE_CRS, que utiliza uma técnica de inteligência artificial chamada aprendizado por reforço para orquestrar múltiplos domínios da infraestrutura de uma rede 5G, beneficiandose de sua característica de considerar todo o problema, fim a fim, utilizando diferentes aspectos do Indice de Qualidade de Serviço 5G (5QIs). Experimentos foram realizados em simulação comparando o VNE_CRS com algoritmos do estado da arte para alocação VNE em ambiente Edge de múltiplos domínios. Os resultados mostraram que o uso de técnicas de aprendizado por reforço para alocação de recursos de VNE apresentou ganhos de desempenho. Ele pode não apenas simplificar a arquitetura VNE, mas também atuar como um sistema de orquestração completo que visa os resultados estratégicos de longo prazoTese Navegação guiada de um agente autônomo por meio de relações projetivas obtidas por múltiplas perspectivas espaciais(2017) Perico, D. H.Navegação é uma habilidade essencial para que agentes móveis possam ser completamente autônomos e capazes de desempenhar tarefas complexas que dependam de diversas competências cognitivas. Contudo, o problema de navegação em agentes que não podem perceber o mundo e não tem modelo de movimento completamente definido foi, até agora, pouco estudado. Uma maneira de tornar possível a navegação de um agente sem estas informações é a utilização da navegação guiada, na qual outros agentes autônomos, dotados de percepção, podem, por meio da união de suas diferentes perspectivas, inferir de forma recursiva a localização e as ações que o agente guiado deve tomar para realizar um trajeto de sua origem até um destino. Devido, ainda, a falta de conhecimento que pode existir sobre as características físicas e sensoriais do agente que será conduzido, um sistema de navegação guiada deve ser capaz de trabalhar com um nível de abstração que possibilite o uso de um modelo genérico de movimento e que transmita instruções de ação em alto nível, permitindo sua interpretação por qualquer tipo de agente autônomo. Esta abstração pode ser alcançada pelo uso de instruções baseadas em preposições espaciais projetivas, como direita, esquerda, frente e atrás. Assim, este trabalho apresenta dois modelos híbridos, qualitativo-probabilístico, para se guiar um agente sem percepção e sem modelo de movimento definido por meio do uso de proposições projetivas. Estes dois modelos utilizam os fundamentos encontrados no Filtro de Partículas, utilizado no contexto de navegação, e a representação qualitativa formalizada por meio da linguagem de restrição para relações de direção relativas StarVars. Os dois métodos propostos foram sistematicamente avaliados por experimentos realizados em um simulador de robôs humanoides e em duas provas de conceito, uma para cada método, realizadas com robôs humanoides reais. Os resultados obtidos demonstraram que os dois modelos de navegação guiada propostos foram bem sucedidos.Dissertação Otimização da locomoção em robôs móveis humanoides utilizando inteligência de enxame(2018) Moraes, F. P.É comum encontrarmos robôs capazes de se locomover utilizando trilhos, esteiras e rodas. Estes meios de locomoção são eficientes para robôs em alguns casos como por exemplo um galpão ou locais com pisos lisos e continuo. Entretanto, em locais com muitos desníveis ou descontinuidades, como por exemplo montanhas, escombros de um prédio ou uma escada, a locomoção utilizando rodas, trilhos ou esteiras se torna prejudicada. Já a locomoção utilizando pernas é capaz de obter um ótimo desempenho em locais com ou sem desníveis e com ou sem continuidade, porém, este tipo de locomoção é mais complexo, o que torna mais desafiador obter uma caminhada eficiente. Esta dissertação propõem o uso de um algoritmo de otimização chamado Particle Swarm Optimization (PSO) para encontrar os valores de parâmetros que gerem um caminhar rápido e estável para um robô móvel humanoide. Estes parâmetros serão utilizados pelo robô humanoide desenvolvido pelo Centro Universitário da FEI para participar de competições de futebol de robôs como a RoboCup, na categoria KidSize da liga humanoide. É abordado neste trabalho as principais variações de PSO, as principais técnicas de geração de caminhada em robôs humanoides, cinemática e arquitetura de controle chamada de Arquitetura em Cruz. Os resultados obtidos neste trabalho demonstraram que o PSO é capaz de melhorar a caminhada do robô humanoide.Dissertação Posicionamento de caminhões autônomos para colheita de cana-de-açúcar: uma abordagem baseada em visão computacional(2020) Fernandes, E. A.Diante da constante evolução tecnológica e consolidação como preponderante agente do Produto Interno Bruto brasileiro, o agronegócio alcançou um espaço importante na sociedade brasileira e tem como relevante protagonista, a cana-de-açúcar, que é grande fonte de energia de renovável, além de ser foco constante de evoluções tecnológicas em seu ciclo produtivo. Esse trabalho tem como finalidade apresentar um sistema para posicionamento de caminhões autônomos no processo de colheita de cana-de-açúcar, conforme linhas de plantio pré-estabelecidas a fim de aumentar a produtividade na colheita de cana-de-açúcar. Pois com a manutenção do caminhão corretamente posicionado na pista traçada anteriormente durante o plantio, não há ocorrência de atropelamento do broto da cana-de-açúcar durante o processo de colheita, mantendo assim broto desta intacto e pronto para próxima brotação e subsequente colheita. Quanto mais vezes puder se fazer colheita sem um novo plantio, ou seja, apenas se valendo do broto remanescente da colheita anterior, maior a produtividade no ciclo desta monocultura. Para este trabalho, após a devida aplicação de técnicas de calibração de câmeras, foi levantado um banco de imagens com mais de 24 horas de filmagens que foram convertidas em um banco com mais de 25 mil imagens referentes ao processo de colheita de cana-de-açúcar durante a manhã, tarde e noite. Foram avaliadas 2 hipóteses para atendimento do objetivo deste trabalho com a aplicação Filtro Sobel, Transformada de Hough e Rede Neural Convolucional MobileNet. A hipótese da Rede Neural artificial MobileNet apresentou melhor resultado ao determinar as linhas de plantio com Precisão de 57,22% e Revocação de 28,84%Dissertação A Profile-Based architecture for traffic forwarding through service function chaining using deep reinforcement learning techniques(2021) Araújo Junior, S. R. deOs sistemas de comunicação, como por exemplo as redes móveis de quinta geração (5G) têm se desenvolvido rapidamente e devido à esta evolução, o uso dos seus recursos tem se tornado mais complexo. Assim, são necessários novos métodos para a concepção das redes e uma das tecnologias para tal é o Encadeamento de Funções de Serviço que permite o tráfego através de Funções de Rede Virtualizadas flexibilizando o uso dos recursos. Entretanto, há alguns desafios para sua implementação, como por exemplo o volume de dados gerados pelas novas aplicações. O Aprendizado por Reforço Profundo tem sido usado para resolver diversos problemas computacionais, inclusive aqueles relacionados às redes de comunicação. Para atingir os objetivos de otimização de recursos são necessários: a identificação e tratamento do tráfego de rede e o seu correto roteamento pelos dispositivos. O objetivo deste trabalho é investigar como as técnicas de Aprendizado por Reforço Profundo combinadas com a arquitetura de Encadeamento de Funções de Serviços podem proporcionar um mecanismo eficiente de identificação e roteamento de tráfego baseado em perfis, auxiliando os dispositivos responsáveis pelo controle da rede a reconhecer comportamentos indesejáveis e tomar as ações necessárias. Para isto, será proposta uma implementação prática para demonstrar como estas técnicas podem ser aplicadas