Engenharia Elétrica
URI permanente desta comunidadehttps://repositorio.fei.edu.br/handle/FEI/21
Navegar
32 resultados
Resultados da Pesquisa
Agora exibindo 1 - 10 de 32
- Aprendizado por reforço profundo com redes recorrentes aplicado a negociação do minicontrato futuro de dólar(2023) Kinoshita, J. K.Recentemente há um aumento exponencial no uso de técnicas de aprendizado de máquina no mercado financeiro, principalmente para negociação de ações, na tentativa de prever o seu preço futuro. O objetivo desse projeto é desenvolver um sistema de negociação inteligente para o Minicontrato Futuro de Dólar, baseado no uso de aprendizado por reforço, usando o Deep Recurrent Q learning, um modelo de Redes Neurais Convolucionais combinadas com as Redes Neurais Recorrentes. O treinamento foi baseado em uma base da dados históricos do ativo e o agente realizou três ações: comprar, vender, manter o ativo, sempre visando o máximo retorno financeiro. Os experimentos realizados demonstraram que o sistema proposto teve um desempenho melhor do que as estratégias de Buy and Hold, um modelo baseado na Deep Q Network, um Fundo Cambial e uma estratégia baseada no indicador técnico MACD. Palavras-chave: Aprendizado por Reforço Profundo. Redes Neurais Convolucionais. Redes Neurais Recorrentes. Long Short-Term Network. Deep Recurrent Q Network. Mercado Futuro
Dissertação Uso de redes neurais profundas para previsão de curto prazo do preço da criptomoeda ethereum(2022) Lopes, Eduardo José CostaA criptomoeda se tornou um ativo popular nos mercados financeiros globais, o que significa que não apenas investidores individuais, mas também empresas de gestão de ativos em todo o mundo estão considerando essa nova classe de investimento. A principal contribuição desta pesquisa é abordar um problema univariado de previsão intra-diário com granularidade horária que compara arquiteturas de Redes neurais Artificiais Profundas e com mecanismos de atenção para a moeda intrínseca do Ethereum (ETH). Os resultados obtidos nos ajustes dos modelos e na predição levando-se em consideração séries históricas de dados recentes mostraram que a rede convolucional temporal TCN está contida no grupo de modelos mais acurados e com melhor retorno financeiro, superando outras arquiteturas consideradas em termos de tempo de processamento e o modelo ARIMA considerado como linha de base- Avaliação do uso de modelos de aprendizado de máquina estatístico para previsão de diagnóstico para doenças infecciosas(2022) Fragoso, R. A.Nos últimos anos o mundo se deparou com a pandemia do COVID-19 e consequentemente com o avanço de tecnologias e campos de estudo em relação a doenças infecciosas. Com isso, a área de Inteligência Artificial, especificamente dentro da medicina, ganhou mais visibilidade e trouxe avanços e novos estudos, como sobre classificação de pacientes, a partir dos seus dados e exames clínicos, estarem potencialmente infectados pela doença. Isso pode ser explorada para melhorar as tomadas de decisões médicas, principalmente em situações em que os exames específicos para a doença não estejam disponíveis. Neste trabalho, é proposto o desenvolvimento de uma solução de Aprendizado de Máquina que visa realizar essa classificação entre paciente infectados e não infectados. Para isso, foram utilizados para treino e avaliação os dados disponibilizados por instituições de saúde em parceria com a (FAPESP, 2020). O processo de modelagem estatística passa por todas etapas do seu desenvolvimento, tendo o foco na métrica de sensibilidade, dando maior importância nos resultados dos exames para as pessoas que realmente estão infectadas. Os resultados obtidos mostraram que esse campo de estudo tem um potencial promissor e que com a presença de um exame de hemograma completo e outros exames complementares é possível alcançar até 80% de sensibilidade, indicando que a cada 100 pacientes realmente infectados, 80 deles seriam diagnosticados como positivos. Com isto, a medicina pode se beneficiar dessas metodologias para auxiliar no combate em situações de surtos, epidemias ou até outras pandemias
- A Profile-Based architecture for traffic forwarding through service function chaining using deep reinforcement learning techniques(2021) Araújo Junior, S. R. deOs sistemas de comunicação, como por exemplo as redes móveis de quinta geração (5G) têm se desenvolvido rapidamente e devido à esta evolução, o uso dos seus recursos tem se tornado mais complexo. Assim, são necessários novos métodos para a concepção das redes e uma das tecnologias para tal é o Encadeamento de Funções de Serviço que permite o tráfego através de Funções de Rede Virtualizadas flexibilizando o uso dos recursos. Entretanto, há alguns desafios para sua implementação, como por exemplo o volume de dados gerados pelas novas aplicações. O Aprendizado por Reforço Profundo tem sido usado para resolver diversos problemas computacionais, inclusive aqueles relacionados às redes de comunicação. Para atingir os objetivos de otimização de recursos são necessários: a identificação e tratamento do tráfego de rede e o seu correto roteamento pelos dispositivos. O objetivo deste trabalho é investigar como as técnicas de Aprendizado por Reforço Profundo combinadas com a arquitetura de Encadeamento de Funções de Serviços podem proporcionar um mecanismo eficiente de identificação e roteamento de tráfego baseado em perfis, auxiliando os dispositivos responsáveis pelo controle da rede a reconhecer comportamentos indesejáveis e tomar as ações necessárias. Para isto, será proposta uma implementação prática para demonstrar como estas técnicas podem ser aplicadas
- Especialização de comunicação e políticas em aprendizado por reforço com múltiplos agentes heterogêneos utilizando redes neurais de grafos(2021) Meneghetti, D. R.Esta tese apresenta uma arquitetura de rede neural voltada ao aprendizado de políticas em sistemas multi-agentes totalmente cooperativos, compostos de agentes heterogêneos e comunicativos. O ambiente é formalizado como um Processo de Decisão de Markov Parcialmente Observável Descentralizado e os estados transformados em grafos direcionados rotulados atribuídos de agentes e entidades. Vértices representam agentes e entidades; os rótulos dos vértices, suas classes, sendo todos os agentes dentro de uma mesma classe considerados homogêneos entre si; arcos direcionados representam a capacidade dos agentes de adquirir informação de outras entidades; e vetores armazenados nos vértices representam as características que descrevem agentes e entidades, ou as observações dos agentes. A topologia de rede neural proposta usa camadas totalmente conectadas para codificar as observações dos agentes; convoluções relacionais em grafos para aprender mecanismos de comunicação específicos para diferentes pares de classes; e diferentes redes neurais treinadas utilizando aprendizado por reforço para modelar as políticas das classes de agentes. A tese apresenta dois métodos. No primeiro, os módulos de codificação e aprendizado de funções valor-ação são modelados como redes neurais distintas para cada classe de entidade e agente, e o treinamento do modelo é feito utilizando uma memória de repetição de transições. O segundo método usa compartilhamento de parâmetros entre as classes de agentes para obter uma rede neural com menos parâmetros, assim como emprega camadas recorrentes e treinamento com amostras de uma memória de repetição de episódios. A comunicação relacional é comparada à comunicação realizada através de mecanismos de atenção e à ausência de comunicação entre os agentes. Também é testada a compatibilidade do método com outras contribuições disponíveis na literatura, como a regularização por relações temporais e o mixing aditivo. Testes realizados no ambiente do StarCraft Multi-Agent Challenge demonstram que o emprego de camadas de convolução relacionais para a especialização da comunicação entre agentes viabiliza desempenho comparável ou superior aos outros métodos em todos os cenários testados, principalmente naqueles com maior número de classes de agentes. Já a combinação da comunicação relacional com o mixing aditivo apresentou, geralmente, os melhores resultados
- Método de otimização da alocação de redes virtuais na estrutura física de uma rede substrato utilizando aprendizado por reforço(2021) Moreira, C. L.As tecnologias 5G possibilitaram novas aplicações em uma infraestrutura de computação de borda que visa atender uma demanda heterogênea e distribuída que unifica hardware, rede e software voltados para habilitação digital. Baseada nos requisitos da Indústria 4.0, esta infraestrutura habilitadora introduz o conceito de fatiamento da rede (Network Slicing), um recurso fundamental que transforma a rede de um paradigma estático em um novo paradigma onde as redes são lógicas, utilizando o modelo de compartilhamento de computação em nuvem e névoa, que deve atender às necessidades de acordos de nível de serviço de forma conveniente e otimizada, exigindo um mecanismo de orquestração para a alocação dinâmica de recursos. Entre esses mecanismos, a incorporação de redes virtuais (VNE) e o gerenciamento dinâmico de recursos (DRM) têm mostrado uma maneira de definir onde e como a tecnologia de computação em névoa deve ser usada. Este trabalho propõe um algoritmo de alocação de recursos, o VNE_CRS, que utiliza uma técnica de inteligência artificial chamada aprendizado por reforço para orquestrar múltiplos domínios da infraestrutura de uma rede 5G, beneficiandose de sua característica de considerar todo o problema, fim a fim, utilizando diferentes aspectos do Indice de Qualidade de Serviço 5G (5QIs). Experimentos foram realizados em simulação comparando o VNE_CRS com algoritmos do estado da arte para alocação VNE em ambiente Edge de múltiplos domínios. Os resultados mostraram que o uso de técnicas de aprendizado por reforço para alocação de recursos de VNE apresentou ganhos de desempenho. Ele pode não apenas simplificar a arquitetura VNE, mas também atuar como um sistema de orquestração completo que visa os resultados estratégicos de longo prazo
- Redes neurais artificiais e processamento de linguagem natural aplicados a previsão do minicontrato futuro do índice Ibovespa(2021) Silva, D. E.Estudos científicos recentemente realizados comprovam que existe relação das informações divulgadas nas Redes Sociais com as variações dos preços dos ativos negociados na Bolsa de Valores Brasileira (BOVESPA). Nesses estudos são utilizadas técnicas de Processamento de Linguagem Natural (PLN) para o tratamento de dados textuais que possibilitam a compreensão da linguagem humana pelas máquinas que, enriquecida com as informações históricas dos ativos, geram indicações para tomada de decisão nas negociações da Bolsa. Os relacionamentos entre a Rede Social Twitter e a Bovespa são abordados através do uso de PLN na base de dados da Rede Social com Word Embedding, realizando uma classificação dicotômica para tomadas de decisões, não se atendo para as práticas de maiores retornos com os ganhos das variações dos ativos nos pequenos intervalos entre o dia. A proposta deste trabalho é a criação de um modelo para tomada de decisão no mercado financeiro apoiada nas mensagens relativas à BOVESPA na Rede Social Twitter, tratadas por técnicas de Processamento de Linguagem Natural (PLN). Neste ponto é usado frases completas para vetorização do Word Embedding e classificadas com uma Rede Neural Recorrente (LSTM) para indicar negociações do ativo mini-índice da BOVESPA com atuação regida pela tendência do mercado acrescida da classificação do Word Embedding, agregadas em 5, 15 e 30 minutos, para atuações nos minutos sequências de operações day trade. Os experimentos realizados neste trabalho demonstraram a validade da hipótese de que mensagens de uma rede social podem apoiar decisões no mercado financeiro, permitindo obter lucros neste domínio.
- Aprendizado por reforço profundo multiagente aplicado a negociação de ativos de mercado financeiro(2021) Capati, F. A.O presente trabalho tem como motivação principal o estudo de modelos de aprendizado por reforço multi-agent, comumente utilizados quando o problema é episódico e a dinâmica do sistema é complexa de ser descrita analiticamente, aplicado à negociação de ações na bolsa de valores, desenvolvendo um sistema cooperativo composto por um agente que representa a força de compra dos ativos, e outro agente a força de venda. Os agentes devem interagir para decidir quanto será comprado ou vendido, de modo a optimizar o lucro obtido, criando o que foi denominado de: “gestor de carteira de investimentos”. Ao término do desenvolvimento foram feitas análises do modelo single-agent e multi-agent, avaliações do impacto da modelagem do ator-crítico utilizando redes recorrentes e propostas de melhoria do projeto desenvolvido. O modelo multi-agent obteve resultados positivos, em sua maioria, sendo superiores ao buy-andhold em mais de 88% no experimento executado com o ativo ITSA4, porém os resultados de forma geral não são suficientes para a construção de um modelo comercial. Ao término do projeto foram propostas melhorias e possíveis trabalhos futuros com o intuito de auxiliar o desenvolvimento da área.
- Rede de unidades recorrentes chaveadas e transformadas discretas de ondaletas à previsão e operação no mercado financeiro(2021) Biazon, V.Operar no mercado de ações sempre trás consigo o desafio de escolher a melhor decisão a ser tomada a cada passo no tempo. O problema é intensificado pela teoria de que não é possível prever uma série temporal do mercado financeiro uma vez que toda informação relacionada ao preço da ação já está contida em si, teoria conhecida como Hipótese dos Mercados Eficientes - Efficient Market Hypothesis (EMH). Embora o mercado em geral não tenha tendências distinguíveis, portanto sendo consistente com a EMH, existem várias janelas de tempo onde há alguma previsibilidade de certa extensão nos dados caso consideremos o uso de indicadores técnicos. Neste trabalho é proposto um novo modelo que busca se beneficiar de tais períodos operando para escolher suas decisões e aguardando o melhor momento para executá-las. Este modelo, chamado Rede de Transformada Discreta de Ondaletas e Unidade Recorrente Chaveada - Discrete Wavelet Transform Gated Recurrent Unit Network (DWT-GRU), é dividido em três módulos, sendo eles, o pré processamento dos dados pela transformada de wavelets, o treinamento e a predição do preço de fechamento da ação para dois dias no futuro e a tomada da decisão baseada na avaliação do gradiente do preço de fechamento. O modelo proposto foi comparado com outras arquiteturas de Rede Neural Recorrente - Recurrent Neural Network (RNN), com e sem o uso de pré processamento de ondaletas, e a estratégia de "comprar e segurar". Os resultados mostraram que o modelo proposto superou todos as métricas estatísticas, de acurácia, precisão, revocação e F1, e retorno financeiro de todos os modelos de comparação estabelecidos nas ações analisadas do mercado financeiro brasileiro. As ações analisadas como base para o estudo foram as blue-chips do índice do IBOVESPA sendo elas a PETR4, VALE3, ITUB4, ABEV3, e a Fundo de Índice Negociado em Bolsa - Exchange-Traded Fund (ETF) que espelha o próprio índice, BOVA11. Para dados de treinamento foram utilizados dados desde 2001 para as ações e desde 2008 para a Fundo de Índice Negociado em Bolsa - Exchange-Traded Fund (ETF) BOVA11. Por fim é apresentado o resultado financeiro da aplicação do algoritmo em operações em tempo real de swing-trade comprovando sua eficácia e vencendo a estratégia de "comprar e segurar".
- Redes neurais convolucionais aplicadas à detecção de objetos no domínio de futebol de robôs humanoides(2021) Abreu, Lucas Ribeiro deA RoboCup é uma das maiores iniciativas no ramo de pesquisa em robótica. Essa iniciativa considera o futebol como um dos maiores desafios para robôs e tem o intuito de promover e ganhar um jogo de futebol entre humanos e robôs até o ano de 2050. O módulo de visão dos robôs é um sistema crítico, pois precisa localizar e classificar objetos de interesse ao robô em tempo real, com o objetivo de tomar a melhor ação dado o ambiente a sua volta. Este trabalho avalia redes neurais convolucionais profundas para detecção da bola de futebol e de robôs. Para tal tarefa, cinco arquiteturas da literatura foram escolhidas e treinadas utilizando conceitos de transferência de aprendizado e aumento de dados. Os modelos foram avaliados em um conjunto de dados de teste, gerando resultados promissores em termos de precisão e quadros por segundo. O melhor modelo atingiu um mAP de 0.98 com 50% de interseção a uma taxa de 14.7 quadros por segundo, sendo executado em uma CPU.