Teses e Dissertações

URI Permanente para esta coleção

Navegar

Submissões Recentes

Agora exibindo 1 - 20 de 58
  • Dissertação
    Utilização de uma rede multilayer perceptron para buscasemântica de código-fonte a partir de linguagem natural
    (2024) Pompolo, Adalberto Nassu
    Ferramentas de busca de código-fonte a partir de linguagem natural são cada vez mais importantes no dia a dia de engenheiros e desenvolvedores de software. Atualmente, modelos transformers são o estado da arte em diversas tarefas da área de Natural Language Processing (NLP), como busca de código-fonte a partir de linguagem natural. Porém, tais modelos requerem muito tempo e recursos computacionais para serem treinados em um determinado domínio (fine-tuning). Por outro lado, redes neurais clássicas, como Multilayer perceptron (MLP) por exemplo, necessitam de menos recursos para seu treinamento, porém não obtém os resultados dos modelos transformers. Diante disso, o objetivo do presente trabalho é utilizar uma rede MLP para determinar a similaridade entre dois embeddings, gerados por redes transformers, de dois domínios diferentes: linguagem natural e linguagem de programação. Para tanto, serão utilizados mais de 10000 pares código-fonte/comentário, bem como um conjunto de buscas (queries) e seus resultados esperados; ambos oriundos da base de dados CodeSearchNet. Por fim, a rede obteve bons resultados em determinadas amostras, conseguindo captar informações semânticas do par código-fonte/comentário
  • Tese
    Modelo de vetorização de torque aplicado a veículos de competição de alto desempenho
    (2023) Serralvo Neto, R.
    Diante de um cenário com constante modificações tecnológicas envolvendo automóveis e veículos automotores em geral, como automóveis de passeio, transporte de carga, veículos de competição dentre outros, grandes desenvolvimentos nos sistemas de propulsão estão sendo impulsionados devido à eletrificação, evolução esta que não havia sido vista nos últimos 100 anos. Nesta linha de plena ascensão dos veículos com propulsão elétrica, diversas tecnologias vêm sendo desenvolvidas, dentre elas a vetorização de torque. Essa técnica consiste em utilizar 4 motores implantados em cada uma das 4 rodas do veículo e fazer esses motores trabalharem de maneira independente. Este estudo visa explorar os métodos de projeto, simulação, teste e modelagem, visando implementar a vetorização de torque. Pretende desenvolver adicionalmente um protótipo de alto desempenho: um veículo de competição do tipo Fórmula SAE, em que o principal objetivo é a performance com o menor consumo de energia. Para o auxílio no desenvolvimento da vetorização de torque, foi incluído um modelamento matemático para prever o desempenho do veículo com tração nas 4 rodas independentes e para poder aprimorá-lo. O objetivo final desse trabalho é entregar um conjunto de métodos, procedimentos e tecnologias, condensadas em uma plataforma de pesquisa que pode ser utilizada para outras aplicações no âmbito universitário
  • Tese
    Cubo analisador paraconsistente com filtro de evidências e análise temporal
    (2023) Côrtes, Hyghor, Miranda
    Informações incertas e inconsistentes estão frequentemente presentes na entrada de qualquer sistema do mundo real que dependa de várias fontes de dados. Informações de grandezas físicas obtidas de rede de sensores, e sua interpretação por agentes artificiais inteligentes, em sistemas de engenharia, estão sujeitas à existência de inconsistências. Isso ocorre pois raciocinar com informações inconsistentes é impossível na lógica clássica, lógica intuicionista ou sistemas similares que respeitam o princípio da explosão e a lei da não-contradição. Uma família de lógicas não clássicas, chamadas de Lógicas Paraconsistentes, formaliza a ideia de que mesmo a partir de premissas inconsistentes, conclusões úteis podem ser tiradas. Neste contexto, a Lógica Paraconsistente com Anotação de Dois Valores (LPA2v), que utiliza um par de evidências favorável e desfavorável como anotações, tem sido particularmente bem-sucedida em aplicações de engenharia (por meio de implementação de algoritmos em sistemas informatizados). Estruturas chamadas Para-Analisadores podem ser construídas com essa lógica que fornece meios adequados para analisar o valor de verdade de uma proposição P sob evidências conflitantes/contraditórias. O trabalho relatado nesta tese estende os Para-Analisadores tradicionais com um filtro de evidências. Este novo modelo pode ser representado como uma estrutura de cubo representando vários reticulados de Para-Analisadores atribuídos à qualidade da evidência, que é atualizada de acordo com as medições realizadas em tempo de execução. A estrutura de análise paraconsistente tridimensional assim definida é chamada Cubo Analisador Paraconsistente com Filtro de Evidências e Análise Temporal (CAPet). Neste trabalho, ainda, conjuntos de CAPet são interligados formando Redes de Cubos Analisadores Paraconsistentes com Filtro de Evidências e Análise Temporal (chamadas de CAPetNETs), com o intuito de resolver problemas práticos complexos de engenharia. Para demonstração de resultados, como exemplo prático de engenharia de aplicação de CAPetNETs, nesta tese foi utilizado um problema de classificação de condições de operação de equipamentos em redes de dados de controle e supervisão de sistema elétrico. Neste contexto, distintas topologias de CAPetNETs foram definidas com o objetivo de identificar diversos tipos de falhas em equipamentos de rede de dados. A consolidação da inferência das CAPetNETs para cada equipamento permitiu uma identificação precisa da condição de operação dos equipamentos. Resultados em sistemas simulados mostram que as redes de CAPets são eficazes para lidar com inconsistências sem banalizar as inferências, além de fornecer uma decisão mais informada (mais fina) sobre classificação de condições de operação de equipamentos da rede de dados do exemplo prático, quando comparado com um Para-Analisador tradicional que não leva em consideração o filtro de evidências
  • Dissertação
    Análise de características de navegação em redes para a detecção de intrusão com base em algoritmos bio-inspirados
    (2023) Frezzato, Miguel
    Com o constante aumento de usuários conectados à Internet, um grande volume de dados tem sido gerado a partir de várias redes. Em vista disso, a segurança cibernética está sendo cada vez mais afetada, havendo grande necessidade de estudos científicos na área. Sistemas de detecção de intrusão (IDS) cada vez mais robustos são constantemente desenvolvidos, visando proteger os dados que são trafegados nas redes. Estes sistemas analisam as características de fluxo de cada dispositivo na rede para identificar uma possível instrusão. Selecionar apenas as características que mais se relacionam com as intrusões influencia diretamente na velocidade da análise, além de auxiliar os classificadores a tomar decisões precisas ao identificar uma intrusão. Por outro lado, o desenvolvimento do aprendizado de máquina e de algoritmos de otimização inspirados na natureza têm impulsionado o avanço de diversas áreas tecnológicas. Assim, o presente trabalho apresenta uma metodologia de análise dessas características utilizando uma combinação de aprendizado de máquina e algoritmos bio-inspirados para detecção eficiente de intrusões na rede. Os resultados experimentais mostram que o método proposto aumenta a acurácia e a taxa de detecção do IDS, além de diminuir a taxa de falsos alarmes. Além disso, o método se mostrou competitivo com os principais trabalhos relacionados do estado da arte com desempenho semelhante ou superiror nas bases de dados NSL-KDD e UNSW-NB15
  • Dissertação
    Uma metodologia baseada em aprendizado de máquina para predição de fases de cirurgias laparoscópicas a partir de vídeos
    (2023) Henrique, Matheus Silva
    As cirurgias minimamente invasivas evoluíram consideravelmente em décadas recentes e ainda podem resultar em complicações graves ao paciente relacionadas à técnica cirúrgica. A laparoscopia é um tipo de procedimento minimamente invasivo, no qual um cirurgião, por meio de imagens geradas em tempo real, movimenta instrumentos cirúrgicos através de pequenas incisões feitas no paciente. Trata-se de um procedimento com diversas fases protocolares, mas também dependente de habilidades de cada cirurgião. O rastreamento, acompanhamento e validação dessas fases é uma estratégia importante para o processo como um todo. Técnicas de Visão Computacional baseadas em aprendizado de máquina ganharam destaque recentemente, particularmente na área médica. O projeto aqui proposto apresenta uma arquitetura baseada em Mask R-CNN, Segment Anything e Long Short-Therm Memory (LSTM), que utiliza imagens capturadas de cirurgia de colecistectomia, um tipo de cirugia laparascópica, para identificar os instrumentos durante o ato, extrair informações destes instrumentos e realizar a predição de qual fase de uma cirurgia está sendo realizada. O projeto visa trazer benefícios, como: o indexamento automático de fases em um banco de dados de cirurgia, o auxílio no estudo do tempo de fases para otimizar agendamentos, e a identificação de problemas na execução de determinadas fases. O trabalho inovador alcançou a acurácia de 81,73% na previsão de fases na base de dados M2CAI, e abre espaço para novas investigações relacionadas ao modo de execução da cirurgia por meio da segmentação e monitoramento dos instrumentos cirúrgicos. Além disso, a identificação de problemas na execução de determinadas fases poderá ser realizada, contribuindo para a melhoria dos procedimentos e, consequentemente, para melhores resultados para os pacientes
  • Dissertação
    Estudo do efeito DIBL em função da temperatura em nanofios transistores SOI MOS de efeito de campo
    (2023) Pizzanelli, Riccardo
    Este trabalho apresenta um estudo comparativo da redução da barreira induzida por dreno, DIBL (Drain Induced Barrier Lowering), para os nanofios transistores SOI MOS de efeito de campo nas estruturas modo inversão e junctionless (sem junção). O principal objetivo deste traba-lho é analisar a variação do DIBL em função da temperatura na faixa entre, 300 K, 400 K, 500 K e 580 K, para diferentes larguras de canal. Para o que o estudo fosse realizado, foram feitas me-didas em amostras de transistores nanofios modo inversão e sem junção, tipo “n”, com compri-mento de canal de L = 40 nm e L = 100 nm, larguras da aleta de silício de 12 nm, 22 nm e 42 nm, altura da aleta de silício de 9 nm e tensões de dreno de VDS = 40 mV e VDS = 900 mV para ambas as estruturas que possuem dimensões idênticas. Para a análise das estruturas e seu comportamento elétrico, foi realizada a extração de parâmetros por meio de medidas experimentais nas respectivas temperaturas mencionadas acima e por meio de simulações numéricas tridimensionais. Com os dados coletados e as medidas realizadas, foi demonstrado que nanofios transistores sem junção apresentam valores menores para o DIBL do que os nanofios modo inversão, assim como, quando analisada a variação do DIBL em relação a temperatura. Comparando o DIBL em nanofios modo inversão e sem junção observa-se uma redução de 36% do efeito em favor dos transistores sem junção para o Wfin = 12 nm, 25% para o Wfin = 22 nm e 34% para o Wfin = 42 nm. Assim, quando os nanofios sem junção e modo inversão são comparados em relação ao efeito DIBL em função da temperatura, a variação sofrida pelo transistor sem junção é menor, o que indica menor depen-dência das características elétricas com a temperatura. A menor dependência com a temperatura do transistor sem junção se dá pela relação que o potencial de Fermi possui com a concentração intrínseca de portadores, concentração de dopantes e a temperatura
  • Tese
    Análise dos acoplamentos térmico e capacitivo de transistores FD SOI de camadas finas e memórias resistivas RERAM
    (2023) Costa, Fernando José da
    Transistores de camadas ultrafinas e memórias resistivas são alguns dos dispositivos na vanguarda das pesquisas. O comportamento térmico é de suma importância em um sistema eletrônico, e ainda há muitas lacunas a respeito dos efeitos térmicos em transistores de última geração, bem como sobre sua atuação em níveis de integração. Também no campo das memórias emergentes, muitas dúvidas permanecem sobre as propriedades de armazenamento de dados em sistemas compostos por memórias denominadas resistivas. Este trabalho tem como objetivo estudar o acoplamento térmico entre múltiplos transistores, assim como a caracterização elétrica de memórias resistivas por meio de simulações numéricas e medidas elétricas experimentais. O estudo demonstrou que em escalas nanométricas de integração há a ocorrência de acoplamentos térmico e capacitivo entre os transistores o que produz degradações nas principais figuras de mérito dos transistores como a tensão de limiar e a inclinação de sublimiar. Porém, a condutância de saída pode ser influenciada de maneira positiva pelo acoplamento térmico sendo modulada de valores negativos para valores positivos de acordo com a proximidade entre os dispositivos. As estruturas em cascata apresentam características elétricas e térmicas superiores a um transistor único de comprimento de canal equivalente. Os espelhos de corrente apresentam um acoplamento térmico que produz uma redução geral da corrente no dispositivo de entrada à medida que os dispositivos estão localizados próximos um do outro, de maneira que o compartilhamento da temperatura no sistema leva os dispositivos a operarem com maior precisão de espelhamento. A caracterização das memórias resistivas pelas medidas da capacitância da estrutura se mostrou promissora para a visualização dos múltiplos estados resistivos. A memória tratada de maneira a incorporar mais vacâncias de oxigênio em seu material dielétrico se mostrou como uma melhor alternativa para se obter maior distribuição de estados resistivos requeridos para o desenvolvimento de sistemas de computação em memórias multiníveis
  • Dissertação
    Uso da transferência de aprendizado na análise de dados de efeitos destrutivos de ions pesados (SEB)
    (2023) Santos, Júlia Tauane
    Este trabalho, aborda a contribuição metodológica do uso da técnica de transferência de aprendizado aplicada a um modelo de rede neural previamente utilizado, a fim de classificar íons sob efeitos radioativos em transistores. A transferência de aprendizado consiste na utilização de um aprendizado de máquina aplicado anteriormente em determinada situação ou problema, transferindo o conhecimento para uma nova classificação de um assunto correlacionado, porém distinto. A sua utilização viabiliza uma maior capacidade de processamento no aprendizado da rede neural e mais rapidez, que se tornam aliados no desenvolvimento de modelos de segmentação de redes neurais convolucionais. O foco desta pesquisa está na utilização do treinamento de uma rede neural para a classificação de efeito de eventos únicos (SEE) com um transistor 3N163, sendo transferido esse aprendizado obtido anteriormente para uma nova classificação dados de efeitos destrutivos de íons pesados (SEB), subclasse do SEE, com um transistor IRLZ34NPbF, portanto, componentes com características físicas diferentes e efeitos correlacionados, porém distintos. A utilização da técnica de transferência de aprendizado no treinamento da rede neural artificial resultou em uma redução aproximada de 67% no tempo de processamento, quando comparada à rede neural DeepConvLSTM treinada sem a transferência de conhecimento prévio. Essa redução no tempo de processamento demonstra a eficiência e o benefício da transferência de aprendizado na aceleração do treinamento do modelo. Além disso, o modelo treinado com a técnica de transferência de aprendizado alcançou uma precisão de 99,07% nos dados treinados ao longo de 100 épocas. Essa alta precisão sugere que o modelo foi capaz de fazer previsões corretas na maioria das instâncias durante o treinamento, evidenciando a capacidade da transferência de aprendizado em melhorar o desempenho e a acurácia do modelo
  • Dissertação
    Extração de sentenças relevantes de artigos científicos utilizando modelo de linguagem e representação vetorial de palavras
    (2023) Fossato, Letícia
    Nas últimas décadas, o rápido avanço tecnológico gerou reflexos diretos na comunidade científica devido ao aumento da quantidade de pesquisas publicadas mensalmente. Visando colaborar com a rotina de estudo dos pesquisadores e diminuir a quantidade de tempo dedicada para a leitura e interpretação de artigos, técnicas para a extração de sentenças relevantes ganharam destaque no ramo de Processamento de Linguagem Natural. Neste sentido, o presente trabalho propõe duas investigações para automatizar a extração de frases representativas de artigos científicos. A primeira, consiste na premissa de extração de frases representativas comparando as sentenças presentes simultaneamente nas seções “Resumo”, “Introdução” e “Conclusão”. A segunda, na criação de um Modelo de Linguagem N-Gramas, treinado a partir das frases selecionadas pela premissa anterior, para aprender e generalizar o comportamento destas sentenças. O estudo incluiu técnicas de pré-processamento, vetorização de palavras (Word2Vec e FastText), similaridade cosseno e Modelo de Linguagem N-Gramas para a obtenção dos resultados. As frases obtidas foram validadas por meio da comparação com a sumarização padrão ouro e metrificadas pelo ROUGE-1. Entre os dois métodos testados, o melhor resultado foi obtido por meio da premissa de frases simultâneas entre as três seções mencionadas, utilizando o algoritmo de vetorização FastText, com 89% de F-Score ROUGE-1. O modelo de linguagem, mesmo com técnicas de suavização aplicadas, não teve dados suficientes para generalizar o comportamento da base de dados, pois 88% do vocabulário dos artigos de teste foi inédito ao modelo
  • Tese
    Análise do olhar humano: estudos experimentais de rastreamento o ocular para explicar padrões visual em tarefas cognitivas
    (2023) Orsi, R. N.
    Na área da engenharia, estudar processos cognitivos significa estudar o cérebro em funcionamento e isso requer o uso de tecnologias específicas para aquisição de sinal dinâmico em um processo que envolve estimulação, percepção e reação comportamental. Neste contexto, é comum encontrar estudos que exploram a análise de imagem com resolução temporal e espacial, como imagem por ressonância magnética funcional (fMRI) e eletroencefalografia (EEG). No entanto, também tem sido cada vez mais comum a utilização de abordagens disruptivas, como o rastreamento dos movimentos oculares para analisar a carga de trabalho mental e a interação entre a mente e os estímulos por meio de análise de padrões visuais durante a aquisição de informação. Nesta tese são apresentados três estudos experimentais guiados por um protocolo padrão para aquisição de sinal visual correspondente a percepção humana de estímulos cognitivos. Mais especificamente, é apresentada uma análise de padrões visuais em tarefas de leitura com estímulos que simulam condições de estresse visual; uma análise da atenção visual durante a avaliação de expressões faciais de dor em neonatos; e uma análise da dilatação pupilar durante a percepção de estímulos emocionais categorizados. Os resultados mostram que é possível classificar automaticamente, e com alta acurácia, os padrões visuais de leitura obtidos por processos de engenharia reversa; que o reconhecimento da dor em neonatos é uma tarefa inata e ocorre em menos de 2 segundos; e que estímulos emocionais negativos podem mobilizar mais recursos de processamento cerebral do que estímulos positivos e neutros. Acredita-se que os relatos descritos nesta tese podem ser aplicados na área clínica para realizar diagnósticos mais precisos acerca de condições de estresse visual e para fundamentar uma abordagem mais distinta e seletiva para análise de expressão facial de recém-nascidos
  • Dissertação
    Aplicação da arquitetura transformer para sumarização de artigoscientíficos
    (2023) Lima, Amanda Maciel de
    O processo de pesquisa científica tem como sua fase inicial a exploração de artigos para o conhecimento do estado da arte do tema a ser investigado. Em virtude do crescimento de dados em artigos científicos e do curso constante da informatização, tornam-se necessários mecanismos que sejam capazes de resumir artigos científicos com a finalidade de melhorar o processo de aquisição de pesquisas e direcionar a pessoa pesquisadora a acessar conteúdos relevantes. Os trabalhos de sumarização de artigos científicos, de modo geral, apresentam métodos de relevância de sentenças e aprendizado de máquina. Nos últimos anos, mecanismos de atenção associados a redes neurais e processamento de linguagem natural vêm sendo propostos para interpretare contextualizar atividades de processamento de linguagens, sendo uma delas a textual. Paralelamente, a arquitetura Transformer sugere uma modelagem de transdução com mecanismos de autoatenção - prescindindo de convoluções e recorrências - é aplicada a diversos campos da Inteligência Articial com resultados considerados promissores. Este trabalho propôs empregar o modelo pré-treinado Longformer para a atividade de sumarização de artigos científicos da base de dados SciSummNet através de etapas de pré-processamento, fine-tuning e geração dos resumos. Os resultados obtidos indicaram melhoria de 20,8% para ROUGE-2 recall e 22,69% para ROUGE-2 F-Measure em relação ao trabalho original da base SciSummNet através do modelo ComAbstract
  • Dissertação
    Redes Complexas aplicadas à otimização de portfólio de ações
    (2023) Varga, Felipe Souza
    A compreensão dos mercados financeiros é algo que desperta grande interesse nas pessoas. Eles foram estudados por diferentes áreas do conhecimento, tais como: economia, matemática e física. Apesar deste interesse, apenas recentemente que estes mercados vêm sendo estudados pela perspectiva de Redes Complexas. Assim, este trabalho modela e estuda o mercado financeiro brasileiro pela perspectiva dessas redes. O mercado brasileiro foi escolhido como objeto de estudo, pois o foco da literatura identificada é direcionado aos mercados financeiros de países desenvolvidos ou aqueles cujas economias são muito fortes no contexto internacional. As redes são construídas com base no coeficiente de correlação calculado para todos pares de Ações do mercado. Estas correlações são obtidas a partir dos retornos logarítmicos diários das Ações divididos em janelas de tempo. As redes construídas formam redes completas, entretanto, para análise de suas estruturas, é necessário filtrar as informações da rede. Com esse fim, são geradas Minimum Spanning Tree (MST) das redes. Então, é realizada a extração e o estudo das propriedades físicas destas árvores. Desta forma, será possível estudar as dinâmicas das redes de mercado financeiro ao longo do tempo. Parte desse estudo será focado em compreender a reação destas propriedades a crises financeiras. Uma vez que estas propriedades foram compreendidas, elas são utilizadas para realização da seleção de portfólios de Ações. Para isso, são selecionadas Ações com menor centralidade da rede, uma vez que são tais Ações que costumam gerar maior diversificação para o portfólio. Essa ideia corrobora com a teoria moderna de portfólio de Markowitz, na qual é descrito que a otimização de portfólios é dependente do grau de diversificação de seus ativos. Os portfólios gerados foram avaliados e comparados a portfólios de referência, tais como: Portfólio de Markowitz, Portfólio Igualmente Ponderado e Índice Ibovespa
  • Dissertação
    Estudo da variação pupilar durante a leitura de textos da língua portuguesa com distorções visuais simuladas artificialmente
    (2023) Romera, João Vitor Macedo
    Ações simples como ler um livro requer múltiplos processos cognitivos, que vão desde o movimento dos olhos e reconhecimento das letras até a compreensão da mensagem em si. Entretanto, essa tarefa pode não ser tão simples assim para alguns indivíduos, pois estudos mostram que a aquisição do conhecimento pode ser comprometida devido a déficits sensoriais que dificultam a emissão das informações pelas vias aferentes, causando distorções na informação visual, como é o caso da Síndrome de Meares-Irlen (SMI). Este trabalho investiga os padrões de variação do diâmetro da pupila e mapas de atenção visual durante a leitura de textos com base nos efeitos visuais artificialmente simulados da SMI usando informações de rastreamento ocular para estimar a carga de trabalho mental necessária. Os resultados indicam que há um aumento da carga mental nos momentos em que os textos mostrados apresentam maior intensidade de distorção visual, revelando experimentalmente a dificuldade implícita nesse contexto de leitura, além de mostrar, por meio de técnicas estatísticas multivariadas, que o olhar e o esforço cognitivo apresentam padrões diferentes, quando a informação visual está prejudicada
  • Dissertação
    Redes neurais convolucionais para avaliação de dor neonatal em imagens de face: uma análise quantitativa e qualitativa
    (2023) Coutrin, Gabriel de Almeida Sá
    A experiência da dor, quando intensa ou repetitiva, pode prejudicar o desenvolvimento de recém-nascidos. Estima-se que, durante o período de internação de um recém-nascido em unidade de terapia intensiva neonatal, ocorram mais de 500 intervenções dolorosas, com eventual uso de analgesia, a qual também pode impactar o desenvolvimento da criança. Diante da incapacidade do neonato verbalizar sua dor, realizam-se estudos, procedimentos e tratamentos para identificação da presença de dor por meio da análise comportamental, principalmente pela mímica facial. No entanto, a aplicação clínica destas propostas para o reconhecimento da dor está sujeita às variações entre profissionais da saúde. Neste contexto, faz-se importante o desenvolvimento de soluções computacionais para a avaliação da dor neonatal com menor subjetividade. Na última década, Redes Neurais Convolucionais (CNNs) ganharam popularidade devido às diversas aplicações de sucesso em tarefas de reconhecimento de imagens. Portanto, o presente trabalho tem como objetivo investigar a aplicação de diferentes modelos de CNN para a classificação automática da dor neonatal a partir de imagens de face. Especificamente, foram implementados modelos das arquiteturas VGG-16, ResNet50, SENet50 e Inception-V3, utilizando o aprendizado por transferência, e da arquitetura N-CNN (Neonatal Convolutional Neural Network), o qual não foi previamente treinado. Duas bases de dados distintas foram utilizadas: iCOPE e UNIFESP. Em uma comparação experimental baseada não somente em resultados quantitativos (métricas de desempenho de classificação), mas também em uma análise qualitativa por meio de métodos de Inteligência Artificial Explicável, foi evidenciada a superioridade dos modelos pré-treinados com imagens de face, destacando as diferenças mais relevantes no tocante à interpretação das informações extraídas por cada modelo, bem como a necessidade de um maior conjunto de dados, um fator limitante para a aplicação de redes neurais neste problema
  • Dissertação
    Human vs machine towards neonatal pain assessment: a comparison of the facial features extracted by adults and convolutional neural networks
    (2023) Carlini, Lucas Carlini
    One of the most important challenges of the scientific community is to mitigate the several consequences for neonates due to pain exposure. This challenge is mainly justified by the fact that neonates are not able to verbally communicate pain, hindering the correct identification of the presence and intensity of this phenomenon. In this context, several clinical scales have been proposed to assess pain, using, among other parameters, the facial features of the neonate. However, a better comprehension of these features is yet required, since some recent results have shown the subjectivity of these scales. Meanwhile, computational frameworks have been implemented to automate neonatal pain assessment. Despite their impressive performances, these frameworks still lack to understand the corresponding decision-making processes. Therefore, we propose to investigate in this dissertation the facial features related to the human and machine neonatal pain assessments, comparing the visual perceived regions by health-professionals experts and parents of neonates with the most relevant ones extracted by eXplainable Artificial Intelligence (XAI) methods using two classification models: (i) VGG-Face, trained originally in facial recognition, and (ii) N-CNN, implemented and trained end-to-end for neonatal pain assessment. Our findings show that the regions used by the classification models are clinically relevant to neonatal pain assessment, yet do not agree with the facial perception of healthprofessionals and parents. Consequently, these differences suggest that humans and machines can learn with each other in order to improve their current decision-making process of identifying the discriminant information related to neonatal pain. Additionally, we observed that, using the same classification model, the XAI methods implemented here yield distinct relevant facial features to the same input image. These results raise concerns about the effective use and interpretation of XAI methods, and, more importantly, what regions of the image are truly relevant to the decision-making process of the classification model. Nevertheless, our findings advance the current knowledge on how humans and machines code and decode the neonatal facial response to pain. We believe that these findings might enable further improvements in clinical scales and computation tools widely used in real situations, whether based on human or machine decision-making process
  • Dissertação
    Análise de ruídos automotivos por parâmetros psicoacústicos
    (2022) Sartori, Renato Parede
    Os ruídos parasitas em veículos novos/seminovos possuem um grande impacto na satisfação dos clientes brasileiros. A indústria automobilística já detectou esta particularidade de nosso mercado em que a presença destes ruídos é diretamente relacionada a qualidade/robustez dos produtos. Devida a esta importância as empresas vêm ampliando o investimento na detecção e caracterização nessa área, embora grande parte ainda usam o método tradicional através de rodagens com especialistas tanto na fase de projetos quanto durante a produção em massa ao longo do ciclo de vida do veículo. O presente estudo consiste em desenvolver uma metodologia para investigar a relação de parâmetros da psicoacústica com a irritabilidade dos clientes. A primeira etapa deste desenvolvimento foi a aquisição dos sinais realizada diretamente sobre veículos nas pistas de teste do grupo Peugeot Citroën na cidade de Porto Real e da Fiat na cidade de Betim. Esta atividade consistiu na gravação de dez sinais sonoros dentre as interfaces que mais provocam insatisfação/irritação dos clientes. Posteriormente esses sinais foram utilizados em duas análises exploratórias, subjetiva e objetiva. A análise subjetiva foi realizada com a participação de 52 colaboradores sem conhecimentos específicos sobre o tema. Todo o controle acústico, térmico, assim como distância entre os voluntários e o equipamento de reprodução foram baseados em estudos científicos afins. A avaliação dos áudios pelo júri foi conduzida através de uma reprodução auto-guiada permitindo que cada participante escolhesse a sequência de áudio. A avaliação seguiu a escala métrica de subjetividade da SAE(Society of Automotive Engineers). Por sua vez a análise objetiva consistiu em extrair dos sinais de áudio os parâmetros da psicoacústica como Loudness, Roughness, Sharpness e Fluctuation Strenght. Nessa etapa utilizou-se o software TestLAB para a extração dos parâmetros. A análise de dados consistiu inicialmente no cruzamento dos dados obtidos do júri através da audição com as notas fornecidas pelos especialistas do setor para cada um dos ruídos gravados. Como desenvolvimento final, um classificador sobre o impacto de cada ruído na satisfação dos clientes, usando o algoritmo de inteligência artificial ID3(Iterative Dichotomiser 3) foi implementado com o objetivo de reduzir a subjetividade quando comparado aos sistemas tradicionais empregados atualmente no setor automobilístico. Os experimentos exploratórios desta dissertação indicam que há correlação entre as métricas psicoacústicas com o nível de irritabilidade provocado pelos sinais assim como uma regra geral de classificação dos tipos de ruídos automotivos considerados
  • Dissertação
    Predição do mercado financeiro com uma arquitetura de extração de contexto baseada em decomposição de series temporais
    (2022) Oliveira, Guilherme Albertini de
    O mercadodeaçõesdoBrasilseencontraemumagrandealta.Duranteapandemiada COVID-19,abolsabrasileirateveumcrescimentonaquantidadedepessoasfísicasde92,1% entreosanos2019e2020.Estefatosedeveadiversosfatores,dosquaisosprincipaisestão:a disseminação domercadodeaçõesviaredessociais,propagandasemcomunidadesdevídeose a baixadataxadejurosdopaísnesteperíodo.Destemodo,comaaltadenegociadoresnabolsa, a buscaporalgoritmosquereduzemorisconasoperaçõesdeativos,visandomaximizarolucro obtido nacompraevendadepapeis,tambémcresce.Muitostrabalhossugeremautilizaçãode métodosde machinelearning paraaprediçãodevaloresnabolsa.Contudo,obterresultados assertivoscomaaltavolatilidade,enão-linearidadedassériestemporaisdabolsa,aindaéum desafio. Sendoassim,estetrabalhopropõeumanovametodologiaparamodelarmatematica- mente osdadosfinanceirosdabolsadevalores,utilizandoredesneuraisrecorrentes,técnicas de decomposiçãodesériestemporais,correlaçãoentrebolsaseativosearquiteturasdeextração de contextos.Comaarquiteturapropostatambémfoipossívelfazeraprediçãodepontosde reversãodequedaparaaltaoudealtaparabaixa,dosvaloresdeumadeterminadaação.Como resultado,osmelhoresalgoritmosparaaregressãoforamosquefizeramautilizaçãoderedes Long Short-TermMemory (LSTM)e DiscreteWaveletTransform (DWT),comesemutilização de extraçãodecontextos,amboscom0.9de RootMeanSquaredError (RMSE). Porém,estes algoritmossão,emmédia,38%melhorquandotreinadosomentenabolsabrasileira.Paraaclas- sificação osmelhoresalgoritmosforamosquefizeramautilizaçãodeLSTMjuntamentecom DWT,e EchoStateNetwork (ESN) comDWT,com35%e34.6%de f1-score, respectivamente. Porfim,foipossívelobservarque,emgeral,ametodologiapropostatemmelhoresresultadosem relaçãoàsmétricasestatísticas,quandocomparadocomalgoritmostradicionaisquenãofazem o usodatécnicadeextraçãodecontextoparasériestemporais
  • Dissertação
    Análise visual de padrões de leitura em textos da língua portuguesa por meio de rastreamento ocular
    (2022) Requena, F. C. G.
    A leitura é uma atividade complexa. Leitores engajados prestam atenção quando leem, concentram-se no significado do texto e aprendem com o próprio texto. No entanto, tal engajamento não se apresenta explicitamente, mas como melhores resultados de acertos em exames afins como o Programa de Avaliação Internacional de Estudantes (PISA). Neste contexto, o objetivo desta dissertação de mestrado é explorar as semelhanças e diferenças nos padrões de movimento ocular, durante tarefas de leitura, entre voluntários proficientes tendo como base o PISA. A metodologia proposta consiste em uma análise detalhada de atividades e estratégias visuais de leitura usando um equipamento de rastreamento ocular. O experimento contou com a participação de 36 voluntários entre estudantes e funcionários de uma instituição acadêmica, e foi composto por 6 questões de múltipla escolha e 4 textos, todos retirados do PISA. A análise dos mapas de atenção visual gerados através do experimento permitiu identificar entre os participantes considerados como mais qualificados que as fixações do olhar ocorreram de forma mais concentrada nas áreas de resposta definidas. Em contraste, entre os menos qualificados, as fixações ocorreram de forma mais desorganizada, esparsa, principalmente em textos não contínuos que contêm imagens. Tais resultados indicam que o engajamento observado é evidente para os mais qualificados e os menos qualificados tendem a falhar nesse aspecto, revelando aqui nesta dissertação uma metodologia promissora para compreender melhor as possíveis dificuldades de alunos em nível escolar nesta atividade cognitiva complexa
  • Tese
    Um novo biomarcador para auxiliar na interpretação dos exames de espirometria através da aplicação da inteligência artificial e das funções das wavelets
    (2022) Piva, Rodrigo Galluzzi Garcia
    Nas últimas décadas, o volume de informações armazenadas digitalmente cresce em taxas expressivas. Soluções tradicionais relacionadas ao tratamento de séries temporais e inteligência artificial são amplamente aplicadas no contexto na extração de informação deste tipo de dado. Um dos sistemas mais robustos e de baixo custo para a aquisição de sinais de função pulmonar, são os espirometros. O processamento dos sinais de espirometria, através de inteligência artificial, utilizando um conjunto de wavelets para uma análise espacial e temporal da capacidade pulmonar, apresenta uma alternativa para classificação e ordenação de um conjunto de exames. Neste trabalho é proposto uma metodologia para classificar e representar uma relação entre exames de espirometria juntamente com conjuntos de exames posteriormente realizados para diferentes grupos de voluntários. Também é interessante mencionar que um novo marcador em exames de espirometria é de grande importância, visto que na nossa pesquisa bibliográfica poucos trabalhos foram encontrados utilizando um modelo matemático mais robusto na busca por novos marcadores e, procurando ter uma maior eficiência, utilizando-se modelos matemáticos e séries temporais, além da aplicação desses resultados em uma estrutura de armazenamento de dados de forma que possam ser estudadas no futuro, com a análise das wavelets que também são utilizadas por diversos pesquisadores como uma alternativa da série de fourier clássica, auxilia neste caso o médico pneumologista a ter um diagnóstico mais confiável e preciso. Assim, para a inteligência artificial ter sucesso, precisamos da inteligência e de um artefato, e o computador tem sido o artefato preferido. Este trabalho aplica métodos matemáticos em sistemas multiváriáveis, e através da análise estatística em conjunto com a inteligencia artificial, produz artefatos de forma a caracterizar exames de prova de função pulmonar em três níveis, classificando os pacientes em normal, obstrutivo ou restritivo. Oresultado final é um sistema computacional que demonstra graficamente os valores encontrados de um banco de dados, comparando-os com o resultado do exame obtido a ser analisado no momento. Através desse conjunto de ferramentas, utilizou-se um banco de dados, gentilmente cedido pela Dra. Silvia Rodrigues, proporcionando realizar o treinamento do modelo e, utilizando ferramentas de I.A., extraindo a covariância dos coeficientes produzidos pelas wavelets, possibilitando a classificação em três grupos distintos (clustering), e através da regressão de Ridge, criar parâmetros como o índice de precisão de uma nova amostra analisada
  • Dissertação
    Sumarização abstrativa de texto por meio do modelo teórico computacional cognitivo lida
    (2022) Santos, Mariana Bastos
    Os modelos de sumarização automática de texto surgiram na metade do século XX e por muito tempo foram desenvolvidos de maneira extrativa. Os modelos extrativos de sumarização de texto utilizam partes do texto original para construir o resumo (CELIKYILMAZ et al., 2018), gerando muitas vezes problemas de coerência e coesão quando as diferentes partes são lidas juntas.Em contrapartida, na última década, a abordagem abstrativa vem sendo bastante explorada,e diferentemente da extrativa, gera novas palavras que possivelmente não se encontram no textooriginal para construir o resumo (CELIKYILMAZ et al., 2018). Essa abordagem pode corrigir oproblema de coerência e coesão, dado que se aproxima muito do modo como são construídos os resumos por humanos (SEE; LIU; MANNING, 2017). Porém, a sumarização abstrativa ainda enfrenta alguns problemas na geração do resumo, mesmo apresentando resultados satisfatórios em métricas automáticas de validação. Além disso, quando avaliados por humanos os resumos expõem problemas, como redundância, na dinâmica de leitura que ainda não é fluída. Por outro lado, há décadas são propostos modelos teóricos computacionais cognitivos que se baseiam nas teorias da psicologia e neurociência sobre a consciência, e que permitem a adaptação para diferentes aplicações, tendo ainda, como um dos modelos mais conhecidos, o LIDA (FRANKLIN et al., 2016). O presente trabalho propõe um modelo de sumarização abstrativa de texto baseado na estrutura teórica do LIDA utilizando técnicas já aplicadas para essa abordagem, tais como: Sequence-to-Sequence (Seq2Seq) (SUTSKEVER; VINYALS; LE, 2014), Word2vec (MIKOLOV et al., 2013a), Long Short-Term Memory (LSTM) (HOCHREITER; SCHMIDHUBER, 1997) e Mecanismo de Atenção (BAHDANAU; CHO; BENGIO, 2014). Os resultados mostraram a importância dos módulos do LIDA na composição do modelo proposto, reforçando a importância dos módulos: Memória Perceptiva Associativa, Codeletes de Atenção e Espaço de Trabalho Global. Além disso, o trabalho ressaltou a fragilidade da métrica ROUGE na avaliação dos resumos gerados quanto a coerência e coesão. E por fim, a técnica de redução de dimensão utilizada no word embedding, se mostrou ineficaz para a tarefa