Programa de Pós-Graduação de Mestrado e Doutorado em Engenharia Elétrica
URI Permanente desta comunidade
Navegar
Navegando Programa de Pós-Graduação de Mestrado e Doutorado em Engenharia Elétrica por Orientador "Bergamasco, L. C. C."
Agora exibindo 1 - 2 de 2
Resultados por página
Opções de Ordenação
Dissertação Extração de sentenças relevantes de artigos científicos utilizando modelo de linguagem e representação vetorial de palavras(2023) Fossato, LetíciaNas últimas décadas, o rápido avanço tecnológico gerou reflexos diretos na comunidade científica devido ao aumento da quantidade de pesquisas publicadas mensalmente. Visando colaborar com a rotina de estudo dos pesquisadores e diminuir a quantidade de tempo dedicada para a leitura e interpretação de artigos, técnicas para a extração de sentenças relevantes ganharam destaque no ramo de Processamento de Linguagem Natural. Neste sentido, o presente trabalho propõe duas investigações para automatizar a extração de frases representativas de artigos científicos. A primeira, consiste na premissa de extração de frases representativas comparando as sentenças presentes simultaneamente nas seções “Resumo”, “Introdução” e “Conclusão”. A segunda, na criação de um Modelo de Linguagem N-Gramas, treinado a partir das frases selecionadas pela premissa anterior, para aprender e generalizar o comportamento destas sentenças. O estudo incluiu técnicas de pré-processamento, vetorização de palavras (Word2Vec e FastText), similaridade cosseno e Modelo de Linguagem N-Gramas para a obtenção dos resultados. As frases obtidas foram validadas por meio da comparação com a sumarização padrão ouro e metrificadas pelo ROUGE-1. Entre os dois métodos testados, o melhor resultado foi obtido por meio da premissa de frases simultâneas entre as três seções mencionadas, utilizando o algoritmo de vetorização FastText, com 89% de F-Score ROUGE-1. O modelo de linguagem, mesmo com técnicas de suavização aplicadas, não teve dados suficientes para generalizar o comportamento da base de dados, pois 88% do vocabulário dos artigos de teste foi inédito ao modeloDissertação Utilização de uma rede multilayer perceptron para buscasemântica de código-fonte a partir de linguagem natural(2024) Pompolo, Adalberto NassuFerramentas de busca de código-fonte a partir de linguagem natural são cada vez mais importantes no dia a dia de engenheiros e desenvolvedores de software. Atualmente, modelos transformers são o estado da arte em diversas tarefas da área de Natural Language Processing (NLP), como busca de código-fonte a partir de linguagem natural. Porém, tais modelos requerem muito tempo e recursos computacionais para serem treinados em um determinado domínio (fine-tuning). Por outro lado, redes neurais clássicas, como Multilayer perceptron (MLP) por exemplo, necessitam de menos recursos para seu treinamento, porém não obtém os resultados dos modelos transformers. Diante disso, o objetivo do presente trabalho é utilizar uma rede MLP para determinar a similaridade entre dois embeddings, gerados por redes transformers, de dois domínios diferentes: linguagem natural e linguagem de programação. Para tanto, serão utilizados mais de 10000 pares código-fonte/comentário, bem como um conjunto de buscas (queries) e seus resultados esperados; ambos oriundos da base de dados CodeSearchNet. Por fim, a rede obteve bons resultados em determinadas amostras, conseguindo captar informações semânticas do par código-fonte/comentário