Submissões Recentes

Dissertação
An approach for grouping sentences by semantic similarity using language models and graph theory
(2024) Ramos, João Paulo Oliveira
Revisão da literatura é uma etapa mandatória durante uma pesquisa cientifica. Nesta fase, o pesquisador está constantemente procurando, lendo e filtrando os artigos que são relacionados a seu tópico de pesquisa. Em um cenário em que um número acumulado de artigos encontrados não são de interesse, tempo e energia são gastos sem resultados concretos. Com o crescimento exponencial de informações como noticias, artigos científicos, um campo chamado Sumarização Automática de Texto (SAT) se destaca. Esse campo é uma aplicação da área de Recuperação de Informação (RI), onde um resumo reduzido e compreensivo é extraído ou gerado a partir de um documento. A sumarização manual toma tempo, é custosa e impraticável frente a quantidade de informação textual disponível. O objetivo desse trabalho é criar um modelo semi-supervisionado capaz de criar um resumo compreensivo de um artigo cientifico, agrupando parágrafos em quarto classes: Objetivo, Metodologia, Resultados e Motivação. A metodologia é composta de sete seções, sendo essas: Seção 4.1 que descreve a base de dados utilizada. Seção 4.2 que trata do pre-processamento dos textos utilizados. Seção 4.3 que trata da metodologia utilizada para extrair as palavras chaves dos textos. Seção 4.4 que trata da metodologia utilizada para criar o grafo de palavras que é utilizado pelos modelos. Na Seção 4.5 é apresentada como os parágrafos são distribuídos entre os buckets. Na Seção 4.6 é apresentado como o modelo de N-gramas foi treinado. Na Seção 4.7.3 é apresentado a métrica de Entropia, e como ela é aplicada no técnica de agrupamento dos textos, junto do algoritmo de Dijkstra que é utilizado em um dos modelos de Entropia. Por ultimo é apresentado na Seção 4.8 o modelo de otimização criado para os modelos de entropia. A base de dados utilizada foi gerada pelo crawler criado por Meng et al. (2021) com o objetivo de extrair os artigos do website Emerald (EMERALD. . . , n.d.). Emerald é um publicador de artigos e revistas cientificas, com uma base de dados com mais de 60 mil documentos de diversos campos de estudo. Cada artigo científico dessa plataforma contém um resumo separado em quatro categorias. sendo essas categorias: proposito, método, achados e valores. O proposito descreve o objetivo do artigo, o método a metodologia e tecnologias, achados encontram-se os resultados do trabalho, e valores encontramos as motivações e valores do artigo científico. Nesse trabalho é utilizado uma base de dados reduzida, pois não foi possível obter acesso completo aos dados da plataforma Emerald. Foram utilizados os artigos marcados como Open Access. No total foram utilizados 643 artigos nos experimentos. Os textos foram separados em parágrafos, cada parágrafo sendo uma das categorias citadas anteriormente. A primeira etapa dos preprocessamentos dos dados, é a extração dos parágrafos. Em seguida, é feita lematização e tokenização dos textos. Para selecionar os as palavras chaves que foram utilizadas no segundo modelo de entropia, foi utilizado o algoritmo Summa (BARRIOS et al., 2016). Foram utilizados cinco palavras por categoria de texto. O grafo de palavras foi criado a partir de um grafo bi-direcionado, onde cada nó é uma palavra e as arestas são as quantidades de vezes que uma palavra se conectou com outra palavra. Em seguida foi feita a soma dos pesos das arestas do grafo, gerando um grafo não-direcional apresentado na Figura 2. Com essa contagem de conexões entre as palavras nas arestas, foi feito o calculo da probabilidade conjunta das arestas, gerando o grafo da Figure 4. Em seguida foi feita a transformação das arestas utilizando o logaritmo negativo, para que seja possível utilizar o algoritmo de Dijkstra para encontrar o menor caminho das palavras de um paragrafo, para as palavras chaves que foram definidas anteriormente. Foram criados dois modelos de entropia, um que utiliza apenas a Entropia como métrica de agrupamento dos paragrafos, e outro que utiliza a entropia, o algoritmo de Dijkstra e as palavras chaves para enviesar o agrupamento dos parágrafos. Os modelos são compostos pelo modelo de linguagem N-grama. No total, foram gerados quatro tamanhos diferentes de N-gramas, sendo eles 2-grama, 3-grama, 4-grama e 5-grama. Cada N-grama é chamado de bucket, no total são criados 4 buckets, um para cada categoria de texto. Cada bucket tem como proposito se especializar em um grupo de texto. No caso do modelo que utiliza apenas a Entropia, o agrupamento é aleatório entre os 4 buckets. Já para o modelo que utiliza as palavras chave, cada bucket tem uma categoria de texto pré-definida. O modelo de otimização criado consiste em avaliar se a entropia geral do modelo esta diminuindo ou não. Se a entropia diminuir, o modelo executa a etapa de troca de textos entre os buckets, por outro lado, se entropia se mantiver no mesmo valor, ou for maior, o modelo não executa a troca dos textos entre os buckets. Nessa etapa são selecionados dois buckets aleatoriamente para cada iteração do modelo. Os experimentos são apresentados no Capitulo 5. Onde é avaliado a performance para cada tamanho de n-grama. A curva de otimização dos modelos para avaliar se a entropia. E por final a influencia das palavras chaves com a utilização do algoritmo de Dijkstra no agrupamento dos textos. Por final foram utilizados dois modelos conhecidos na literatura como base de comparação. O modelo K-means, aprestado na Seção 5.4 e o modelo de LSTM (Long short-term memory) apresentado na Seção 5.5. Os resultados desse projeto demonstraram que ambos os modelos de entropia não conseguiram segmentar os textos nas quatro classes previstas, mesmo quando a entropia geral dos modelos estava diminuindo ou da hipótese de que utilizar as palavras chaves e o algoritmo Dijkstra seria melhor para enviesar o agrupamento dos textos. O modelo Kmeans e LSTM também não obtiveram resultados satisfatórios no agrupamento e classificação dos textos. Conclui-se que a entropia não pode ser utilizada como uma métrica de agrupamento de texto quando utilizada junto do modelo de linguagem N-grama. O modelo Kmeans pode ter seus hiper-parâmetros otimizados para uma possível melhora no agrupamento dos textos, o mesmo pode ocorrer para o modelo LSTM, e sua classificação dos grupos de textos.
Tese
O efeito da imagem do endossante na intenção de compra: via mediação da congruência e moderação do produto
(2024) Antunes, D. das G. A.
Esta pesquisa analisa a influência da linguagem da imagem do endossante em anúncios de propaganda de produtos na intenção de compra. Por meio de método experimental, foi realizada a manipulação de uma fotografia do endossante, de uma abordagem com linguagem de retrato para uma linguagem de realidade aumentada, utilizando inteligência artificial MidJourney e o software Photoshop. Uma pesquisa online com 379 respondentes foi feita via a plataforma Survey Monkey. A análise dos dados foi conduzida no software SPSS com Hayes Process Macro Model 7, que incorpora o conceito de mediação-moderada. Os resultados destacam que a relação entre a linguagem do endossante e a intenção de compra é mediada pela congruência entre o produto e o endossante do anúncio de propaganda. Adicionalmente, essa relação é moderada pela natureza tecnológica do produto. Constatamos que o efeito do uso do endossante com linguagem de retrato influencia a intenção de compra de produtos não tecnológicos, enquanto, para os produtos tecnológicos, não há significância estatística quando se utiliza um endossante com linguagem de retrato ou com linguagem de realidade aumentada
Tese
Construindo capacidade de inovação: o papel das subsidiárias multinacionais na remodelação da P&D Global
(2024) Dividino, V. de C.
Este estudo se concentra nas mudanças no poder de inovação global, com as multinacionais (MNC) de economias avançadas apresentando uma tendência para descentralizar a estratégia global de Pesquisa e Desenvolvimento (P&D) e as subsidiárias de economias emergentes a acumularem capacidades de inovação significativas desde o início da década de 2000. Numa análise comparativa de P&D global das MNCs, este trabalho identifica como as subsidiárias dos centros de P&D constroem e evoluem a sua capacidade de inovação e o nível de envolvimento da matriz da MNC nesse processo. Adotamos um método qualitativo, com casos múltiplos. Conduzimos entrevistas aprofundadas com executivos de alto nível de áreas relacionadas à inovação das matrizes e de vários centros de P&D subsidiários ao redor do mundo dos grupos Volkswagen, Stellantis e Hyundai. Comparamos os vários centros de P&D dessas MNCs e analisamos como os fatores organizacionais, as estratégias do grupo e as características do país anfitrião influenciam o processo de construção da capacidade de inovação, assim como no processo de evolução das subsidiárias. As contribuições desse estudo demonstram como as subsidiárias influenciam as capacidades de P&D da MNC, e como os centros de P&D da Volkswagen, Stellantis e Hyundai impactam nas decisões de inovação global das respectivas empresas. O processo de criação de capacidades de inovação evoluiu de uma estratégia centralizada na sede para uma estratégia global descentralizada. A análise também indica que quanto maior o nível de capacidade de inovação do centro de P&D, maior será a sua influência na estratégia de inovação global da MNC. Esta nova dinâmica foi desencadeada entre as operações das MNCs, e essa avaliação detalha como as subsidiárias dos centros de P&D diferem nas dinâmicas e estratégias para alcançar capacidades de inovação
Tese
Modelo preditivo de investimento em distribuição de energia elétrica no contexto da transição energética
(2024) Andrade, F.
A crise climática, provocada pela emissão de gases de efeito estufa, requer atenção urgente e implementação de medidas eficazes para sua mitigação. Dentro deste cenário, a Transição Energética, mudança da matriz energética baseada em combustíveis fósseis para uma com baixa ou zero emissões de carbono, emerge como uma estratégia fundamental para a neutralização dessas emissões. Na conjuntura atual de transição energética, a descarbonização é predominantemente alcançada por meio da geração de energia elétrica de fontes renováveis e da eletrificação de diversas atividades. Nesta perspectiva, os Veículos Elétricos, a Geração Distribuída, o Armazenamento de Energia e a Resposta da Demanda são elementos-chave nesse processo. Diante desse cenário, o setor elétrico, particularmente a distribuição de energia elétrica, detém um papel essencial na habilitação da Transição Energética. O sistema elétrico brasileiro apresenta características que são referências globais e elementos favoráveis ao contexto da Transição Energética, como uma matriz energética predominantemente limpa e um dos maiores sistemas de transmissão interligados e robustos do mundo. Contudo, a distribuição de energia elétrica enfrenta desafios significativos, desde a capacidade de investimento até a qualidade do serviço prestado. Diante do exposto, o objetivo central deste estudo é fazer uma estimativa do investimento requerido na infraestrutura de distribuição para possibilitar o desenvolvimento eficaz da Transição Energética no Brasil. Para tanto, foi conduzida uma Revisão Sistemática de Escopo que proporcionou a fundamentação necessária para a elaboração de um modelo destinado a estimar o investimento exigido na distribuição de energia elétrica no Brasil, com base nas variáveis identificadas na literatura. Através do Método Delphi, o referido modelo foi validado por especialistas no assunto. Posterior à coleta de dados das variáveis associadas, simulações foram executadas e o volume de investimento indicado entre 110 e 130 bilhões de reais, no período de 2022 até 2032, considerando um nível de certeza de 80%. A principal contribuição deste estudo para o conhecimento científico reside na proposição e subsequente validação de um modelo integrado destinado à previsão de investimentos em infraestrutura de distribuição de energia elétrica no âmbito das estratégias voltadas para viabilizar a transição energética
Tese
Cybersecurity na internacionalização digital das empresas
(2024) Belico, A. A.
O objetivo deste estudo foi descrever as capacidades associadas a segurança da informação (SI) que conferem maior proteção digital as empresas do segmento financeiro em processo de internacionalização. Em 2016, o Banco Central de Bangladesh sofreu um ataque que resultou na perda de 81 milhões de dólares através da rede SWIFT, expondo graves vulnerabilidades nos sistemas de pagamento internacionais (SWIFT, 2016). Um caso mais recente ocorreu em 2021, quando o Banco de Brasília (BRB) foi alvo de um ataque de Ransomware, que interrompeu temporariamente suas operações e colocou em risco dados sensíveis de clientes, sublinhando a crescente ameaça do Ransomware para instituições financeiras (BRB, 2021). Esses incidentes evidenciam a necessidade crítica de uma cibersegurança integrada para proteger as operações globais de instituições financeiras. Assim, planejou-se um estudo descritivo e qualitativo com objetivo de explorar as práticas da segurança da informação aplicadas na internacionalização de empresas. A pesquisa estabelece um paralelo entre Cibersegurança e as teorias: visão baseada em recursos (RBV) e Internacionalização de empresas. Foram realizadas onze entrevistas semiestruturadas com especialistas, consultores de segurança da informação, CISO e gestores de centros de operações de segurança no mercado financeiro. As entrevistas foram transcritas e complementadas com observações diretas e análise de documentos para permitir a triangulação dos dados. Os entrevistados foram selecionados com base em sua capacidade, envolvimento e experiência na segurança cibernética empresarial. A ferramenta de avaliação incluiu quinze perguntas, organizadas em cinco dimensões: Capacidades Organizacionais, Gestão de Pessoas, Ativos Físicos, Ferramentas Tecnológicas e Estratégia. Os resultados, agrupados por dimensão, revelam um novo conceito que chamamos de "Capacidade de Cibersegurança na Internacionalização" (CCI), representando as capacidades críticas necessárias para que as empresas se internacionalizem com uma proteção mais robusta