Search engine for discovering works of Art, research articles, and books related to Art and Culture
ShareThis
Javascript must be enabled to continue!

Detección de anomalías en texto a partir de modelos de lenguaje natural

View through CrossRef
La rápida evolución de los modelos de lenguaje natural y la posibilidad de utilizarlos como predictores de palabras y oraciones dentro de su contexto los convierten en herramientas útiles para detectar la presencia de anomalías en términos dentro de un documento. Este estudio propone utilizar BERT como modelo generativo para tareas de detección de anomalías, analizando los tipos de anomalías identificadas tanto en un corpus con lenguaje “estándar” como en uno con errores gramaticales para encontrar las capacidades y limitaciones de la metodología propuesta, así como caracterizar los tipos de anomalías encontradas. La evaluación de 5 modelos no supervisados mostró las particularidades de BERT en el manejo de puntuación, nombres propios y fragmentos de palabras resultando estas en scores particularmente altos, y la complejidad de detectar errores a partir de anomalías dada la estructura secuencial y parafraseada del lenguaje. Finalmente, los resultados de la evaluación en el corpus de aprendizaje REALEC abren la posibilidad de utilizar técnicas de detección de anomalías en conjunto con variables adicionales como base para tareas de corrección de errores gramaticales.
Editorial Pontificia Universidad Javeriana
Title: Detección de anomalías en texto a partir de modelos de lenguaje natural
Description:
La rápida evolución de los modelos de lenguaje natural y la posibilidad de utilizarlos como predictores de palabras y oraciones dentro de su contexto los convierten en herramientas útiles para detectar la presencia de anomalías en términos dentro de un documento.
Este estudio propone utilizar BERT como modelo generativo para tareas de detección de anomalías, analizando los tipos de anomalías identificadas tanto en un corpus con lenguaje “estándar” como en uno con errores gramaticales para encontrar las capacidades y limitaciones de la metodología propuesta, así como caracterizar los tipos de anomalías encontradas.
La evaluación de 5 modelos no supervisados mostró las particularidades de BERT en el manejo de puntuación, nombres propios y fragmentos de palabras resultando estas en scores particularmente altos, y la complejidad de detectar errores a partir de anomalías dada la estructura secuencial y parafraseada del lenguaje.
Finalmente, los resultados de la evaluación en el corpus de aprendizaje REALEC abren la posibilidad de utilizar técnicas de detección de anomalías en conjunto con variables adicionales como base para tareas de corrección de errores gramaticales.

Related Results

Integration Techniques of Fault Detection and Isolation Using Interval Observers
Integration Techniques of Fault Detection and Isolation Using Interval Observers
An interval observer has been illustrated to be a suitable approach to detect and isolate faults affecting complex dynamical industrial systems. Concerning fault detection, interv...
Generación de modelos de procesos y decisiones a partir de documentos de texto
Generación de modelos de procesos y decisiones a partir de documentos de texto
(English) This thesis addresses the importance of formal models for the efficient management of business processes (BPM) and business decision management (BDM) in a constantly evol...
The Utility of Artificial Intelligence as an Example of Large Language Models in Healthcare Education. Dr. Sergio Grunbaum
The Utility of Artificial Intelligence as an Example of Large Language Models in Healthcare Education. Dr. Sergio Grunbaum
En la era digital actual, la inteligencia artificial (IA) ha emergido como una fuerza transformadora en diversos campos, y la educación en salud no es una excepción. En este artícu...
Lens-free interferometric microscope for transparent materials
Lens-free interferometric microscope for transparent materials
As health systems fight against epidemics and infectious diseases, new forms of diagnostics need to be developed in order to meet the growing demand for services, often in location...
Levantamento epidemiológico das anomalias congênitas em Minas Gerais entre 2014 e 2018
Levantamento epidemiológico das anomalias congênitas em Minas Gerais entre 2014 e 2018
O objetivo deste estudo foi realizar um levantamento epidemiológico das anomalias congênitas em nascidos vivos em Minas Gerais entre 2014 e 2018. Trata-se de um estudo epidemiológi...
O papel da comunicação na Gestão do Conhecimento: aspectos relevantes e estímulo a novas pesquisas
O papel da comunicação na Gestão do Conhecimento: aspectos relevantes e estímulo a novas pesquisas
ResumoO conhecimento é um importante ativo para as organizações uma vez que é reconhecido pelo atual modelo econômico como essencial para a produtividade e a inovação. As organizaç...
(RE)Ligar a Geografia
(RE)Ligar a Geografia
Passados alguns anos da publicação do livro Geografia Física e Geomorfologia, uma (Re) Leitura, fui estimulada a elaborar uma reedição de textos /artigos publicados desde então, ma...
Sobre el riesgo de confundir el lenguaje cósmico de Kandinsky con el lenguaje divino del obispo Berkeley
Sobre el riesgo de confundir el lenguaje cósmico de Kandinsky con el lenguaje divino del obispo Berkeley
Según Philippe Sers, Wassily Kandinsky y George Berkeley coincidieron al contemplar el mundo como un lenguaje que nos habla de lo espiritual que hay en el fondo del alma humana. Si...

Back to Top