Search engine for discovering works of Art, research articles, and books related to Art and Culture
ShareThis
Javascript must be enabled to continue!

Detección de anomalías en texto a partir de modelos de lenguaje natural

View through CrossRef
La rápida evolución de los modelos de lenguaje natural y la posibilidad de utilizarlos como predictores de palabras y oraciones dentro de su contexto los convierten en herramientas útiles para detectar la presencia de anomalías en términos dentro de un documento. Este estudio propone utilizar BERT como modelo generativo para tareas de detección de anomalías, analizando los tipos de anomalías identificadas tanto en un corpus con lenguaje “estándar” como en uno con errores gramaticales para encontrar las capacidades y limitaciones de la metodología propuesta, así como caracterizar los tipos de anomalías encontradas. La evaluación de 5 modelos no supervisados mostró las particularidades de BERT en el manejo de puntuación, nombres propios y fragmentos de palabras resultando estas en scores particularmente altos, y la complejidad de detectar errores a partir de anomalías dada la estructura secuencial y parafraseada del lenguaje. Finalmente, los resultados de la evaluación en el corpus de aprendizaje REALEC abren la posibilidad de utilizar técnicas de detección de anomalías en conjunto con variables adicionales como base para tareas de corrección de errores gramaticales.
Editorial Pontificia Universidad Javeriana
Title: Detección de anomalías en texto a partir de modelos de lenguaje natural
Description:
La rápida evolución de los modelos de lenguaje natural y la posibilidad de utilizarlos como predictores de palabras y oraciones dentro de su contexto los convierten en herramientas útiles para detectar la presencia de anomalías en términos dentro de un documento.
Este estudio propone utilizar BERT como modelo generativo para tareas de detección de anomalías, analizando los tipos de anomalías identificadas tanto en un corpus con lenguaje “estándar” como en uno con errores gramaticales para encontrar las capacidades y limitaciones de la metodología propuesta, así como caracterizar los tipos de anomalías encontradas.
La evaluación de 5 modelos no supervisados mostró las particularidades de BERT en el manejo de puntuación, nombres propios y fragmentos de palabras resultando estas en scores particularmente altos, y la complejidad de detectar errores a partir de anomalías dada la estructura secuencial y parafraseada del lenguaje.
Finalmente, los resultados de la evaluación en el corpus de aprendizaje REALEC abren la posibilidad de utilizar técnicas de detección de anomalías en conjunto con variables adicionales como base para tareas de corrección de errores gramaticales.

Related Results

Network anomaly detection with graph neural networks
Network anomaly detection with graph neural networks
(English) Modern networks support critical applications with increasingly diverse, complex, and dynamic requirements. Ensuring their proper functioning is vital to maintaining the ...
Integration Techniques of Fault Detection and Isolation Using Interval Observers
Integration Techniques of Fault Detection and Isolation Using Interval Observers
An interval observer has been illustrated to be a suitable approach to detect and isolate faults affecting complex dynamical industrial systems. Concerning fault detection, interv...
Generación de modelos de procesos y decisiones a partir de documentos de texto
Generación de modelos de procesos y decisiones a partir de documentos de texto
(English) This thesis addresses the importance of formal models for the efficient management of business processes (BPM) and business decision management (BDM) in a constantly evol...
Software para arquitecturas basadas en procesadores de múltiples núcleos
Software para arquitecturas basadas en procesadores de múltiples núcleos
Todos los procesadores disponibles en el mercado (incluso los procesadores utilizados en dispositivos móviles) poseen una arquitectura típica multicore. En consecuencia, el modelo ...
Evaluación morfológica de los vocabularios de subpalabras utilizados por los grandes modelos de lenguaje
Evaluación morfológica de los vocabularios de subpalabras utilizados por los grandes modelos de lenguaje
Con el auge de los grandes modelos del lenguaje neuronales, especialmente aquellos basados en Transformers, la tradicional segmentación en palabras y morfemas que empleaba reglas l...
Analysis of helio-geo-ionospheric proxies for short-term earthquake forecasting
Analysis of helio-geo-ionospheric proxies for short-term earthquake forecasting
(English) Earthquakes are among the most destructive natural disasters, causing significant infrastructure damage and casualties. Between 1998 and 2018, seismic events resulted in ...
The Utility of Artificial Intelligence as an Example of Large Language Models in Healthcare Education. Dr. Sergio Grunbaum
The Utility of Artificial Intelligence as an Example of Large Language Models in Healthcare Education. Dr. Sergio Grunbaum
En la era digital actual, la inteligencia artificial (IA) ha emergido como una fuerza transformadora en diversos campos, y la educación en salud no es una excepción. En este artícu...
ESTILOS DE APRENDIZAGEM: UMA REVISÃO SISTEMÁTICA DA LITERATURA
ESTILOS DE APRENDIZAGEM: UMA REVISÃO SISTEMÁTICA DA LITERATURA
Backgroud:O presente trabalho tem por objetivo identificar os principais modelos de Estilos de Aprendizagem  e sua abordagem na construção do processo de ensino-aprendizagem. Mat...

Back to Top