Javascript must be enabled to continue!

Detección de anomalías en texto a partir de modelos de lenguaje natural

La rápida evolución de los modelos de lenguaje natural y la posibilidad de utilizarlos como predictores de palabras y oraciones dentro de su contexto los convierten en herramientas útiles para detectar la presencia de anomalías en términos dentro de un documento. Este estudio propone utilizar BERT como modelo generativo para tareas de detección de anomalías, analizando los tipos de anomalías identificadas tanto en un corpus con lenguaje “estándar” como en uno con errores gramaticales para encontrar las capacidades y limitaciones de la metodología propuesta, así como caracterizar los tipos de anomalías encontradas. La evaluación de 5 modelos no supervisados mostró las particularidades de BERT en el manejo de puntuación, nombres propios y fragmentos de palabras resultando estas en scores particularmente altos, y la complejidad de detectar errores a partir de anomalías dada la estructura secuencial y parafraseada del lenguaje. Finalmente, los resultados de la evaluación en el corpus de aprendizaje REALEC abren la posibilidad de utilizar técnicas de detección de anomalías en conjunto con variables adicionales como base para tareas de corrección de errores gramaticales.

Editorial Pontificia Universidad Javeriana

Catalina Herrera Cancelado

2022

Title: Detección de anomalías en texto a partir de modelos de lenguaje natural

Description:

Este estudio propone utilizar BERT como modelo generativo para tareas de detección de anomalías, analizando los tipos de anomalías identificadas tanto en un corpus con lenguaje “estándar” como en uno con errores gramaticales para encontrar las capacidades y limitaciones de la metodología propuesta, así como caracterizar los tipos de anomalías encontradas.

La evaluación de 5 modelos no supervisados mostró las particularidades de BERT en el manejo de puntuación, nombres propios y fragmentos de palabras resultando estas en scores particularmente altos, y la complejidad de detectar errores a partir de anomalías dada la estructura secuencial y parafraseada del lenguaje.

Finalmente, los resultados de la evaluación en el corpus de aprendizaje REALEC abren la posibilidad de utilizar técnicas de detección de anomalías en conjunto con variables adicionales como base para tareas de corrección de errores gramaticales.

Back

(English) Modern networks support critical applications with increasingly diverse, complex, and dynamic requirements. Ensuring their proper functioning is vital to maintaining the ...

Integration Techniques of Fault Detection and Isolation Using Interval Observers

An interval observer has been illustrated to be a suitable approach to detect and isolate faults affecting complex dynamical industrial systems. Concerning fault detection, interv...

Generación de modelos de procesos y decisiones a partir de documentos de texto

(English) This thesis addresses the importance of formal models for the efficient management of business processes (BPM) and business decision management (BDM) in a constantly evol...

Software para arquitecturas basadas en procesadores de múltiples núcleos

Todos los procesadores disponibles en el mercado (incluso los procesadores utilizados en dispositivos móviles) poseen una arquitectura típica multicore. En consecuencia, el modelo ...

Evaluación morfológica de los vocabularios de subpalabras utilizados por los grandes modelos de lenguaje

Con el auge de los grandes modelos del lenguaje neuronales, especialmente aquellos basados en Transformers, la tradicional segmentación en palabras y morfemas que empleaba reglas l...

Analysis of helio-geo-ionospheric proxies for short-term earthquake forecasting

(English) Earthquakes are among the most destructive natural disasters, causing significant infrastructure damage and casualties. Between 1998 and 2018, seismic events resulted in ...

The Utility of Artificial Intelligence as an Example of Large Language Models in Healthcare Education. Dr. Sergio Grunbaum

En la era digital actual, la inteligencia artificial (IA) ha emergido como una fuerza transformadora en diversos campos, y la educación en salud no es una excepción. En este artícu...

ESTILOS DE APRENDIZAGEM: UMA REVISÃO SISTEMÁTICA DA LITERATURA

Backgroud:O presente trabalho tem por objetivo identificar os principais modelos de Estilos de Aprendizagem e sua abordagem na construção do processo de ensino-aprendizagem. Mat...

Email:
Password:

Email:

Detección de anomalías en texto a partir de modelos de lenguaje natural

Related Results