Extracción de término ındice mediante cascadas de expresiones regulares (original) (raw)

Abstract

El rendimiento de los sistemas de Recuperación de Información se ve limitado por los fenómenos de variación lingüística presentes en los textos. Las técnicas de Procesamiento de Lenguaje Natural a nivel de palabra han mostrado su utilidad para reducir dicha variación. Proponemos en este artículo extender esta aproximación a la variación a nivel de frase; para ello se indexarán las dependencias sintácticas presentes en los documentos, las cuales son obtenidas por medio de un analizador sintáctico. Para reducir en lo posible el coste computacional asociado al proceso de análisis, hemos optado por emplear un analizador sintáctico superficial basado en cascadas de traductores de estado finito. Si bien este artículo se centra en el caso del español, nuestra aproximación es extensible a otros lenguajes adaptando convenientemente la gramática empleada por el analizador. Palabras clave: Análisis sintáctico superficial, traductores de estado finito.

Miguel Angel Alonso Pardo hasn't uploaded this paper.

Let Miguel Angel know you want this paper to be uploaded.

Ask for this paper to be uploaded.