Reconocimiento y clasificación de entidades nombradas en textos legales en español (original) (raw)

Procesamiento Del Lenguaje Natural, 2021

Abstract

El reconocimiento y la clasificacion de las entidades nombradas (NER/NERC) es una tarea principal en las areas del Procesamiento del Lenguaje Natural (PLN) y la Extraccion de la Informacion. El papel de NERC en el dominio legal es imprescindible en el desarrollo de sistemas legales inteligentes. El presente trabajo pretende dar un primer paso hacia establecer un "baseline" para la tarea NERC en el espanol juridico. El objetivo principal consiste en proporcionar un recurso linguistico anotando cinco tipos basicos de entidades nombradas en los textos legislativos en espanol peninsular. Los cinco tipos de entidades nombradas son: Personas, Organizaciones, Lugares, Fechas absolutas y Referencias a leyes, decretos, ordenes, normativas y articulos. Se adopta una metodologia hibrida que reune tres tecnicas principales: Patrones de expresiones regulares, listas de fuentes externas y el entrenamiento de tres modelos NERC utilizando la libreria abierta spaCy v3. De los tres modelos ...

Doaa Samy hasn't uploaded this paper.

Let Doaa know you want this paper to be uploaded.

Ask for this paper to be uploaded.