Automatización del análisis sintáctico para el español con el fin de crear in treebank estandarizado (original) (raw)
Related papers
Desarrollo de un analizador sintáctico estadístico basado en dependencias para el euskera
Procesamiento del lenguaje natural, 2007
Resumen: Este artículo presenta los primeros pasos dados para la obtención de un analizador sintáctico estadístico para el euskera. El sistema se basa en un treebank anotado sintácticamente mediante dependencias y la adaptación del analizador sintáctico determinista de , que mediante un análisis por desplazamiento/reducción y un sistema basado en aprendizaje automático para determinar cuál de 4 opciones debe realizar, obtiene un único análisis sintáctico de la oración. Los resultados obtenidos se encuentran cerca de los obtenidos por sistemas similares. Palabras clave: Análisis sintáctico. Análisis basado en dependencias. Treebank.
Análisis sintáctico de textos automatizados
Lexis
Las páginas que siguen tratan de mostrar empíricamente las enormes ventajas que se siguen del tratamiento computacional de textos lingüísticos para el conocimiento de esos mismos textos y del sistema lingüístico correspondiente. El ordenador realiza cientos de miles de operaciones por segundo. Lo que es la grúa respecto al brazo del hombre, es el ordenador respecto al cerebro: un instrumento potenciador de la capacidad humana, física en el primer caso e intelectual en el segundo. ¿Cómo no acudir a un instrumento tan capacitado, como es el ordenador electrónico, cuando se trata de manejar un gran número de datos, bien porque el corpus sea muy vasto, bien porque, aun siendo pequeño el corpus, sus aspectos de estudio elegtbles sean numerosos? 1 ¿Cómo dudar de que con el ordenador se pueden reunir inventarios mucho más completos y accesibles 2 que los que un cerebro humano sería capaz de hacer y retener-3? Tal vez alguien tenga el siguiente escrúpulo: ¿es posible estudiar la poesía a base de números? La poesía en sí misma no puede ser explicada, ni con números ni sin números. "La poesía se explica sola; si no, no se explica. Todo comentario a una poesía se refiere a elementos circundantes ... " 4 Pero, puesto que "toda poesía se nos presenta en fonna de lenguaje, en construcciones verbalés"5, "nada se opone a priori en el hecho poético mismo a una tentativa de observación y de descripción científica" 6. Si el "alma" de la poesía es inanalizable, su "cuerpo" es susceptible de un estudio tan objetivo como el que se pueda realizar sobre los demás acontecimientos 7
Reordenamiento sintáctico en construcciones analíticas del quechua por el contacto con el castellano
Lingüística 22.187-201, 2009
"This study investigates changes in the order of constituents of analytic verbal constructions in Quechua due to contact with Spanish. Three aspectual periphrases are examined: prospective, inceptive and customary/habitual. Quechuan varieties in which the constituents of complex predicates occur in the reverse order, based on the Spanish pattern, lack the traditional productive environment for the formation of new tense-aspect-modality suffixes. The resulting Quechua morphological system could be characterized as increasingly analytic and less polysynthetic over time. Just as Spanish has influenced Quechua grammar, Quechua also has influenced Spanish grammar. When viewed collectively, these ongoing contact-induced innovations illuminate the gradual process of linguistic convergence."
Esquemas sintácticos en el español estándar europeo contemporáneo
2018
This article summarises an examination of sentence patterns in modern European standard Spanish, in order to give an answer to the following questions: How many different sentence patterns are there and which are the most frequent patterns in modern European Spanish? Based on the principles of verb valency, as established by Lucien Tesnière and further developed by Ulrich Engel and others, a corpus of 500 sentences is analysed, identifying the sentence patterns of the main clauses. The analysis shows 19 different sentence patterns, the most frequent of which is p-s-cd, that is, predicate – subject – direct object. Subsequently, the results are compared to those of a different study on Spanish sentence patterns
Generación automática de analizadores sintácticos a partir de esquemas de análisis
Actas de SEPLN, 2005
Los esquemas de an´alisis sint´actico son un formalismo de definici´on de algoritmos de an´alisis sint´actico que permite abstraer detalles de bajo nivel. En este trabajo, presentamos una t´ecnica de compilaci´on para transformar autom´aticamente un esquema de an´alisis sint´actico en una implementaci´on ejecutable. Concretamente, a partir de un esquema obtendremos el c´odigo Java que implementa el analizador correspondiente, incluyendo t´ecnicas de indexaci´on adaptadas a cada esquema concreto para garantizar eficiencia. La t´ecnica presentada es general, permitiendo trabajar con todo tipo de esquemas para gram´aticas independientes del contexto, e incluye mecanismos de extensibilidad para definir nuevos elementos susceptibles de aparecer en dichos esquemas, al tiempo que es f´acilmente generalizable a otros formalismos gramaticales.