El Sesgo Lingüístico Digital (SLD) en la inteligencia artificial: implicaciones para los modelos de lenguaje masivos en español / The Digital Linguistic Bias (DLB) in Artificial Intelligence: Implications for Large Language Models in Spanish (original) (raw)

El entendimiento lingüístico en la Inteligencia Artificial: Una relación ambivalente con Descartes (Linguistic understanding in AI: an ambivalent relation with Descartes)

Abstract This article deals with the manner in which the AI researchers have taken a Cartesian challenge: the impossibility to create machines which, via linguistic understanding, evince thought. Such a challenge, which is part of the metaphysical Cartesian philosophy, distinguishes between res cogitans and res extensa. It is impossible for the latter to have thought. Language, then, provides evidence of the impossibility of machine intelligence. As I analyze, by facing the Cartesian challenge, those researchers have supposed to be true part of Descartes’ theory, namely, that the flexible use of language entails thought. For this reason I consider that the relation between AI and Descartes is ambivalent: on the one hand, AI researchers reject that machine intelligence is impossible in principle; on the other hand, they agree with Descartes in relation to the importance of language when it comes to providing evidence of thought. Even though the ambivalent character of AI and Descartes seems anecdotic, it is not. The fact that some people still regard the Turing Test as an adequate evaluation of intelligence verifies the complex relation between AI and the French philosopher.

La lingüística en el contexto de la inteligencia artificial

En el presente artículo se reseñan algunos conceptos fundamentales sobre Inteligencia Artificial que sirven de base para reconocer la identidad y las proyecciones de la lingüística en el área de la informática, en consonancia con las exigencias de la tecnología moderna. Se destacan la posibilidad e importancia del procesamiento automático del lenguaje natural y el sentido que para ello tienen los conocimientos pragmáticos, Por último, se reseñan algunas ideas sobre las llamadas industrias de la lengua.

DiSeg: Un segmentador discursivo automático para el español

2010

Hoy en día el análisis discursivo automático es un tema de investigación relevante. Sin embargo, no existen analizadores del discurso para textos en español. El primer paso para desarrollar esta herramienta es la segmentación discursiva. En este artículo presentamos DiSeg, el primer segmentador discursivo para el español que utiliza el marco de la Rhetorical Structure Theory (Mann y Thompson, 1988) y se basa en reglas léxicas y sintácticas. Describimos el sistema y evaluamos sus resultados con un corpus gold standard, obteniendo resultados prometedores.

(2024): Lingüística e inteligencia artificial. El corpus de La Pola Siero

Facts and opinions published in this book express solely the opinions of the respective authors. Authors are responsible for their citing of sources and the accuracy of their references and bibliographies. The editor, series editor or the publisher cannot be held responsible for any lacks or possible violations of third parties' rights.

Lematizador morfosintáctico y semántico robusto con flexionador y estimador idiomático, usando algoritmos eficientes y compactos para idiomas muy ricos en formas como el español

2006

We present a word recognition and generation system for multilingual natural language processing, intended for human-machine interface. Presenting robust, low memory footprint and efficient algorithms, it is capable of: language identification, linguistic word-tagging, semantic extraction, automatic error recognition and correction with morphologic and sound-like estimation capability. It uses simple rules to express sophisticated and reversible morphological changes. Tolerates, detects and corrects spelling errors, primarily intended for text generated by automatic natural speech and writing recognition; constrained inputs like mobile phone keyboards or PDA's, chat and/or e-mails. Useful for interactive text correction & assistance in word processing, it yields a low memory footprint and high processing speed, being adequate for personal computers, portables, palms, mobiles & embedded solutions. For spanish, it needs 200Kb for 50k lemmas and 4500 rules, equivalent to 1.2M exact words and >300M guessable. Capable of morphological and sound-like inference, in a similar way as a natural language human hearer would perform. As flexion generator, it has added semantic expression capability.

El español es un caos: apuntes sobre las implicaciones de los sistemas complejos para el aprendizaje de L2 más allá de las redes lingüísticas Spanish is a chaos: Notes on the implications of complex systems for L2 learning beyond language networks

Revista Nebrija de Lingüística Aplicada, 2020

RESUMEN Este texto defiende que la teoría de los sistemas complejos aplicada al lenguaje puede ayudar a superar algunas limitaciones de L2 y abrir nuevos caminos metodológicos más allá de la representación de redes lingüísticas utilizada en la enseñanza del léxico. Para ello, se presenta brevemente la teoría de lo complejo como una parte del paradigma de los sistemas caóticos; se explica la relación de los sistemas complejos con diversas disciplinas, en general, y con la lingüística y la L2, en particular. Además, se contextualiza su principal aplicación, las redes lingüísticas o semánticas, y se explica por qué el lenguaje es un sistema complejo. A partir de los rasgos presentados, la parte final del artículo destaca algunas implicaciones que ofrece esta teoría para el desarrollo de nuevas metodologías o enfoques para la enseñanza de español L2. ABSTRACT This text argues that the theory of complex systems applied to language can help overcome some limitations of L2 and open new methodological paths beyond the representation of linguistic networks used in the teaching of vocabulary. First, complexity theory is briefly presented as a part of the chaotic systems paradigm. Next, we discuss the relationship of complex systems with various disciplines, in general, and with linguistics and L2, in particular. We will also contextualize the notion of linguistic or semantic networks and the main application of complexity theory and explain why language is a complex system. The final part of the article will focus on some implications that complexity theory could contribute for the development of new methodologies or approaches are highlighted.

La evaluación lingüística y la Inteligencia Artificial: Un Análisis DAFO

Con los desarrollos observados en los últimos años en el campo de la inteligencia artificial cada vez es más complicada la evaluación educativa tradicional. Los paradigmas de desarrollo de temas han quedado obsoletos. De manera análoga, la evaluación lingüística presenta dificultades y ventajas que se analizan en este trabajo. Mientras en el sentido tradicional la IA supone un reto muy importante, en la evaluación de lenguas parece tener un carácter muy positivo que muestran los autores. Para ello, tras una introducción al problema se realiza un análisis DAFO del mismo contrastando problemas de la evaluación tradicional con la lingüística. El trabajo concluye que la IA posee muchas propiedades de mejora que nos alejan de una evaluación memorística y nos dirigen a la evaluación por competencias.

Principios lingüísticos aplicados a la síntesis automática de la lengua de signos española

ELUA. Estudios de Lingüística Universidad de Alicante, 2010

Este trabajo presenta la base lingüística utilizada en un sintetizador de lengua de signos española (LSE). Los aspectos fundamentales tratados son la fonología de la LSE y una aproximación para describir mensajes signados. En relación a la fonología se describen los parámetros fonológicos utilizados, el modelo fonológico en el que se basa este trabajo y la aproximación para almacenar esta información. Por último se presentan los resultados obtenidos en pruebas de evaluación con nativos de LSE.