El Sesgo Lingüístico Digital (SLD) en la inteligencia artificial: implicaciones para los modelos de lenguaje masivos en español / The Digital Linguistic Bias (DLB) in Artificial Intelligence: Implications for Large Language Models in Spanish (original) (raw)
Related papers
Abstract This article deals with the manner in which the AI researchers have taken a Cartesian challenge: the impossibility to create machines which, via linguistic understanding, evince thought. Such a challenge, which is part of the metaphysical Cartesian philosophy, distinguishes between res cogitans and res extensa. It is impossible for the latter to have thought. Language, then, provides evidence of the impossibility of machine intelligence. As I analyze, by facing the Cartesian challenge, those researchers have supposed to be true part of Descartes’ theory, namely, that the flexible use of language entails thought. For this reason I consider that the relation between AI and Descartes is ambivalent: on the one hand, AI researchers reject that machine intelligence is impossible in principle; on the other hand, they agree with Descartes in relation to the importance of language when it comes to providing evidence of thought. Even though the ambivalent character of AI and Descartes seems anecdotic, it is not. The fact that some people still regard the Turing Test as an adequate evaluation of intelligence verifies the complex relation between AI and the French philosopher.
La lingüística en el contexto de la inteligencia artificial
En el presente artículo se reseñan algunos conceptos fundamentales sobre Inteligencia Artificial que sirven de base para reconocer la identidad y las proyecciones de la lingüística en el área de la informática, en consonancia con las exigencias de la tecnología moderna. Se destacan la posibilidad e importancia del procesamiento automático del lenguaje natural y el sentido que para ello tienen los conocimientos pragmáticos, Por último, se reseñan algunas ideas sobre las llamadas industrias de la lengua.
DiSeg: Un segmentador discursivo automático para el español
2010
Hoy en día el análisis discursivo automático es un tema de investigación relevante. Sin embargo, no existen analizadores del discurso para textos en español. El primer paso para desarrollar esta herramienta es la segmentación discursiva. En este artículo presentamos DiSeg, el primer segmentador discursivo para el español que utiliza el marco de la Rhetorical Structure Theory (Mann y Thompson, 1988) y se basa en reglas léxicas y sintácticas. Describimos el sistema y evaluamos sus resultados con un corpus gold standard, obteniendo resultados prometedores.
(2024): Lingüística e inteligencia artificial. El corpus de La Pola Siero
Facts and opinions published in this book express solely the opinions of the respective authors. Authors are responsible for their citing of sources and the accuracy of their references and bibliographies. The editor, series editor or the publisher cannot be held responsible for any lacks or possible violations of third parties' rights.
2006
We present a word recognition and generation system for multilingual natural language processing, intended for human-machine interface. Presenting robust, low memory footprint and efficient algorithms, it is capable of: language identification, linguistic word-tagging, semantic extraction, automatic error recognition and correction with morphologic and sound-like estimation capability. It uses simple rules to express sophisticated and reversible morphological changes. Tolerates, detects and corrects spelling errors, primarily intended for text generated by automatic natural speech and writing recognition; constrained inputs like mobile phone keyboards or PDA's, chat and/or e-mails. Useful for interactive text correction & assistance in word processing, it yields a low memory footprint and high processing speed, being adequate for personal computers, portables, palms, mobiles & embedded solutions. For spanish, it needs 200Kb for 50k lemmas and 4500 rules, equivalent to 1.2M exact words and >300M guessable. Capable of morphological and sound-like inference, in a similar way as a natural language human hearer would perform. As flexion generator, it has added semantic expression capability.
Revista Nebrija de Lingüística Aplicada, 2020
RESUMEN Este texto defiende que la teoría de los sistemas complejos aplicada al lenguaje puede ayudar a superar algunas limitaciones de L2 y abrir nuevos caminos metodológicos más allá de la representación de redes lingüísticas utilizada en la enseñanza del léxico. Para ello, se presenta brevemente la teoría de lo complejo como una parte del paradigma de los sistemas caóticos; se explica la relación de los sistemas complejos con diversas disciplinas, en general, y con la lingüística y la L2, en particular. Además, se contextualiza su principal aplicación, las redes lingüísticas o semánticas, y se explica por qué el lenguaje es un sistema complejo. A partir de los rasgos presentados, la parte final del artículo destaca algunas implicaciones que ofrece esta teoría para el desarrollo de nuevas metodologías o enfoques para la enseñanza de español L2. ABSTRACT This text argues that the theory of complex systems applied to language can help overcome some limitations of L2 and open new methodological paths beyond the representation of linguistic networks used in the teaching of vocabulary. First, complexity theory is briefly presented as a part of the chaotic systems paradigm. Next, we discuss the relationship of complex systems with various disciplines, in general, and with linguistics and L2, in particular. We will also contextualize the notion of linguistic or semantic networks and the main application of complexity theory and explain why language is a complex system. The final part of the article will focus on some implications that complexity theory could contribute for the development of new methodologies or approaches are highlighted.
La evaluación lingüística y la Inteligencia Artificial: Un Análisis DAFO
Con los desarrollos observados en los últimos años en el campo de la inteligencia artificial cada vez es más complicada la evaluación educativa tradicional. Los paradigmas de desarrollo de temas han quedado obsoletos. De manera análoga, la evaluación lingüística presenta dificultades y ventajas que se analizan en este trabajo. Mientras en el sentido tradicional la IA supone un reto muy importante, en la evaluación de lenguas parece tener un carácter muy positivo que muestran los autores. Para ello, tras una introducción al problema se realiza un análisis DAFO del mismo contrastando problemas de la evaluación tradicional con la lingüística. El trabajo concluye que la IA posee muchas propiedades de mejora que nos alejan de una evaluación memorística y nos dirigen a la evaluación por competencias.
Principios lingüísticos aplicados a la síntesis automática de la lengua de signos española
ELUA. Estudios de Lingüística Universidad de Alicante, 2010
Este trabajo presenta la base lingüística utilizada en un sintetizador de lengua de signos española (LSE). Los aspectos fundamentales tratados son la fonología de la LSE y una aproximación para describir mensajes signados. En relación a la fonología se describen los parámetros fonológicos utilizados, el modelo fonológico en el que se basa este trabajo y la aproximación para almacenar esta información. Por último se presentan los resultados obtenidos en pruebas de evaluación con nativos de LSE.