El papel de los corpus en el estudio de la historia del español (original) (raw)
Related papers
Los corpus textuales del español
Gutiérrez-Rexach, Javier (ed.): Enciclopedia lingüística hispánica. Oxon: Routledge, 2016, pp. 285-296., 2016
Relación detallada de los representantes más destacados y característicos de los distintos tipos de corpus textuales del español.
EL ESPAÑOL Y SU DINAMISMO: REDES, IRRADIACIONES Y CONFLUENCIAS edición de Maria Vittoria Calvi, Beatriz Hernán Gómez, Elena Landone, 2018
¿Qué es la historia de la lengua? ¿Qué es lo que hacemos cuando describimos la historia del español? La teoría de la lingüística histórica ha ido identificando, a lo largo del último siglo, una serie de dimensiones que han permitido ofrecer una visión diferenciada de lo que se halla detrás del objeto lengua considerada en su evolución histórica. Esbozaremos, brevemente, algunas de las diferenciaciones necesarias para una adecuada interpretación de los datos a partir de los cuales componemos y construimos nuestro objeto de estudio.
Lingüística de corpus y lingüística del español
Actas del XV Congreso de la Asociación de Lingüística y Filología de América Latina (Montevideo, agosto de 2008), 2008
Ponencia plenaria en el XV Congreso de la ALFAL (Montevideo, 18-21 de agosto de 2008). Edición electrónica en las actas del congreso (ISBN 978-9974-8002-6-7)]
Antecedentes de la lingüistica de corpus
Álvarez Menéndez, Alfredo et alii: Studium grammaticae. Homenaje al Profesor José Antonio Martínez. Universidad de Oviedo, 2015, 675-689. , 2015
Dada la evidente dependencia que existe entre la lingüística de corpus (LC) y las computadoras, parece lógico pensar que la historia de la LC en sentido estricto no puede remontarse más allá del momento en que comienza el proceso de diseño, construcción y utilización de las primeras máquinas a las que podemos considerar realmente computadoras. Quizá la aparente nitidez de ese corte explica que no se haya prestado demasiada atención al análisis de las primeras fases de la LC ni a sus antecedentes, lo cual ha llevado a presentaciones bastante deficientes e incompletas de un tema que, sin embargo, posee un interés considerable para la historia de la lingüística. En realidad, es una cuestión bastante compleja, constituida por varias facetas relativamente independientes. En primer lugar, los antecedentes lejanos de los corpus y la LC. Más cerca está la cuestión del vínculo entre los corpus presentes en la teoría y la práctica distribucionalistas y los que aparecen a partir de 1963. En tercer término, la historia de los primeros veinte años de la LC, con el contraste entre la marginación que sufre en los Estados Unidos y el desarrollo que en esos mismos años experimenta en Europa. Y por último, el análisis de los antecedentes en tradiciones lingüísticas diferentes de la inglesa, que es la única a la que se ha atendido habitualmente 1 . Me propongo en este trabajo contribuir al
Lingüística de corpus y lingüística histórica iberorrománica
Lingüística de corpus y lingüística histórica iberorrománica
Con la intención de mostrar las tendencias actuales de la lingüística histórica iberorrománica, este volumen presenta una gama amplia y actual de estudios centrados en cuestiones relacionadas con los corpus diacrónicos del español, portugués, catalán y gallego, escritos por 30 expertos destacados en lingüística histórica iberorrománica. Se divide en tres partes: la primera consta de estudios en los que se reflexiona sobre las posibilidades metodológicas del uso de corpus (a partir de ejemplos concretos de corpus iberorrománicos), mostrando cómo estas pueden contribuir al desarrollo de la lingüística histórica; en la segunda parte se presentan nuevos corpus y sus posibles aplicaciones, y en la tercera se ofrece una serie de estudios basados en el trabajo con corpus. Estos tratan tanto aspectos generales de épocas determinadas (mostrando cómo los corpus permiten caracterizar la lengua de una época y su dinamismo) como aspectos particulares, que van desde la ortografía a la sintaxis y la construcción del discurso pasando por aspectos fonéticos y morfológicos. El conjunto de los trabajos ofrece una visión de actualidad de los estudios de estos dos campos que tanto han evolucionado en los últimos años.
Sobre la naturaleza de los corpus y la comparabilidad de resultados en lingüística histórica
Spanish in Context
Este artículo contribuye a la discusión sobre el valor de los datos empíricos en el campo de la lingüística histórica. En la literatura se han discutido ampliamente los problemas metodológicos derivados del hecho de que los análisis diacrónicos estén basados casi exclusivamente en fuentes escritas. Este problema general de la representatividad de los datos se acentúa cuando se aborda el estudio histórico de fenómenos típicos de la oralidad, como son los marcadores pragmáticos. Sin embargo, a pesar de los argumentos empleados tanto a favor del uso de fuentes escritas como en su contra, este problema metodológico no ha sido objeto aún de una verificación empírica consistente en español. Este estudio supone un primer paso para cubrir esta laguna, para lo cual se comparan los resultados de un análisis diacrónico reciente del marcador pragmático sabes en un corpus escrito literario y en un corpus de español hablado.
Introducción a la lingüística de corpus en español
Introducción a la lingüística de corpus en español, 2021
Guillermo Rojo has given us a comprehensive, yet highly accessible introduction to Spanish corpus linguistics, theoretically up to date and replete with a fascinating wealth of practical hands-on illustrations. As someone primarily working with English corpora, I have benefi ted greatly from the opportunity to study how the 'corpus revolution' has played out in another linguistic tradition. I am sure that the book will serve its primary audience well-and promote a necessary and mutually benefi cial interdisciplinary dialogue in the international and multilingual corpus-linguistic research community. Can an English translation be far behind? " Christian Mair, Universität Freiburg "El libro Introducción a la lingüística de corpus en español , de Guillermo Rojo, abre las ventanas a la investigación como pocos volúmenes lo hacen. Establece de modo magistral las coordenadas históricas de la revolución que supone el empleo de documentación lingüística sistematizada, representativa y anotada, explica la constitución y posibilidades de los corpus actuales y sugiere las vías de desarrollo futuras. Sin duda, entusiasma al lector al mostrar las posibilidades para recuperar información léxica, en sincronía y diacronía, así como para analizar multitud de fenómenos gramaticales, desde los adverbios en-mente hasta las perífrasis ir a más infi nitivo, entre muchas otras cuestiones. Más allá de sus luminosos comentarios técnicos, expuestos con claridad y elegancia, su autor-cuyas extraordinarias aportaciones al desarrollo de los corpus del español son de sobra conocidas-ha escrito, ante todo, un libro de lingüística, absolutamente imprescindible para cualquier estudioso y para cualquier investigador interesado en trabajar sobre fundamentos empíricos. " Pedro Martín Butragueño, El Colegio de México "En este libro, Guillermo Rojo despliega su conocimiento y pericia para profundizar con precisión y claridad, tanto en los instrumentos metodológicos de la investigación basada en corpus, como en los benefi cios que esta puede aportar al conocimiento del español. El autor nos muestra acertadamente las ventajas de una orientación científi ca apoyada en datos reales organizados, codifi cados y cuantifi cados para el estudio científi co de la lengua española. Nos presenta un panorama razonado de la historia de la lingüística de corpus, contraponiéndola con una argumentación sólida a otras visiones del lenguaje. Al presentar de modo didáctico cada paso de la construcción de un corpus (el diseño, la codifi cación, la cuantifi cación), el autor se vale de una gran variedad de ejemplos de los múltiples fenómenos de variación de la lengua española que pueden estudiarse desde esta perspectiva. Este libro traza, sin duda, un camino promisorio para la investigación futura del español.
Panorama històric de la constitució de corpus: orígens, consolidació i expansió
Notandum 48, 2018
Resum: La constitució de corpus ha experimentat una gran evolució des dels seus inicis fins a l'actualitat. A fi d'entendre millor les bases de la disciplina, farem un breu recorregut per la seua història a través d'algunes fites importants. El nostre camí partirà dels orígens, amb el corpus BROWN. Després recorrerà l'etapa de consolidació, període que representa una època de reflexió i de creació de nombrosos corpus, com ara el British National Corpus. Fins a arribar a l'actualitat, on s'ha produït una gran expansió de l'activitat de compilació de corpus, que ha provocat, al seu torn, noves reflexions i propostes de millora en la disciplina. En el nostre article, palesarem l'estreta relació entre corpus i TIC. Posteriorment, presentarem la definició actual de corpus lingüístic, que inclou els trets d'autenticitat, representativitat i gran extensió. Dedicarem l'epígraf següent al disseny de corpus, on revisarem els conceptes de representativitat estadística i equilibri, així com l'aplicació real de la noció de representativitat als corpus (tant de llengua actual, com de llengua antiga). Per últim, proposarem la diversitat i l'extensió com a aproximacions acceptables per a assolir el major grau de representativitat possible. Paraules Clau: Lingüística de corpus, TIC, corpus lingüístics, representativitat. Abstract: The constitution of corpus linguistics has experienced a big transformation since its origins. In order to better understand the basis of this discipline, I will present a brief history of it. I will start with the corpus BROWN. I will also explain the consolidation of the discipline, period in which a number of corpus was created, such as the British National Corpus. I will also describe the situation of this discipline nowadays, in which we have seen plenty of new corpora being created, along with new theoretical insights. My next step will be to present the close relationship between ICT and corpus and to define what is understood by corpus linguistic in today's world, in which concepts such as authenticity, representativity, etc., are particularly relevant. After this, I will explain how corpus are designed and I will apply concepts such as statistical representativity and equilibrium, along with the real application of the notion of representativity to corpus (both in current and ancient language). Finally, I propose diversity and extension as acceptable approximations to get the biggest level or representativity possible.
Panorama de los corpus y textos del español peninsular contemporáneo
Manuel des anthologies, corpus et textes romans
El presente capítulo trata de proporcionar una herramienta que permita al estudioso (i) determinar fácil y rápidamente los corpus disponibles para realizar una investigación de corpus sobre cualquier tema del español europeo contemporáneo, (ii) saber dónde encontrarlos, (iii) encontrar estudios que describan los detalles de estos corpus (sección 1). La lista no es exhaustiva: incluimos solamente los proyectos finalizados o en gran medida disponibles al público, de dimensiones razonablemente grandes o con importancia particular, cuyos textos son de libre y fácil acceso. La segunda parte del capítulo ilustra la variación tipológica de los textos del español europeo a través de unas muestras representativas. Los límites del artículo no permiten dar una lista exhaustiva de distintos géneros y variedades. Antes bien, a través de nuestra selección de textos, damos una visión de conjunto de las variedades textuales que se encuentran en el español actual y de sus características (sección 2).