Mario Barcala - Academia.edu (original) (raw)
Papers by Mario Barcala
Lingua, pobo e terra: estudos en homenaxe a Xesús Ferro Ruibal, 2016, ISBN 978-84-453-5236-6, págs. 445-473, 2016
Caplletra. Revista Internacional de Filologia, 2020
El disseny d’un corpus oral i els processos de registrar, codificar i tractar els materials per c... more El disseny d’un corpus oral i els processos de registrar, codificar i tractar els materials per construir un recurs útil per a l’anàlisi lingüística, comporta nombroses decisions pel que fa a la teoria i la metodologia. Aquest article s’ocupa d’aquelles etapes de la construcció d’un corpus que més clarament estan condicionades pel processament informàtic necessari que ha de fer el corpus funcional. Per tal de conjugar les expectatives inicials i les possibilitats reals quan usem l’eina, cada característica que pretenem codificar ha de ser mesurada quant a la càrrega de treball que comporta i els mitjans que són requerits per fer-ho possible. Per això, és essencial tenir en compte els recursos disponibles a l’hora de processar i explotar el corpus, ja que tenen un impacte fonamental en les decisions pel que fa a la construcció del corpus. Basat en l’experiència adquirida en la construcció del corpus ESLORA, l’article analitza alguns dels problemes que sorgeixen en el procés de dissen...
Procesamiento del lenguaje natural, 2003
En este artículo presentamos una serie de técnicas de Procesamiento de Lenguaje Natural aplicadas... more En este artículo presentamos una serie de técnicas de Procesamiento de Lenguaje Natural aplicadas a la normalización de términos en Recuperación de Información Textual. El objetivo de dichas técnicas es el tratamiento de los fenómenos de variación lingüística morfológica y léxica. En concreto explorará la utilización de la lematización, su empleo combinado con el stemming y la expansión de consultas mediante umbrales de sinonimia.
Lecture Notes in Computer Science, 2002
Lecture Notes in Computer Science, 2002
Lecture Notes in Computer Science, 2000
Dialectología digital del español, 2020, ISBN 9788418445316, págs. 189-224, 2020
This article provides an overview of the design and composition of the corpus ESLORA and shows it... more This article provides an overview of the design and composition of the corpus ESLORA and shows its usefulness in analysing social and situational variation. The corpus also contributes to the study of the processes of change related to the geographical variation of Spanish, since it records its use in a region with its own distinctive language. This aspect facilitates the recognition of the Spanish spoken in Galicia as a research object in the field of Hispanic dialectology, allowing for its comparison with other geographical varieties on an equal footing. The main focus of the paper is on some difficulties encountered during transcription, codification, and annotation of spoken recordings as well as with the arguments that justify the solutions taken by the research team.
Caplletra. Revista Internacional de Filologia
El disseny d’un corpus oral i els processos de registrar, codificar i tractar els materials per c... more El disseny d’un corpus oral i els processos de registrar, codificar i tractar els materials per construir un recurs útil per a l’anàlisi lingüística, comporta nombroses decisions pel que fa a la teoria i la metodologia. Aquest article s’ocupa d’aquelles etapes de la construcció d’un corpus que més clarament estan condicionades pel processament informàtic necessari que ha de fer el corpus funcional. Per tal de conjugar les expectatives inicials i les possibilitats reals quan usem l’eina, cada característica que pretenem codificar ha de ser mesurada quant a la càrrega de treball que comporta i els mitjans que són requerits per fer-ho possible. Per això, és essencial tenir en compte els recursos disponibles a l’hora de processar i explotar el corpus, ja que tenen un impacte fonamental en les decisions pel que fa a la construcció del corpus. Basat en l’experiència adquirida en la construcció del corpus ESLORA, l’article analitza alguns dels problemes que sorgeixen en el procés de dissen...
CHIMERA: Revista de Corpus de Lenguas Romances y Estudios Lingüísticos, Oct 10, 2018
Abstract Sentence word segmentation and Part-Of-Speech (POS) tagging are common preprocessing tas... more Abstract Sentence word segmentation and Part-Of-Speech (POS) tagging are common preprocessing tasks for many Natural Language Processing (NLP) applications. This paper presents a practical application for POS tagging and segmentation disambiguation using ...
Computer Aided Systems Theory …, 2005
Lecture Notes in Computer Science, 2007
Lecture Notes in Computer Science, 2005
sepln.org
Page 1. Construcci,on de sistemas de recuperaci,on de informaci,on sobre c,orpora textuales estru... more Page 1. Construcci,on de sistemas de recuperaci,on de informaci,on sobre c,orpora textuales estructurados de grandes dimensiones * Fco. Mario Barcala Centro Ram on Pi neiro Santiago-Noia km. 3, A Barcia 36900 Santiago de Compostela barcala@freeresearch.org ...
Abstract Sentence word segmentation and Part-Of-Speech (POS) tagging are common preprocessing tas... more Abstract Sentence word segmentation and Part-Of-Speech (POS) tagging are common preprocessing tasks for many Natural Language Processing (NLP) applications. This paper presents a practical application for POS tagging and segmentation disambiguation using ...
. Parsing CYK-like algorithms are inherently parallel: thereare a lot of cells in the chart that ... more . Parsing CYK-like algorithms are inherently parallel: thereare a lot of cells in the chart that can be calculated simultaneously. Inthis work, we present a study on the appropriate techniques of parallelismto obtain an optimal performance of the extended CYK algorithm, astochastic parsing algorithm that preserves the same level of expressivenessas the one in the original grammar, and improves further
Lingua, pobo e terra: estudos en homenaxe a Xesús Ferro Ruibal, 2016, ISBN 978-84-453-5236-6, págs. 445-473, 2016
Caplletra. Revista Internacional de Filologia, 2020
El disseny d’un corpus oral i els processos de registrar, codificar i tractar els materials per c... more El disseny d’un corpus oral i els processos de registrar, codificar i tractar els materials per construir un recurs útil per a l’anàlisi lingüística, comporta nombroses decisions pel que fa a la teoria i la metodologia. Aquest article s’ocupa d’aquelles etapes de la construcció d’un corpus que més clarament estan condicionades pel processament informàtic necessari que ha de fer el corpus funcional. Per tal de conjugar les expectatives inicials i les possibilitats reals quan usem l’eina, cada característica que pretenem codificar ha de ser mesurada quant a la càrrega de treball que comporta i els mitjans que són requerits per fer-ho possible. Per això, és essencial tenir en compte els recursos disponibles a l’hora de processar i explotar el corpus, ja que tenen un impacte fonamental en les decisions pel que fa a la construcció del corpus. Basat en l’experiència adquirida en la construcció del corpus ESLORA, l’article analitza alguns dels problemes que sorgeixen en el procés de dissen...
Procesamiento del lenguaje natural, 2003
En este artículo presentamos una serie de técnicas de Procesamiento de Lenguaje Natural aplicadas... more En este artículo presentamos una serie de técnicas de Procesamiento de Lenguaje Natural aplicadas a la normalización de términos en Recuperación de Información Textual. El objetivo de dichas técnicas es el tratamiento de los fenómenos de variación lingüística morfológica y léxica. En concreto explorará la utilización de la lematización, su empleo combinado con el stemming y la expansión de consultas mediante umbrales de sinonimia.
Lecture Notes in Computer Science, 2002
Lecture Notes in Computer Science, 2002
Lecture Notes in Computer Science, 2000
Dialectología digital del español, 2020, ISBN 9788418445316, págs. 189-224, 2020
This article provides an overview of the design and composition of the corpus ESLORA and shows it... more This article provides an overview of the design and composition of the corpus ESLORA and shows its usefulness in analysing social and situational variation. The corpus also contributes to the study of the processes of change related to the geographical variation of Spanish, since it records its use in a region with its own distinctive language. This aspect facilitates the recognition of the Spanish spoken in Galicia as a research object in the field of Hispanic dialectology, allowing for its comparison with other geographical varieties on an equal footing. The main focus of the paper is on some difficulties encountered during transcription, codification, and annotation of spoken recordings as well as with the arguments that justify the solutions taken by the research team.
Caplletra. Revista Internacional de Filologia
El disseny d’un corpus oral i els processos de registrar, codificar i tractar els materials per c... more El disseny d’un corpus oral i els processos de registrar, codificar i tractar els materials per construir un recurs útil per a l’anàlisi lingüística, comporta nombroses decisions pel que fa a la teoria i la metodologia. Aquest article s’ocupa d’aquelles etapes de la construcció d’un corpus que més clarament estan condicionades pel processament informàtic necessari que ha de fer el corpus funcional. Per tal de conjugar les expectatives inicials i les possibilitats reals quan usem l’eina, cada característica que pretenem codificar ha de ser mesurada quant a la càrrega de treball que comporta i els mitjans que són requerits per fer-ho possible. Per això, és essencial tenir en compte els recursos disponibles a l’hora de processar i explotar el corpus, ja que tenen un impacte fonamental en les decisions pel que fa a la construcció del corpus. Basat en l’experiència adquirida en la construcció del corpus ESLORA, l’article analitza alguns dels problemes que sorgeixen en el procés de dissen...
CHIMERA: Revista de Corpus de Lenguas Romances y Estudios Lingüísticos, Oct 10, 2018
Abstract Sentence word segmentation and Part-Of-Speech (POS) tagging are common preprocessing tas... more Abstract Sentence word segmentation and Part-Of-Speech (POS) tagging are common preprocessing tasks for many Natural Language Processing (NLP) applications. This paper presents a practical application for POS tagging and segmentation disambiguation using ...
Computer Aided Systems Theory …, 2005
Lecture Notes in Computer Science, 2007
Lecture Notes in Computer Science, 2005
sepln.org
Page 1. Construcci,on de sistemas de recuperaci,on de informaci,on sobre c,orpora textuales estru... more Page 1. Construcci,on de sistemas de recuperaci,on de informaci,on sobre c,orpora textuales estructurados de grandes dimensiones * Fco. Mario Barcala Centro Ram on Pi neiro Santiago-Noia km. 3, A Barcia 36900 Santiago de Compostela barcala@freeresearch.org ...
Abstract Sentence word segmentation and Part-Of-Speech (POS) tagging are common preprocessing tas... more Abstract Sentence word segmentation and Part-Of-Speech (POS) tagging are common preprocessing tasks for many Natural Language Processing (NLP) applications. This paper presents a practical application for POS tagging and segmentation disambiguation using ...
. Parsing CYK-like algorithms are inherently parallel: thereare a lot of cells in the chart that ... more . Parsing CYK-like algorithms are inherently parallel: thereare a lot of cells in the chart that can be calculated simultaneously. Inthis work, we present a study on the appropriate techniques of parallelismto obtain an optimal performance of the extended CYK algorithm, astochastic parsing algorithm that preserves the same level of expressivenessas the one in the original grammar, and improves further