António Leal | Universidade do Porto (original) (raw)
Books by António Leal
Este trabalho é financiado pela Faculdade de Letras da Universidade do Porto e por fundos naciona... more Este trabalho é financiado pela Faculdade de Letras da Universidade do Porto e por fundos nacionais através da FCT -Fundação para a Ciência e a Tecnologia, I.P., no âmbito do projeto UID/LIN/00022/2019.
INTRODUÇÃO explicações. Utilizaremos, ao longo do trabalho, as propostas de Moens e Steedman (198... more INTRODUÇÃO explicações. Utilizaremos, ao longo do trabalho, as propostas de Moens e Steedman (1988) e de Kamp e Reyle (1993), por serem sobejamente conhecidas e por facultarem os instrumentos necessários para o trabalho a que nos propomos. A partir do Capítulo III, tratamos os dados. Procedemos, em primeiro lugar, à análise de frases com eventos, sendo um deles uma oração gerundiva, com o Gerúndio Simples (Capítulo III) e o Composto (Capítulo IV). Em seguida, tratamos alguns estados construídos com o verbo ser na oração gerundiva (Capítulo V). Na sequência das conclusões a que chegámos nos capítulos anteriores, abordamos, sucintamente, no Capítulo VI, o operador Progressivo, as orações temporais com "quando" e a ordenação de eventualidades e o Particípio Absoluto, no sentido de compreendermos os valores básicos das formas de Gerúndio, dado que estas formas verbais apresentam algumas das características apontadas às eventualidades sob o efeito daquelas construções/ formas verbais.
Papers by António Leal
Linguística : Revista de Estudos Linguísticos da Universidade do Porto, 2022
Espaço da direção O número de 2022 da Linguística inclui cinco contribuições em forma de artigo. ... more Espaço da direção O número de 2022 da Linguística inclui cinco contribuições em forma de artigo. O volume começa com o texto "Para a construção de um corpus de interações orais em Português Língua Não Materna (PLNM)-algumas reflexões", de Conceição Carapinha, da Universidade de Coimbra. A autora tece um conjunto de considerações acerca da pertinência da constituição de um corpus de interações orais tanto para o ensino como para a investigação em PLMN e em áreas conexas, das dificuldades que uma tal tarefa coloca e da forma como essas dificuldades podem ser ultrapassadas. O segundo artigo, "Algumas notas sobre a quantificação de adjetivos de cor por muito e pouco", é da autoria de Inês Cantante. Trata-se de uma primeira abordagem à semântica de cinco adjetivos de cor em Português Europeu, que parte de dados de corpus (CETEMPúblico) para a análise da possível graduabilidade destes adjetivos e do tipo de escala (aberta ou fechada) a que estarão associados. Leticia Quesada Vázquez, da Universidade de Nebrija (Madrid), é a autora de "Rhythm instruction to improve ESP students' fluency: A study of pausing". Esse trabalho descreve uma experiência no âmbito do ensino de aspetos específicos da fonologia do Inglês a falantes nativos do Espanhol/ Catalão. O quarto artigo, "Sobre as formas de tratamento no Português em Angola: o caso de você", de Queneth Pires, descreve também uma experiência, neste caso no âmbito do uso do pronome "você" como forma de tratamento no Português de Angola. A abordagem, de índole pragmática, procura pôr em evidência os fatores que favorecem o uso desta forma pronominal numa variedade do Português que está atualmente em reestruturação. Finalmente, o artigo "Particularidades semânticas das expressões temporais com até e desafios de tradução entre português e inglês", de Telmo Móia, da Universidade de Lisboa, apresenta uma descrição, baseada também em dados de corpus (CETEMPúblico), dos diversos valores temporais e discursivos que o conector "até" pode ter em Português. O autor reflete ainda sobre os conectores que veiculam os mesmos valores em
Linguística: Revista de Estudos Linguísticos da Universidade do Porto
In this paper, we put forward a semantic analysis of constructions of prepositional phrases intro... more In this paper, we put forward a semantic analysis of constructions of prepositional phrases introduced by the preposition para with a locative meaning combined with the verbs ser, estar and ficar. In this proposal, we characterise these constructions regarding the properties individual-level/ stage-level, modal reading, and vagueness of the location, as well as restrictions imposed on the subject related to some lexical semantic features, in particular [movable] and [animated] features. Additionally, we contrast these constructions to the ones introduced by the preposition em (typically locative), revealing to what extent they differ from each other.
Linguística : Revista de Estudos Linguísticos da Universidade do Porto, 2022
do Porto, ao abrigo do Programa de Financiamento FCT-UIDB/00022/2020 (Fundação para a Ciência e a... more do Porto, ao abrigo do Programa de Financiamento FCT-UIDB/00022/2020 (Fundação para a Ciência e a Tecnologia).
XXXVI Simpósio de la Sociedad Española de …, 2006
Vamos defender que existem, pelo menos, duas construções diferentes subjacentes a esta expressão:... more Vamos defender que existem, pelo menos, duas construções diferentes subjacentes a esta expressão: uma delas é designada como construção comparativa serial em Marques (2003) e consiste num tipo de construção comparativa que expressa uma ordenação de ...
Mathematics
This paper describes two different approaches to sentiment analysis. The first is a form of symbo... more This paper describes two different approaches to sentiment analysis. The first is a form of symbolic approach that exploits a sentiment lexicon together with a set of shifter patterns and rules. The sentiment lexicon includes single words (unigrams) and is developed automatically by exploiting labeled examples. The shifter patterns include intensification, attenuation/downtoning and inversion/reversal and are developed manually. The second approach exploits a deep neural network, which uses a pre-trained language model. Both approaches were applied to texts on economics and finance domains from newspapers in European Portuguese. We show that the symbolic approach achieves virtually the same performance as the deep neural network. In addition, the symbolic approach provides understandable explanations, and the acquired knowledge can be communicated to others. We release the shifter patterns to motivate future research in this direction.
This paper describes an approach to the construction of a sentiment analysis system that uses bot... more This paper describes an approach to the construction of a sentiment analysis system that uses both automatic and manual processes. The system includes a domain-specific sentiment lexicon, modifier patterns and rules that are used to derive the sentiment values of sentences in new texts. The lexicon that includes single words (unigrams) is obtained in an automatic manner from the distribution of ratings for all words in the labelled training data. The sentiment values of phrases is derived from a list of modifier patterns, built/developed manually. These include a modifier and a focal element. The modifiers can be of different types, depending on whether the operation is intensification, downtoning or reversal. This approach was applied to texts on economics and finance in European Portuguese. In our view, this line of work deserves more attention in the community, as the system not only has reasonable performance, but also can provide understandable explanations to the user.
Journal of Portuguese Linguistics
In research on African varieties of Portuguese, especially Angolan and Mozambican Portuguese, it ... more In research on African varieties of Portuguese, especially Angolan and Mozambican Portuguese, it is often referred that Goal arguments of verbs of movement show a tendency to be headed by locative preposition em ‘in’, contrasting with the use of a ‘to’ and para ‘to, toward’ in European Portuguese. Language contact is generally considered the primary factor with respect to the use of the noncanonical pattern. Using spoken corpora of the urban varieties of Angolan, Mozambican and Santomean Portuguese, this paper develops a case-study of Goal arguments that occur with two frequently used verbs of inherently directed motion, ir ‘to go’ and chegar ‘to arrive’, to assess the contact-induced hypothesis and to explore alternative, semantic-based hypotheses. Overall, a cross-comparison of the varieties at stake and their main contact languages shows that the role of language contact is limited at best. A semantic analysis of em, on the other hand, shows promising results, since the occurrenc...
Linguística: Revista de Estudos Linguísticos da Universidade do Porto, 2021
In this paper, we put forward a semantic analysis of constructions of prepositional phrases intro... more In this paper, we put forward a semantic analysis of constructions of prepositional phrases introduced by the preposition para with a locative meaning combined with the verbs ser, estar and ficar. In this proposal, we characterise these constructions regarding the properties individual-level/ stage-level, modal reading, and vagueness of the location, as well as restrictions imposed on the subject related to some lexical semantic features, in particular [movable] and [animated] features. Additionally, we contrast these constructions to the ones introduced by the preposition em (typically locative), revealing to what extent they differ from each other.
In this paper, we describe the process of developing a multilayer semantic annotation scheme desi... more In this paper, we describe the process of developing a multilayer semantic annotation scheme designed for extracting information from a European Portuguese corpus of news articles, at three levels, temporal, referential and semantic role labelling. The novelty of this scheme is the harmonization of parts 1, 4 and 9 of the ISO 24617 Language resource management - Semantic annotation framework. This annotation framework includes a set of entity structures (participants, events, times) and a set of links (temporal, aspectual, subordination, objectal and semantic roles) with several tags and attribute values that ensure adequate semantic and visual representations of news stories.
Narrative Extraction from text is a complex task that starts by identifying a set of narrative el... more Narrative Extraction from text is a complex task that starts by identifying a set of narrative elements (actors, events, times), and the semantic links between them (temporal, referential, semantic roles). The outcome is a structure or set of structures which can then be represented graphically, thus opening room for further and alternative exploration of the plot. Such visualization can also be useful during the on-going annotation process. Manual annotation of narratives can be a complex e↵ort and the possibility o↵ered by the Brat annotation tool of annotating directly on the text does not seem su ciently helpful. In this paper, we propose Brat2Viz, a tool and a pipeline that displays visualization of narrative information annotated in Brat. Brat2Viz reads the annotation file of Brat, produces an intermediate representation in the declarative language DRS (Discourse Representation Structure), and from this obtains the visualization. Currently, we make available two visualization ...
From now to eternity, 2011
Gerundive forms, both Simple (SG) and Compound (CG), exhibit a diverse behaviour in European Port... more Gerundive forms, both Simple (SG) and Compound (CG), exhibit a diverse behaviour in European Portuguese, which is difficult to describe. They can occur in very distinct syntactic constructions (cf. Lobo 2001; Neto & Foltran 2001) and, even in the same syntactic context ...
Oslo Studies in Language, 2015
Neste artigo, discutimos um problema debatido há muito sobre a natureza aspetual de certas predic... more Neste artigo, discutimos um problema debatido há muito sobre a natureza aspetual de certas predicações, classificadas como Activities e Accomplishments (Vendler 1957, e outros). Este problema foi já colocado de maneira informal por vários autores, que assinalaram a complexidade dos Accomplishments, mas só mais recentemente houve tentativas de formalização que explicasse a alternância entre estes tipos aspetuais que é desencadeada pelas propriedades denotacionais de um dos argumentos de certos verbos. Tendo em conta alguns dados do Português Europeu, propomos que os verbos podem ter informação lexical que é relevante para a determinação da presença ou ausência de telicidade nas predicações em que ocorrem. Assim, certos traços verbais restringem a composição aspetual da predicação, mas há casos em que o perfil aspetual é definido em função do processo com- posicional envolvido, uma vez que o verbo não é marcado com esses traços. Neste trabalho, apenas foi considerada a contribuição de...
Este trabalho é financiado pela Faculdade de Letras da Universidade do Porto e por fundos naciona... more Este trabalho é financiado pela Faculdade de Letras da Universidade do Porto e por fundos nacionais através da FCT -Fundação para a Ciência e a Tecnologia, I.P., no âmbito do projeto UID/LIN/00022/2019.
INTRODUÇÃO explicações. Utilizaremos, ao longo do trabalho, as propostas de Moens e Steedman (198... more INTRODUÇÃO explicações. Utilizaremos, ao longo do trabalho, as propostas de Moens e Steedman (1988) e de Kamp e Reyle (1993), por serem sobejamente conhecidas e por facultarem os instrumentos necessários para o trabalho a que nos propomos. A partir do Capítulo III, tratamos os dados. Procedemos, em primeiro lugar, à análise de frases com eventos, sendo um deles uma oração gerundiva, com o Gerúndio Simples (Capítulo III) e o Composto (Capítulo IV). Em seguida, tratamos alguns estados construídos com o verbo ser na oração gerundiva (Capítulo V). Na sequência das conclusões a que chegámos nos capítulos anteriores, abordamos, sucintamente, no Capítulo VI, o operador Progressivo, as orações temporais com "quando" e a ordenação de eventualidades e o Particípio Absoluto, no sentido de compreendermos os valores básicos das formas de Gerúndio, dado que estas formas verbais apresentam algumas das características apontadas às eventualidades sob o efeito daquelas construções/ formas verbais.
Linguística : Revista de Estudos Linguísticos da Universidade do Porto, 2022
Espaço da direção O número de 2022 da Linguística inclui cinco contribuições em forma de artigo. ... more Espaço da direção O número de 2022 da Linguística inclui cinco contribuições em forma de artigo. O volume começa com o texto "Para a construção de um corpus de interações orais em Português Língua Não Materna (PLNM)-algumas reflexões", de Conceição Carapinha, da Universidade de Coimbra. A autora tece um conjunto de considerações acerca da pertinência da constituição de um corpus de interações orais tanto para o ensino como para a investigação em PLMN e em áreas conexas, das dificuldades que uma tal tarefa coloca e da forma como essas dificuldades podem ser ultrapassadas. O segundo artigo, "Algumas notas sobre a quantificação de adjetivos de cor por muito e pouco", é da autoria de Inês Cantante. Trata-se de uma primeira abordagem à semântica de cinco adjetivos de cor em Português Europeu, que parte de dados de corpus (CETEMPúblico) para a análise da possível graduabilidade destes adjetivos e do tipo de escala (aberta ou fechada) a que estarão associados. Leticia Quesada Vázquez, da Universidade de Nebrija (Madrid), é a autora de "Rhythm instruction to improve ESP students' fluency: A study of pausing". Esse trabalho descreve uma experiência no âmbito do ensino de aspetos específicos da fonologia do Inglês a falantes nativos do Espanhol/ Catalão. O quarto artigo, "Sobre as formas de tratamento no Português em Angola: o caso de você", de Queneth Pires, descreve também uma experiência, neste caso no âmbito do uso do pronome "você" como forma de tratamento no Português de Angola. A abordagem, de índole pragmática, procura pôr em evidência os fatores que favorecem o uso desta forma pronominal numa variedade do Português que está atualmente em reestruturação. Finalmente, o artigo "Particularidades semânticas das expressões temporais com até e desafios de tradução entre português e inglês", de Telmo Móia, da Universidade de Lisboa, apresenta uma descrição, baseada também em dados de corpus (CETEMPúblico), dos diversos valores temporais e discursivos que o conector "até" pode ter em Português. O autor reflete ainda sobre os conectores que veiculam os mesmos valores em
Linguística: Revista de Estudos Linguísticos da Universidade do Porto
In this paper, we put forward a semantic analysis of constructions of prepositional phrases intro... more In this paper, we put forward a semantic analysis of constructions of prepositional phrases introduced by the preposition para with a locative meaning combined with the verbs ser, estar and ficar. In this proposal, we characterise these constructions regarding the properties individual-level/ stage-level, modal reading, and vagueness of the location, as well as restrictions imposed on the subject related to some lexical semantic features, in particular [movable] and [animated] features. Additionally, we contrast these constructions to the ones introduced by the preposition em (typically locative), revealing to what extent they differ from each other.
Linguística : Revista de Estudos Linguísticos da Universidade do Porto, 2022
do Porto, ao abrigo do Programa de Financiamento FCT-UIDB/00022/2020 (Fundação para a Ciência e a... more do Porto, ao abrigo do Programa de Financiamento FCT-UIDB/00022/2020 (Fundação para a Ciência e a Tecnologia).
XXXVI Simpósio de la Sociedad Española de …, 2006
Vamos defender que existem, pelo menos, duas construções diferentes subjacentes a esta expressão:... more Vamos defender que existem, pelo menos, duas construções diferentes subjacentes a esta expressão: uma delas é designada como construção comparativa serial em Marques (2003) e consiste num tipo de construção comparativa que expressa uma ordenação de ...
Mathematics
This paper describes two different approaches to sentiment analysis. The first is a form of symbo... more This paper describes two different approaches to sentiment analysis. The first is a form of symbolic approach that exploits a sentiment lexicon together with a set of shifter patterns and rules. The sentiment lexicon includes single words (unigrams) and is developed automatically by exploiting labeled examples. The shifter patterns include intensification, attenuation/downtoning and inversion/reversal and are developed manually. The second approach exploits a deep neural network, which uses a pre-trained language model. Both approaches were applied to texts on economics and finance domains from newspapers in European Portuguese. We show that the symbolic approach achieves virtually the same performance as the deep neural network. In addition, the symbolic approach provides understandable explanations, and the acquired knowledge can be communicated to others. We release the shifter patterns to motivate future research in this direction.
This paper describes an approach to the construction of a sentiment analysis system that uses bot... more This paper describes an approach to the construction of a sentiment analysis system that uses both automatic and manual processes. The system includes a domain-specific sentiment lexicon, modifier patterns and rules that are used to derive the sentiment values of sentences in new texts. The lexicon that includes single words (unigrams) is obtained in an automatic manner from the distribution of ratings for all words in the labelled training data. The sentiment values of phrases is derived from a list of modifier patterns, built/developed manually. These include a modifier and a focal element. The modifiers can be of different types, depending on whether the operation is intensification, downtoning or reversal. This approach was applied to texts on economics and finance in European Portuguese. In our view, this line of work deserves more attention in the community, as the system not only has reasonable performance, but also can provide understandable explanations to the user.
Journal of Portuguese Linguistics
In research on African varieties of Portuguese, especially Angolan and Mozambican Portuguese, it ... more In research on African varieties of Portuguese, especially Angolan and Mozambican Portuguese, it is often referred that Goal arguments of verbs of movement show a tendency to be headed by locative preposition em ‘in’, contrasting with the use of a ‘to’ and para ‘to, toward’ in European Portuguese. Language contact is generally considered the primary factor with respect to the use of the noncanonical pattern. Using spoken corpora of the urban varieties of Angolan, Mozambican and Santomean Portuguese, this paper develops a case-study of Goal arguments that occur with two frequently used verbs of inherently directed motion, ir ‘to go’ and chegar ‘to arrive’, to assess the contact-induced hypothesis and to explore alternative, semantic-based hypotheses. Overall, a cross-comparison of the varieties at stake and their main contact languages shows that the role of language contact is limited at best. A semantic analysis of em, on the other hand, shows promising results, since the occurrenc...
Linguística: Revista de Estudos Linguísticos da Universidade do Porto, 2021
In this paper, we put forward a semantic analysis of constructions of prepositional phrases intro... more In this paper, we put forward a semantic analysis of constructions of prepositional phrases introduced by the preposition para with a locative meaning combined with the verbs ser, estar and ficar. In this proposal, we characterise these constructions regarding the properties individual-level/ stage-level, modal reading, and vagueness of the location, as well as restrictions imposed on the subject related to some lexical semantic features, in particular [movable] and [animated] features. Additionally, we contrast these constructions to the ones introduced by the preposition em (typically locative), revealing to what extent they differ from each other.
In this paper, we describe the process of developing a multilayer semantic annotation scheme desi... more In this paper, we describe the process of developing a multilayer semantic annotation scheme designed for extracting information from a European Portuguese corpus of news articles, at three levels, temporal, referential and semantic role labelling. The novelty of this scheme is the harmonization of parts 1, 4 and 9 of the ISO 24617 Language resource management - Semantic annotation framework. This annotation framework includes a set of entity structures (participants, events, times) and a set of links (temporal, aspectual, subordination, objectal and semantic roles) with several tags and attribute values that ensure adequate semantic and visual representations of news stories.
Narrative Extraction from text is a complex task that starts by identifying a set of narrative el... more Narrative Extraction from text is a complex task that starts by identifying a set of narrative elements (actors, events, times), and the semantic links between them (temporal, referential, semantic roles). The outcome is a structure or set of structures which can then be represented graphically, thus opening room for further and alternative exploration of the plot. Such visualization can also be useful during the on-going annotation process. Manual annotation of narratives can be a complex e↵ort and the possibility o↵ered by the Brat annotation tool of annotating directly on the text does not seem su ciently helpful. In this paper, we propose Brat2Viz, a tool and a pipeline that displays visualization of narrative information annotated in Brat. Brat2Viz reads the annotation file of Brat, produces an intermediate representation in the declarative language DRS (Discourse Representation Structure), and from this obtains the visualization. Currently, we make available two visualization ...
From now to eternity, 2011
Gerundive forms, both Simple (SG) and Compound (CG), exhibit a diverse behaviour in European Port... more Gerundive forms, both Simple (SG) and Compound (CG), exhibit a diverse behaviour in European Portuguese, which is difficult to describe. They can occur in very distinct syntactic constructions (cf. Lobo 2001; Neto & Foltran 2001) and, even in the same syntactic context ...
Oslo Studies in Language, 2015
Neste artigo, discutimos um problema debatido há muito sobre a natureza aspetual de certas predic... more Neste artigo, discutimos um problema debatido há muito sobre a natureza aspetual de certas predicações, classificadas como Activities e Accomplishments (Vendler 1957, e outros). Este problema foi já colocado de maneira informal por vários autores, que assinalaram a complexidade dos Accomplishments, mas só mais recentemente houve tentativas de formalização que explicasse a alternância entre estes tipos aspetuais que é desencadeada pelas propriedades denotacionais de um dos argumentos de certos verbos. Tendo em conta alguns dados do Português Europeu, propomos que os verbos podem ter informação lexical que é relevante para a determinação da presença ou ausência de telicidade nas predicações em que ocorrem. Assim, certos traços verbais restringem a composição aspetual da predicação, mas há casos em que o perfil aspetual é definido em função do processo com- posicional envolvido, uma vez que o verbo não é marcado com esses traços. Neste trabalho, apenas foi considerada a contribuição de...
apl.org.pt
In this paper we discuss some of the most prominent semantic characteristics of deadjectival degr... more In this paper we discuss some of the most prominent semantic characteristics of deadjectival degree achievements (DA) in European Portuguese, contrasting them with their English counterparts. After presenting the two main lines of analysis developed for the ...
clunl.edu.pt
ABSTRACT: The main goal of this paper is to demonstrate that, contrary to Rothstein's (1999)... more ABSTRACT: The main goal of this paper is to demonstrate that, contrary to Rothstein's (1999) assertions, data from European Portuguese support the idea that the count/mass distinction shows up in different grammatical domains besides the nominal one. After a ...
[
Linguística, 2010
O tema central deste artigo de Chistopher Kennedy e de Beth Levin, professores nas Universidade d... more O tema central deste artigo de Chistopher Kennedy e de Beth Levin, professores nas Universidade de Chicago e de Stanford, respectivamente, é a relação entre a graduabilidade no domínio adjectival e no domínio verbal. Situando-se no âmbito da ...