Exploring the United States Presidential Debates via Text Mining (original) (raw)

This study explores the changes and developments of the United States presidential debates based on TV debate transcripts since the initiation of the presidential debates in 1960 until 2016. Via modern text mining techniques, the general and diachronic developments in the speeches of political candidates as well as differences considering language and rhetoric of the representatives of the two major parties-Democrats and Republicans are investigated. The results of the study confirm that syntactic and semantic complexity of debate speeches is getting lower over the years: the syntactical structure becomes simpler, sentences shorter, the vocabulary is getting more repetitive and common. Moreover, a tendency to more plain syntax and shorter grammatical units is indicated, that contributes to a better comprehension by a larger audience. Based on LIWC word categories and sentiment analysis results, this study indicates that until 2016 positive sentiments in candidate speeches are gradually decreasing. The 2016 debates are defined as the most negatively tuned ones with Donald Trump's negativity scores higher than any other presidential candidate over the 12 years of TV debates. Zusammenfassung In dieser Masterarbeit werden die Veränderungen und Entwicklungen der US-Präsidentschaftsdebatten basierend auf TV-Debattentranskripten in den Jahren 1960 bis 2016 untersucht. Mit Hilfe moderner Text-Mining-Techniken werden die allgemeinen und diachronen Entwicklungen in den Reden politischer Kandidaten sowie Unterschiede in Sprache und Rhetorik zwischen Demokraten und Republikaner analysiert. Die Ergebnisse der Studie zeigen, dass sich die syntaktische und semantische Komplexität der Debattenreden im Laufe der Jahre verringerte: die syntaktische Struktur wurde einfacher, Sätze wurden kürzer, der Wortschatz wurde repetitiver. Darüber hinaus wird eine Tendenz zu einer einfacheren Syntax und kürzeren grammatikalischen Einheiten aufgezeigt, die zu einem besseren Verständnis für ein größeres Publikum beitragen könnte. Basierend auf LIWC-Wortkategorien und Ergebnissen der Sentiment-Analyse wurde festgestellt, dass bis 2016 die positiven Sentiments in den Reden der Kandidaten graduell abnehmen. George W. Bush and even more during the Trump's election in 2016 (Lim, 2008). Simpler language in speeches may signal an attempt to address a broader, less educated audience and to satisfy the demands of "sound bite" journalism (Hallin, 1992), but may also be a way to address the demands of the spoken genre, where high complexity increases the risk of ambiguity (Vrana and Schneider, 2017). Most of current researches applying diverse modern text mining methods and focused either on the debates of one specific election cycle (María and Palacios,