Генератор текста | это... Что такое Генератор текста? (original) (raw)
Генератор текста — компьютерная программа, способная генерировать последовательности символов, внешне похожие на текст, но при этом, как правило, лишённые смысла (в связи с чем генераторы текста иногда называют «генераторами бреда», «генераторами шизофазии»). Тексты, созданные с помощью генераторов, являются правильными с точки зрения большинства языковых норм.
Иногда у читающего сгенерированный такой программой текст (например, использующей цепь Маркова) может сложиться впечатление, что этот текст является осмысленным, особенно если текст имеет тематику, с которой читающий слабо знаком. Например, некоторые люди не понимают философию и считают любой философский текст, содержащий большое число специфических терминов, бредом, поэтому они не могут определить искусственный характер псевдофилософского текста, написанного программой.
Существуют разные виды генераторов текста, различающиеся своими возможностями (например, некоторые из них могут самостоятельно формировать новые слова).
Применение
На данном уровне развития компьютерных технологий генераторы текста имеют небольшое практическое применение и используются в основном для развлечения и в экспериментальных целях.
Кроме того генераторы текстов достаточно широко используются при поисковой оптимизации web-сайтов, для генерации названий, описаний, а иногда и содержимого целых сайтов. Материалы, созданные при помощи генератора текстов и использующиеся в целях поисковой оптимизации, требуют обязательного тщательного отбора по критерию уникальности. Производится данный отбор при помощи специализированного программного обеспечения, имеющего различный алгоритм проверки.
Также генераторы текстов успешно используются для выявления низкого качества (а иногда и полного отсутствия) рецензирования в научных журналах. Особенно известна в этом плане программа SCIgen.
Виртуальные собеседники
Виртуальные собеседники — программы, предназначенные имитировать общение в чатах. Поскольку при этом человек не видит своего собеседника, у него может сложиться впечатление, что он переписывается с живым человеком. Тем не менее, ещё ни одному чат-боту не удавалось с успехом пройти тест Тьюринга, а программам, использующим генераторы текста, это сделать даже сложнее.
Ссылки
- ACL Special Interest Group on Natural Language Generation (SIGGEN) — научная конференция по теме, на сайте есть архив публикаций (англ.)