Corpora with Special Markup for Studying Concept Statistics (original) (raw)
Изучение статистики концептов предполагает работу с размеченными корпусами. В принципе, такая разметка может быть только ручной на основе экспертных оценок с привлечением нескольких экспертов. Однако в ряде случаев такая возможность исключена, и разметка делается одним разметчиком – автором исследования. Экспликация принципов разметки и воспроизводимые количественные закономерности (покрытие 80 % использования концептов 7 ± 2 из них), полученные на материале русского, китайского, французского, английского языков семью разметчиками (6 русскими и 1 китаянкой, 6 девушками и 1 юношей), дают основание считать такую разметку удовлетворительной.