Технология категоризации сложных черт пользователей (original) (raw)

В старых версиях браузеров сайт может отображаться некорректно. Для оптимальной работы с сайтом рекомендуем воспользоваться современным браузером.

Технология категоризации контента на основе анализа данных социальных медиа и социально-психологических данных с использованием краудсорсинговых платформ

Актуальность проекта

Современные модели предсказания сложных черт (политических убеждений, социальных установок, психологических особенностей) пользователей на основании социальных медиа основываются на анализе размеченных данных, предполагающих первичную маркировку автора текста (или другого контента) как носителя/неносителя черты. Однако специфика данных может существенно снижать качество получаемых моделей анализа социальных медиа. Решением этой проблемы является формирование технологии надежной разметки данных, необходимых для обучения алгоритмов анализа текстов социальных медиа.

Предлагаемая для разработки в проекте технология является технологией генерации надежного размеченного набора данных для дальнейшего использования в рамках обучения алгоритмов анализа текстов.

Задачи проекта:

Планируемые результаты:

Методология и технология генерации надежных размеченных наборов данных для предсказания сложных черт по социальным медиа;

Алгоритм оценки качества данных, собранных в рамках методологии с использованием краудсорсинговых платформ;

Надежные наборы данных для предсказания сложных черт.

Проект реализуется совместно с партнером

Команда проекта

Красовицкая Алиса Андреевна

Стажер-исследователь