Алгоритмы, дискретная математика и пр.'s Journal (original) (raw)
7:35p
Подскажите, пожалуйста, какой-нибудь общеизвестный резвый алгоритм кластеризации кучи (~сотни тысяч) коротких (~10 элементов) последовательностей со взвешенными элементами (чем больше вес, тем больше вероятность, что 2 последовательности, содержащие такой элемент - похожи).
Искал по запросам типа clustering short strings, ничего особенно хорошего не нашел.
Пока сам поразмыслю, но и прогресс мировой науки с удовольствием окину взглядом.