Алгоритмы, дискретная математика и пр.'s Journal (original) (raw)

7:35p

Подскажите, пожалуйста, какой-нибудь общеизвестный резвый алгоритм кластеризации кучи (~сотни тысяч) коротких (~10 элементов) последовательностей со взвешенными элементами (чем больше вес, тем больше вероятность, что 2 последовательности, содержащие такой элемент - похожи).

Искал по запросам типа clustering short strings, ничего особенно хорошего не нашел.
Пока сам поразмыслю, но и прогресс мировой науки с удовольствием окину взглядом.

(3 Comments |Comment on this)