Watset — это метод кластеризации данных, группирующий близкие объекты. Исследования показывают высокую эффективность метода Watset для построения синсетов — множеств синонимов из зашумлённых слабоструктурированных данных. Синсеты полезны при решении задач машинного понимания текста.

Данная демонстрация показывает применение метода Watset к решению задачи разрешения лексической многозначности. Используются данные русского Викисловаря для построения синсетов и анализатор mystem для лемматизации и морфологического разбора текстов.