Документ описывает методы автоматической кластеризации слов, анализируя контексты их употребления в коллекции русскоязычных текстов объемом 17000 документов. Рассматриваются синтаксические контексты, меры смыслового сходства и проблемы неоднозначности слов, а также предлагается алгоритм для выделения кластеров схожих по смыслу слов. В конце приводится обзор существующих решений и необходимость дальнейшего изучения выявленных проблем.