Параллельный алгоритм кластеризации данных для многоядерных ускорителей Intel MIC
Речкалов Т.В., Цымблер М.Л.

Алгоритм PAM (Partitioning Around Medoids) представляет собой разделительный алгоритм кластеризации, в котором в качестве центров кластеров выбираются только кластеризуемые объекты (медоиды). Кластеризация на основе техники медоидов применяется в широком спектре приложений: сегментирование медицинских и спутниковых изображений, анализ ДНК-микрочипов и текстов и др. На сегодня имеются параллельные реализации PAM для систем GPU и FPGA, но отсутствуют таковые для многоядерных ускорителей архитектуры Intel Many Integrated Core (MIC). В настоящей статье предлагается новый параллельный алгоритм кластеризации PhiPAM для ускорителей Intel MIC. Вычисления распараллеливаются с помощью технологии OpenMP. Алгоритм предполагает использование специализированной компоновки данных в памяти и техники тайлинга, позволяющих эффективно векторизовать вычисления на системах Intel MIC. Эксперименты, проведенные на реальных наборах данных, показали хорошую масштабируемость алгоритма.

Ключевые слова: кластеризация, медоид, параллельный алгоритм, OpenMP, Intel Xeon Phi, представление данных в памяти, векторизация вычислений.

Название статьи, аннотация и ключевые слова на английском языке

  • Речкалов Т.В. – Южно-Уральский государственный университет, Высшая школа электроники и компьютерных наук, просп. Ленина, 76, 454080, Челябинск; аспирант, e-mail: trechkalov@yandex.ru
  • Цымблер М.Л. – Южно-Уральский государственный университет, Высшая школа электроники и компьютерных наук, просп. Ленина, 76, 454080, Челябинск; начальник отдела, e-mail: mzym@susu.ru