Параллельная реализация алгоритма градиентного бустинга деревьев решений
Дружков П.Н.

Предлагается программная реализация параллельного алгоритма градиентного бустинга деревьев решений, предполагающего распределенное хранение данных и предназначенного, в первую очередь, для решения больших задач машинного обучения. Приводятся результаты вычислительных экспериментов, показавших преимущество в производительности и масштабируемости предлагаемой программной реализации над доступными открытыми реализациями при использовании выборок больших объемов. Приводятся результаты экспериментальной оценки качества, также показавшие конкурентоспособность предлагаемой реализации. Работа выполнена в рамках программы "Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007–2013 годы: (государственный контракт № 11.519.11.4015) и ФЦП "Научные и научно-педагогические кадры инновационной России на 2009–2013 годы" (государственный контракт № 14.B37.21.0393). Статья рекомендована к публикации Программным комитетом форума "Суперкомпьютерные технологии в образовании, науке и промышленности" (HPC-2012; http://agora.guru.ru/hpc2012).

Ключевые слова: дерево решений, градиентный бустинг, параллельные вычисления, MPI, распределенная память

Название статьи, аннотация и ключевые слова на английском языке

Дружков П.Н., аспирант, e-mail: druzhkov.paul@gmail.com – Нижегородский государственный университет им. Н.И. Лобачевского, факультет вычислительной математики и кибернетики, просп. Гагарина, д. 23, 603950, г. Нижний Новгород