Решение Сбера и НИУ ВШЭ позволит машинному обучению работать в десятки раз быстрее
Большинство задач в области анализа данных сводятся к прогнозированию на основе имеющихся данных. Это может быть задача классификации, когда нужно определить принадлежность объекта к определённому классу, или регрессии, когда нужно предсказать числовое значение. В практической работе часто возникают ситуации, где количество классов или размерность регрессии может быть очень большой.
В таких ситуациях исследователи прибегают к градиентному бустингу — продвинутому алгоритму машинного обучения, который решает задачи классификации и регрессии. Он строит предсказание в виде ансамбля слабых моделей. Из нескольких слабых моделей в итоге получается одна, но эффективная.
Глеб Гусев, директор Лаборатории искусственного интеллекта Сбербанка:
— Наши исследователи разработали уникальный фреймворк, который позволяет расширить границы применимости градиентного бустинга. Новый алгоритм способен показывать лучшие результаты в целом ряде задач, где ранее применялись только нейросетевые подходы. Предложенный подход строится на сжимании данных перед самым времязатратным этапом — поиском оптимальной структуры дерева. Это решение откроет новые возможности для исследования моделей в области машинного обучения с целью совершенствования технологий с использованием искусственного интеллекта.
Леонид Иосипой, эксперт Центра непрерывного образования факультета компьютерных наук НИУ ВШЭ:
— Работа алгоритма градиентного бустинга похожа на гольф: чтобы загнать мяч в лунĸу, гольфист ударяет клюшкой по мячу, каждый раз исходя из предыдущего удара. Перед новым ударом гольфист смотрит на расстояние между мячом и лунĸой и стремится его сократить. Бустинг строится примерно так же: каждая новая модель стремится сократить ошибку уже построенного ансамбля моделей.
У градиентного бустинга есть проблема: в классификации с очень большим количеством классов может потребоваться практически бесконечное время на обучение модели.
Решая задачу классификации, алгоритм не просто определяет классы, которые соответствуют каждому объекту, он определяет вероятность принадлежности каждого объекта к каждому возможному классу. Таким образом, чем больше классов, на которые делятся объекты, тем больше результатов выдаёт алгоритм. Как следствие, растёт вычислительная сложность этого алгоритма.
Нашли ошибку - выделите текст с ошибкой и нажмите CTRL+ENTER
Другие материалы рубрики
Сбер трансформировал часть экосистемы юрлиц в Сбер2В
Сбер2В будет помогать бизнесу в автоматизации процессов, аналитике больших данных, работе с искусственным интеллектом и ЭДО
СберСтрахование защитила участников благотворительного забега СберПрайм Зелёный Марафон от травм
В этом году благотворительный забег, организованный Сбером пройдёт в 13-й раз«Малый бизнес – драйвер развития»: 100 лучших предпринимателей Поволжья отметили наградами Сбера
Свыше 9,2 тыс. предпринимателей Поволжья получили от Сбера выплату компенсации НДС за эквайрингновости
Сбер поддержал будущих учёных, инженеров и исследователей на Всероссийской олимпиаде школьников по математике
Пензенские заводы и импортозамещение: где брать промышленное оборудование
Третий очный модуль программы «Герои Пенzенского края» подходит в концу
Разработке собственных проектов уделялось особое внимание
Бастрыкин взял на контроль дело о льготных лекарствах в Пензенской области
Возбуждено уголовное дело
Нижний Новгород примет марафон Знание.Первые в ПФО
Мероприятие реализуется в рамках нацпроекта «Молодежь и дети»
Сбер трансформировал часть экосистемы юрлиц в Сбер2В
Сбер2В будет помогать бизнесу в автоматизации процессов, аналитике больших данных, работе с искусственным интеллектом и ЭДО
СберСтрахование защитила участников благотворительного забега СберПрайм Зелёный Марафон от травм
В этом году благотворительный забег, организованный Сбером пройдёт в 13-й раз«Малый бизнес – драйвер развития»: 100 лучших предпринимателей Поволжья отметили наградами Сбера
Свыше 9,2 тыс. предпринимателей Поволжья получили от Сбера выплату компенсации НДС за эквайрингновости
Сбер поддержал будущих учёных, инженеров и исследователей на Всероссийской олимпиаде школьников по математике
Пензенские заводы и импортозамещение: где брать промышленное оборудование
Пензенские самбисты получили путевки на первенство России на соревнованиях ПФО
Пензенские самбисты успешно выступили на первенстве ПФО

