20 июля 2023, 11:43

Сбер открыл доступ к модели генерации текста для русского языка ruGPT-3.5 и расширенной версии нейросети mGPT, способной генерировать тексты на 61 языке

Обе модели доступны на HuggingFace, и их могут использовать все разработчики

Сбер открыл доступ к нейросетевой модели генерации текста для русского языка ruGPT-3.5 13B. Её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B — самую большую из семейства многоязычных моделей Сбера, способную генерировать тексты на 61 языке. Обе модели доступны на HuggingFace, и их могут использовать все разработчики (модели опубликованы под открытой лицензией MIT*).

ruGPT-3.5

Внутри GigaChat находится целый ансамбль моделей — NeONKA (NEural Omnimodal Network with Knowledge-Awareness). Для его создания нужно было выбрать базовую языковую модель, которую потом можно было обучать на инструктивных данных. Russian Generative Pretrained Transformer версии 3.5 с 13 млрд параметров (ruGPT-3.5 13B) — новая версия нейросети ruGPT-3 13B.

Это современная модель генерации текста для русского языка на основе доработанной исследователями Сбера архитектуры GPT-3 от OpenAI. Модель ruGPT-3.5 13B содержит 13 миллиардов параметров и умеет продолжать тексты на русском и английском языках, а также на языках программирования. Длина контекста модели составляет 2048 токенов. Она обучена на текстовом корпусе размером около 1 Тб, в который, помимо уже использованной для обучения ruGPT-3 большой коллекции текстовых данных из открытых источников, вошли, например, часть открытого сета с кодом The Stack от коллаборации исследователей BigCode и корпусы новостных текстов. Финальный чекпоинт модели — это базовый претрейн для дальнейших экспериментов.

Модель также доступна на российской платформе ML Space в хабе предобученных моделей и датасетов DataHub. В обучении модели участвовали команды SberDevices и Sber AI при поддержке Института искусственного интеллекта AIRI.

mGPT

Также в открытом доступе опубликована многоязычная модель mGPT 13B под открытой лицензией MIT. Версия mGPT 13B содержит 13 млрд параметров и способна продолжать тексты на 61 языке, включая языки стран СНГ и малых народов России. Длина контекста модели составляет 512 токенов. Она была обучена на 600 Гб текстов на разных языках, собранных из очищенных и подготовленных датасетов multilingual C4 и других открытых источников.

Модель может использоваться для генерации текста, решения различных задач в области обработки естественного языка на одном из поддерживаемых языков путём дообучения или в составе ансамблей моделей.

Модель также доступна на российской платформе ML Space в хабе предобученных моделей и датасетов DataHub.

Андрей Белевцев, старший вице-президент, CTO, руководитель блока «Технологии» Сбербанка:

— Сбер как ведущая технологическая компания выступает за открытость технологий и обмен опытом с профессиональным сообществом, ведь любые разработки и исследования имеют ограниченный потенциал в замкнутой среде. Поэтому, мы уверены, что публикация обученных моделей подстегнёт работу российских исследователей и разработчиков, нуждающихся в сверхмощных языковых моделях, создавать на их базе собственные технологические продукты и решения. Пробуйте, экспериментируйте и обязательно делитесь полученными результатами.

Нашли ошибку - выделите текст с ошибкой и нажмите CTRL+ENTER

Другие материалы рубрики

Все материалы

18.02.2026 Кирилл Меньшов: отраслевые полигоны — важный инструмент для развития финансовой ИТ-инфраструктуры

Фокус сместился с микросервисных платформ на более широкий инфраструктурный слой и системное ПО

Сбер: Для борьбы с телефонным мошенничеством нужно объединять усилия и технологии банков, операторов связи и правоохранительных органов

18.02.2026 Сбер: Для борьбы с телефонным мошенничеством нужно объединять усилия и технологии банков, операторов связи и правоохранительных органов

На Уральском форуме «Кибербезопасность в финансах» завершилась собственная сессия Сбера «Кибермошенничество. К барьеру!»

18.02.2026 Баланс выгоды, наполнения и цены: СберПрайм признан самой сбалансированной мультисервисной подпиской в России

18.02.2026 В Пензе топ вакансий февраля 2026 пополнился слесарем-ремонтником

18.02.2026 Образовательная платформа Skillbox.by: программы будущего уже сегодня

18.02.2026 Онлайн-курсы Skillbox.kz: как получить востребованную профессию без отрыва от работы

Смотреть все

Последние новости

04.02.2026

«Защитники Отечества» и «Диалог Регионы» запустили обучающую программу «Слышать. Говорить. Помогать»

18.02.2026

Баланс выгоды, наполнения и цены: СберПрайм признан самой сбалансированной мультисервисной подпиской в России

18.02.2026

Пензенская область ищет Народных победителей проекта «Гордость»

18.02.2026

В Пензе суд рассмотрит дело об организации незаконной миграции

18.02.2026

В Пензу прибыл заместитель полпреда в ПФО Александр Тихонов

18.02.2026

Сбер: Для борьбы с телефонным мошенничеством нужно объединять усилия и технологии банков, операторов связи и правоохранительных органов

18.02.2026

На дороги Пензы вернут маршрут №88Т

18.02.2026

Пензенцы завоевали 20 медалей чемпионата и первенства ПФО по киокусинкай

18.02.2026

Масленица в Пензе 2026: где сожгут чучело 22 февраля

18.02.2026

Кирилл Меньшов: отраслевые полигоны — важный инструмент для развития финансовой ИТ-инфраструктуры

18.02.2026

В Пензенской области расширят формат службы «социальных нянь»

18.02.2026

В Пензе перекроют дорогу у парка Белинского

18.02.2026

Пензенцы смогут воспользоваться «гаражной амнистией» и после сентября 2026 года

18.02.2026

В Пензе 175 детей-сирот получили квартиры в 2025 году

18.02.2026

Пензенские самозанятые могут получать больничные

18.02.2026

Пенза представлена на старте эстафеты флага конкурса «Мастер года»

19.02.2026

В Пензе дочь угрожала убить мать ножом

19.02.2026

В Городище укушенный в лицо бездомной собакой мальчик получил 100 тысяч рублей

19.02.2026

В Колышлейском районе из-за неосторожного обращения с огнем сгорел дом

19.02.2026

Житель Неверкинского района пожаловался в прокуратуру на заснеженную дорогу

Больше новостей

Прямая линия

В приемной газеты «Пензенская правда» представители региональной власти отвечают на вопросы читателей

Все фотографии

Фото

Все фотографии

«Лыжня России» в Пензе (14.02.2026): фотоотчет

Лыжный спорт в Пензенской области очень популярен

Крещение в Заречном (19.01.2026) — фотоотчет

В ночь на 19 января 2026 года в Заречном прошли крещенские купания

Все видеоролики

Видео

Все видеоролики

«Бессмертный полк онлайн» (2025)

Вся страна, весь советский народ поднялся на защиту родной земли от фашистских захватчиков

Анна Китаева «Каким ты был» (фестиваль «Редакция-2025»)

Помогали ей артисты студии танца «Поволжье»

Общество Происшествия Культура Здоровье Образование Экономика Спорт Власть

Общество

Все новости

04.02.2026 «Защитники Отечества» и «Диалог Регионы» запустили обучающую программу «Слышать. Говорить. Помогать»

Партнером проекта на муниципальном уровне выступила Всероссийская ассоциация развития местного самоуправления

19.02.2026 Житель Неверкинского района пожаловался в прокуратуру на заснеженную дорогу

Местами высота снега доходила до одного метра

18.02.2026 Пензенские самозанятые могут получать больничные

18.02.2026 В Пензе 175 детей-сирот получили квартиры в 2025 году

18.02.2026 Пензенцы смогут воспользоваться «гаражной амнистией» и после сентября 2026 года

18.02.2026 В Пензе перекроют дорогу у парка Белинского

Смотреть все

Происшествия

Все происшествия

19.02.2026 В Колышлейском районе из-за неосторожного обращения с огнем сгорел дом

Об этом рассказали в МЧС

19.02.2026 В Городище укушенный в лицо бездомной собакой мальчик получил 100 тысяч рублей

Права ребенка отстаивала прокуратура

19.02.2026 В Пензе дочь угрожала убить мать ножом

18.02.2026 В Пензе суд рассмотрит дело об организации незаконной миграции

18.02.2026 В Пензе осудили экс-начальника склада за кражу крышек для банок

18.02.2026 В МЧС назвали одинаковую причину нескольких пожаров в Пензенской области

Смотреть все

Культура

Все новинки

18.02.2026 Масленица в Пензе 2026: где сожгут чучело 22 февраля

Публикуем подробную программу

16.02.2026 Фокусник провел 3-часовой марафон в помощь 5-летнему пензенцу

Ранее мальчику помогла блогер Оксана Самойлова

14.02.2026 7 лучших идей, куда сходить в Пензе 15 февраля 2026: афиша воскресенья

13.02.2026 Рокер Горшенев рассказал, чего недостает пензенцам

13.02.2026 В Пензе прошел студенческий бал «Созвучие талантов»

11.02.2026 Житель пензенского поселка слепил из снега гигантскую лошадь

Смотреть все

Здоровье

Все события

17.02.2026 Новую поликлинику в Кузнецке готовят к открытию

Ведется процедура лицензирования

16.02.2026 Пензенские офтальмологи проводят операции в 3D очках

Новая система визуализации позволяет хирургу лучше видеть глаз пациента

15.02.2026 Два молодых врача-терапевта начали работать в Нижнеломовской больнице

14.02.2026 Страх ребёнка перед стоматологом: методы адаптации и безболезненного лечения

12.02.2026 Бойцы пензенских студотрядов приняли участие в донорской акции

12.02.2026 В Пензе стартовал новый этап проекта «Поколение ЛАЙТ»

Смотреть все

Образование

Все события

18.02.2026 Пенза представлена на старте эстафеты флага конкурса «Мастер года»

Мероприятие проходит в Ижевске

17.02.2026 В Пензе определили лучших в выпечке пирогов и интернет‑маркетинге

Подвели итоги регионального этапа чемпионата «Профессионалы»

12.02.2026 В Пензе роботы играли в футбол

11.02.2026 В Неверкино начался капитальный ремонт детского сада №1

11.02.2026 В Спасске начался ремонт детского сада

11.02.2026 Капитальный ремонт в школе №9 Сердобска завершат к сентябрю 2026

Смотреть все

Экономика

Все новинки

18.02.2026 Кирилл Меньшов: отраслевые полигоны — важный инструмент для развития финансовой ИТ-инфраструктуры

Фокус сместился с микросервисных платформ на более широкий инфраструктурный слой и системное ПО

18.02.2026 В Пензе топ вакансий февраля 2026 пополнился слесарем-ремонтником

18.02.2026 Образовательная платформа Skillbox.by: программы будущего уже сегодня

18.02.2026 Онлайн-курсы Skillbox.kz: как получить востребованную профессию без отрыва от работы

Смотреть все

Спорт

Все новости

18.02.2026 Пензенцы завоевали 20 медалей чемпионата и первенства ПФО по киокусинкай

Участие в соревнованиях приняли 335 атлетов

17.02.2026 Пензенские самбисты завоевали бронзовые медали международного турнира

В копилку добавили три медали

17.02.2026 Пензенец стал призером чемпионата России по армрестлингу среди лиц с ПОДА

16.02.2026 Легкоатлетки из Пензы завоевали «бронзу» первенства России

15.02.2026 От регби к баскетболу: тематический фотопроект объединил пензенские клубы

14.02.2026 В Пензе годовалая девочка стала самой юной участницей «Лыжни России»

Смотреть все

Власть

Все известия

18.02.2026 В Пензенской области подвели итоги первого года действия туристического налога

Налог введен в Пензе, Кузнецке и 24 муниципальных районах

16.02.2026 Мельниченко провел рабочую встречу с главой пензенского УФАС

Стороны обсудили итоги минувшего года

15.02.2026 Вадим Супиков: Чтим не имеющий срока давности подвиг павших при исполнении интернационального долга

15.02.2026 Олег Мельниченко: Мы всегда будем помнить подвиг тех, кто служил Родине вдали от дома

13.02.2026 Дмитрий Чернышенко обозначил приоритеты в образовании на 2026 год

13.02.2026 Вадим Супиков рассказал о Почетном гражданине региона Викторе Лазуткине

Смотреть все

Архив

Макет в газеты-23_цвет_испр_для газеты.jpg

Новости по тегам

Наверх