Размер шрифта:AAA
Цвета сайта:ЦЦЦ
ИзображенияВкл.Выкл.
Настройки
Обычная версия

Популярное

Новости

Саратовцы принимают заказы на луговую землянику
Саратовцы принимают заказы на луговую землянику
20:55, 14 июня 2026
В Саратове бил огромный коммунальный фонтан
В Саратове бил огромный коммунальный фонтан
20:39, 14 июня 2026
В Энгельсе продают парк динозавров
В Энгельсе продают парк динозавров
20:23, 14 июня 2026
Саратовскую певицу предложили отправить на «Интервидение»
Саратовскую певицу предложили отправить на «Интервидение»
20:00, 14 июня 2026
Саратовцы освоят новый метод оздоровления с мячом «КоКоКо»
Саратовцы освоят новый метод оздоровления с мячом «КоКоКо»
19:30, 14 июня 2026
Саратовцев позвали на экскурсию по любимому месту отдыха Гагарина
Саратовцев позвали на экскурсию по любимому месту отдыха Гагарина
19:01, 14 июня 2026
Саратовский священник развеял предубеждения по поводу джинсов в храме
Саратовский священник развеял предубеждения по поводу джинсов в храме
18:40, 14 июня 2026
В школе на 1100 мест в Молодежном начали сооружать бассейн
В школе на 1100 мест в Молодежном начали сооружать бассейн
18:19, 14 июня 2026
Саратовская пенсионерка в 86 лет вышивает крестиком красоту природы
Саратовская пенсионерка в 86 лет вышивает крестиком красоту природы
17:58, 14 июня 2026
Саратовцы просят убрать стену из хлама у дороги
Саратовцы просят убрать стену из хлама у дороги
17:41, 14 июня 2026
В саратовском селе перестанут бояться похорон в дождливый день
В саратовском селе перестанут бояться похорон в дождливый день
17:20, 14 июня 2026
Российские мастера создают сувениры с культурным кодом Саратовской области
Российские мастера создают сувениры с культурным кодом Саратовской области
17:01, 14 июня 2026
В Саратовской области посчитают краснокнижных стрепетов
В Саратовской области посчитают краснокнижных стрепетов
16:39, 14 июня 2026
Саратовский министр перечислила дачные радости на Волге
Саратовский министр перечислила дачные радости на Волге
16:20, 14 июня 2026
В Саратове подход к подъезду завалили спиленными деревьями
В Саратове подход к подъезду завалили спиленными деревьями
15:59, 14 июня 2026
Саратовские «огненные молодожены» стали родителями
Саратовские «огненные молодожены» стали родителями
15:40, 14 июня 2026
В Саратовской области на площадки для дворового спорта выделили 40 миллионов рублей
В Саратовской области на площадки для дворового спорта выделили 40 миллионов рублей
15:19, 14 июня 2026
Саратовские ветеринары спасли котенка с травмой глаза
Саратовские ветеринары спасли котенка с травмой глаза
15:00, 14 июня 2026
Саратовские школьники в каникулы помогают бойцам СВО
Саратовские школьники в каникулы помогают бойцам СВО
14:39, 14 июня 2026
Опубликованы адреса подвоза воды во время масштабного отключения в Саратове
Опубликованы адреса подвоза воды во время масштабного отключения в Саратове
14:20, 14 июня 2026
В саратовской библиотеке поселились лисички и зайки известной мастерицы
В саратовской библиотеке поселились лисички и зайки известной мастерицы
14:01, 14 июня 2026
Грозы и сильные дожди принесут в Саратовскую область похолодание
Грозы и сильные дожди принесут в Саратовскую область похолодание
13:39, 14 июня 2026
В Саратовской области пройдет 500-километровый крестный ход
В Саратовской области пройдет 500-километровый крестный ход
13:20, 14 июня 2026

Нейросетевая модель способна генерировать тексты на 61 языке

20 июля 2023, 15:41
3071
Сбер открыл доступ к нейросетевой модели генерации текста для русского языка ruGPT-3.5 13B. Её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B - самую большую из семейства многоязычных моделей Сбера, способную генерировать тексты на 61 языке. Обе модели доступны на HuggingFace, и их могут использовать все разработчики (модели опубликованы под открытой лицензией MIT*).

ruGPT-3.5
 
Внутри GigaChat находится целый ансамбль моделей - NeONKA (NEural Omnimodal Network with Knowledge-Awareness). Для его создания нужно было выбрать базовую языковую модель, которую потом можно было обучать на инструктивных данных. Russian Generative Pretrained Transformer версии 3.5 с 13 млрд параметров (ruGPT-3.5 13B) - новая версия нейросети ruGPT-3 13B.
 
Это современная модель генерации текста для русского языка на основе доработанной исследователями Сбера архитектуры GPT-3 от OpenAI. Модель ruGPT-3.5 13B содержит 13 миллиардов параметров и умеет продолжать тексты на русском и английском языках, а также на языках программирования. Длина контекста модели составляет 2048 токенов. Она обучена на текстовом корпусе размером около 1 Тб, в который, помимо уже использованной для обучения ruGPT-3 большой коллекции текстовых данных из открытых источников, вошли, например, часть открытого сета с кодом The Stack от коллаборации исследователей BigCode и корпусы новостных текстов. Финальный чекпоинт модели - это базовый претрейн для дальнейших экспериментов.
 
Модель также доступна на российской платформе ML Space в хабе предобученных моделей и датасетов DataHub. В обучении модели участвовали команды SberDevices и Sber AI при поддержке Института искусственного интеллекта AIRI.
 
mGPT
 
Также в открытом доступе опубликована многоязычная модель mGPT 13B под открытой лицензией MIT. Версия mGPT 13B содержит 13 млрд параметров и способна продолжать тексты на 61 языке, включая языки стран СНГ и малых народов России. Длина контекста модели составляет 512 токенов. Она была обучена на 600 Гб текстов на разных языках, собранных из очищенных и подготовленных датасетов multilingual C4 и других открытых источников.
 
Модель может использоваться для генерации текста, решения различных задач в области обработки естественного языка на одном из поддерживаемых языков путем дообучения или в составе ансамблей моделей.
 
Модель также доступна на российской платформе ML Space в хабе предобученных моделей и датасетов DataHub.
 
Андрей Белевцев, старший вице-президент, CTO, руководитель блока «Технологии» Сбербанка:
«Сбер как ведущая технологическая компания выступает за открытость технологий и обмен опытом с профессиональным сообществом, ведь любые разработки и исследования имеют ограниченный потенциал в замкнутой среде. Поэтому мы уверены, что публикация обученных моделей подстегнет работу российских исследователей и разработчиков, нуждающихся в сверхмощных языковых моделях, создавать на их базе собственные технологические продукты и решения. Пробуйте, экспериментируйте и обязательно делитесь полученными результатами».
 
*Лицензия MIT (англ. MIT License) - лицензия открытого и свободного программного обеспечения, разработанная Массачусетским технологическим институтом.

Стали свидетелями интересного?

Снимайте на телефон, присылайте в редакцию, читайте на sarnovosti.ru

Поделиться в социальных сетях