Размер шрифта:AAA
Цвета сайта:ЦЦЦ
ИзображенияВкл.Выкл.
Настройки
Обычная версия

Популярное

Новости

В Саратовской области объявлен месячник по благоустройству
В Саратовской области объявлен месячник по благоустройству
08:42, 22 сентября 2023
Саратовские участники СВО увидят фотовыставку «Жены героев»
Саратовские участники СВО увидят фотовыставку «Жены героев»
08:35, 22 сентября 2023
На кладбище под Саратовом при опиловке деревьев погнули оградки
На кладбище под Саратовом при опиловке деревьев погнули оградки
08:28, 22 сентября 2023
В Саратове сенаторы обсудили с участниками СВО меры поддержки
В Саратове сенаторы обсудили с участниками СВО меры поддержки
08:14, 22 сентября 2023
Саратовцам обещают солнечную и теплую пятницу
Саратовцам обещают солнечную и теплую пятницу
08:00, 22 сентября 2023
В Саратове на день закроют переезд
В Саратове на день закроют переезд
07:00, 22 сентября 2023
Саратовцы купили две дачи и занялись выращиванием конопли
Саратовцы купили две дачи и занялись выращиванием конопли
21:25, 21 сентября 2023
Владелицу детского сада в Саратове осудили за ожоги 2-летнего мальчика
Владелицу детского сада в Саратове осудили за ожоги 2-летнего мальчика
21:05, 21 сентября 2023
Саратовцам предложили найти свой дом по фото из иллюминатора самолета
Саратовцам предложили найти свой дом по фото из иллюминатора самолета
20:46, 21 сентября 2023
Саратовский футболист «пропустил» беременность жены
Саратовский футболист «пропустил» беременность жены
20:23, 21 сентября 2023
Королева студенчества из Саратова борется за титул «Мисс офис»
Королева студенчества из Саратова борется за титул «Мисс офис»
20:00, 21 сентября 2023
Выставку картин саратовского художника увидят московские артисты
Выставку картин саратовского художника увидят московские артисты
19:29, 21 сентября 2023
Родники Саратова оборудовали табличками о составе воды
Родники Саратова оборудовали табличками о составе воды
19:16, 21 сентября 2023
Для взрослых саратовцев возобновляется работа бассейнов
Для взрослых саратовцев возобновляется работа бассейнов
18:54, 21 сентября 2023
В Саратове намерены развивать территорию у набережной
В Саратове намерены развивать территорию у набережной
18:39, 21 сентября 2023
В Саратове застройщик вырыл котлован у заборов частных домов
В Саратове застройщик вырыл котлован у заборов частных домов
18:25, 21 сентября 2023
Инструктор бассейна заплатит миллион родным утонувшей девочки
Инструктор бассейна заплатит миллион родным утонувшей девочки
18:03, 21 сентября 2023
Министр сообщил о переносе сроков поставки вакцины от кори
Министр сообщил о переносе сроков поставки вакцины от кори
17:49, 21 сентября 2023
За неделю ОРВИ и гриппом заболели более 18 тысяч саратовцев
За неделю ОРВИ и гриппом заболели более 18 тысяч саратовцев
17:34, 21 сентября 2023
В Саратове пес пытался проехать зайцем в маршрутке
В Саратове пес пытался проехать зайцем в маршрутке
17:20, 21 сентября 2023
В Энгельсе сгорел дом школьной учительницы
В Энгельсе сгорел дом школьной учительницы
16:57, 21 сентября 2023
Саратовские застройщики готовы возводить школы и детские сады
Саратовские застройщики готовы возводить школы и детские сады
16:43, 21 сентября 2023
В инфекционной больнице от энтеровируса лечат 158 саратовцев
В инфекционной больнице от энтеровируса лечат 158 саратовцев
16:32, 21 сентября 2023

Нейросетевая модель способна генерировать тексты на 61 языке

20 июля 2023, 15:41
1397
Сбер открыл доступ к нейросетевой модели генерации текста для русского языка ruGPT-3.5 13B. Её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B - самую большую из семейства многоязычных моделей Сбера, способную генерировать тексты на 61 языке. Обе модели доступны на HuggingFace, и их могут использовать все разработчики (модели опубликованы под открытой лицензией MIT*).

ruGPT-3.5
 
Внутри GigaChat находится целый ансамбль моделей - NeONKA (NEural Omnimodal Network with Knowledge-Awareness). Для его создания нужно было выбрать базовую языковую модель, которую потом можно было обучать на инструктивных данных. Russian Generative Pretrained Transformer версии 3.5 с 13 млрд параметров (ruGPT-3.5 13B) - новая версия нейросети ruGPT-3 13B.
 
Это современная модель генерации текста для русского языка на основе доработанной исследователями Сбера архитектуры GPT-3 от OpenAI. Модель ruGPT-3.5 13B содержит 13 миллиардов параметров и умеет продолжать тексты на русском и английском языках, а также на языках программирования. Длина контекста модели составляет 2048 токенов. Она обучена на текстовом корпусе размером около 1 Тб, в который, помимо уже использованной для обучения ruGPT-3 большой коллекции текстовых данных из открытых источников, вошли, например, часть открытого сета с кодом The Stack от коллаборации исследователей BigCode и корпусы новостных текстов. Финальный чекпоинт модели - это базовый претрейн для дальнейших экспериментов.
 
Модель также доступна на российской платформе ML Space в хабе предобученных моделей и датасетов DataHub. В обучении модели участвовали команды SberDevices и Sber AI при поддержке Института искусственного интеллекта AIRI.
 
mGPT
 
Также в открытом доступе опубликована многоязычная модель mGPT 13B под открытой лицензией MIT. Версия mGPT 13B содержит 13 млрд параметров и способна продолжать тексты на 61 языке, включая языки стран СНГ и малых народов России. Длина контекста модели составляет 512 токенов. Она была обучена на 600 Гб текстов на разных языках, собранных из очищенных и подготовленных датасетов multilingual C4 и других открытых источников.
 
Модель может использоваться для генерации текста, решения различных задач в области обработки естественного языка на одном из поддерживаемых языков путем дообучения или в составе ансамблей моделей.
 
Модель также доступна на российской платформе ML Space в хабе предобученных моделей и датасетов DataHub.
 
Андрей Белевцев, старший вице-президент, CTO, руководитель блока «Технологии» Сбербанка:
«Сбер как ведущая технологическая компания выступает за открытость технологий и обмен опытом с профессиональным сообществом, ведь любые разработки и исследования имеют ограниченный потенциал в замкнутой среде. Поэтому мы уверены, что публикация обученных моделей подстегнет работу российских исследователей и разработчиков, нуждающихся в сверхмощных языковых моделях, создавать на их базе собственные технологические продукты и решения. Пробуйте, экспериментируйте и обязательно делитесь полученными результатами».
 
*Лицензия MIT (англ. MIT License) - лицензия открытого и свободного программного обеспечения, разработанная Массачусетским технологическим институтом.

Стали свидетелями интересного?

Снимайте на телефон, присылайте в редакцию, читайте на sarnovosti.ru

Поделиться в социальных сетях