💬 «Яндекс» опубликовал в открытом доступе модель семейства нейросетей YandexGPT от 2025-02-26
👑 Premium-робот: получай более 20-ти торговых идей в день!
«Яндекс» опубликовал в открытом доступе модель семейства нейросетей YandexGPT
«Яндекс» опубликовал в открытом доступе YandexGPT 5 Lite Pretrain — большую языковую модель (LLM) на 8 млрд параметров с поддержкой контекста в 32 тыс. токенов, следует из релиза компании.
Отмечается, что новая модель превосходит по качеству ответов зарубежные аналоги в большинстве бенчмарков, при этом она будет полезна разработчикам и представителям бизнеса, которые смогут дополнительно обучить ее под свои задачи и не тратить время на создание собственной базовой модели.
В компании заявляют, что Pretrain-версия модели уже имеет обширные знания о мире, понимает контекст и закономерности языка. Обучение модели происходило с помощью технологий «Яндекса» в два этапа. На первом этапе модель обучали на русскоязычных и англоязычных текстах, коде, вычислениях и других данных общим объемом 15 трлн токенов — это как 2,5 млрд веб-страниц. На втором этапе использовались высококачественные данные объемом 320 млрд токенов, в том числе тексты образовательной тематики. Для обогащения знаний модели Яндекс улучшил метод отбора данных, чтобы использовать больше полезных текстовых материалов из интернета, не теряя в их качестве.
В релизе «Яндекса» также сообщается, что базовую (Pretrain) версию модели можно адаптировать под любые нужды. Она имеет максимально широкое применение и может быть использована в разработке, бизнесе и научных исследованиях. Кроме того, благодаря своей компактности YandexGPT 5 Lite Pretrain не требует больших вычислительных мощностей и будет полезна тем, кому нужна небольшая русскоязычная модель.
По сравнению с моделью предыдущего поколения, YandexGPT 4 Lite Pretrain, новая модель показывает значительный рост качества в решении математических задач и написании кода. А в сравнении с аналогичными зарубежными моделями, такими как LLaMa3.1-8B и Qwen-2.5-7B-base, YandexGPT 5 Lite Pretrain лидирует почти во всех типах задач.
«YandexGPT 5 Lite Pretrain входит в новое поколение нейросетей «Яндекса» — YandexGPT 5 — и доступна бесплатно на HuggingFace. Вторая модель семейства, YandexGPT 5 Pro, доступна представителям бизнеса на облачной платформе Yandex Cloud, а пользователям — в чате с Алисой. Это новейшая и самая мощная модель компании, прошедшая все этапы обучения.
Для обучения YandexGPT 5 Pro «Яндекс» добавил в датасет больше сложных и разнообразных примеров, усложнил задания, добавил методы обучения с подкреплением DPO (Direct Preference Optimization) и PPO (Proximal Policy Optimization), а также свою модификацию — LogDPO, повышающую стабильность обучения модели. Сам процесс обучения компания оптимизировала при помощи библиотеки YaFSDP, что позволило снизить потребность в вычислительных ресурсах на 25%», - говорится в релизе.
Ограничение / снятие ответственности (дисклеймер): Вся информация на этом сайте предоставляется исключительно в информационных целях и не является предложением или рекомендацией к покупке, продаже или удержанию каких-либо ценных бумаг, акций или других финансовых инструментов. Авторы контента не несут ответственности за действия пользователей, основанные на предоставленной информации. Пользователи обязаны самостоятельно оценивать риски и проконсультироваться со специалистами перед принятием каких-либо инвестиционных решений. Вся информация на сайте может быть изменена без предварительного уведомления.
Свежие новости по теме: Российский рынок акций
-
Акции и компании Московской Биржи
АФК Система РСБУ 9 мес 2025 г: выручка ₽29,01 млрд (-11,3% г/г), чистая прибыль ₽35,81 млрд (рост в 16,3 раза г/г)
2025-11-27 просмотры: 338 -
Акции и компании Московской Биржи
АФК Система МСФО 3 кв. 2025 г: выручка 355,3 млрд руб. (+13,4% г/г), чистый убыток 52,9 млрд руб
2025-11-27 просмотры: 350 -
Акции и компании Московской Биржи
Правление Газпрома утвердило две комплексные программы модернизации на 2026-2030 годы — компания
2025-11-27 просмотры: 326 -
Акции и компании Московской Биржи
Магнит Отчет РСБУ
2025-11-27 просмотры: 388 -
Акции и компании Московской Биржи
Магнит РСБУ 9 мес 2025 г: выручка ₽309,05 млн (+0,1% г/г), чистая прибыль ₽4,01 млрд (снижение в 8,7 раза г/г)
2025-11-27 просмотры: 302 -
Акции и компании Московской Биржи
Индекс Мосбиржи увеличил падение до 1,5% после пресс-конференции Путина
2025-11-27 просмотры: 252 -
Акции и компании Московской Биржи
ОПЕК+ оставит уровни добычи нефти без изменений на заседании в воскресенье и согласует механизм оценки максимальных производственных мощностей членов альянса — Reuters
2025-11-27 просмотры: 280 -
Акции и компании Московской Биржи
Ростелеком увеличил свою долю с 25,67% до 53,8% в разработчике цифровой платформы для e-commerce Imredi
2025-11-27 просмотры: 391 -
Акции и компании Московской Биржи
Мы ожидаем, что результаты Транснефти за 3кв25 практически не изменятся относительно 2кв25: выручка 356 млрд ₽, EBITDA 148 млрд ₽, чистая прибыль 73 млрд ₽ - Ренессанс Капитал
2025-11-27 просмотры: 328