На волне популярности искусственного интеллекта Яндекс создал собственный аналог американского ChatGPT. Новая нейронная сеть называется YandexGPT. Она предлагает примерно те же возможности, что и ее прямой конкурент.Однако разработчики акцентируют внимание на возможностях интеграции с другими сервисами Яндекса и партнеров, а также на том, что отечественная модель обучает на русскоязычном материале.
В этой статье мы проанализировали, что такое YandexGPT, на что способна новая нейронная сеть и каково ее будущее.
YandexGPT – это
Линейка генеративных моделей, разработанная Яндексом. Она предлагает стандартный функционал — обработку данных, перевод, генерацию текста по запросу и т.д. Разработчики уже выпустили 3 поколения нейронных сетей. Лучшая из них – YandexGPT 3 Pro.
Сервис искусственного интеллекта доступен всем пользователям бесплатно. Вы можете протестировать его, открыв чат с Алисой и выбрав опцию YaGPT.
Основные возможности YandexGPT
Генеративная модель Яндекса все еще находится в стадии разработки и не имеет подключения к Интернету, поэтому обладает относительно небольшим функционалом. Давайте рассмотрим основные возможности генеративного ИИ от Яндекса.
Генерация текста
Нейронная сеть способна генерировать простые тексты на заданную тему. Их нельзя назвать креативными, но они подходят для решения определенных задач. Чтобы протестировать возможности ИИ, мы попросили его составить приглашение отпраздновать Новый год вместе.
Преимуществом YaGPT является создание шаблонов. Для некоторых тем нейронная сеть оставляет “пустые поля”, заполненные пользователем. Вам не нужно вручную оформлять приглашение, вам просто нужно указать адрес и имена.

Перевод текста
Базовая версия нейронной сети по-прежнему поддерживает общение только на русском языке.Однако он может переводить текст с иностранных языков на русский и наоборот.
Ответы на вопросы
Это по-прежнему остается главным “слабым местом” нейронной сети. Разработчики YandexGPT, как и ChatGPT, не подключали искусственный интеллект к Интернету. Он берет данные только из обучающих наборов данных. Последнее обновление информации было в 2023 году. Из-за этого нейронная сеть не может ответить на соответствующие вопросы, потому что данных просто нет.
Преимущество ИИ – честность. Если данных нет, то YandexGPT не галлюцинирует и не выдает заведомо ложный ответ.

Создание контента на основе заданных тем
Пока нейронная сеть работает только с текстом. Мы попросили ее написать эссе на заданную тему. Искусственный интеллект справился с задачей и выполнил дополнительное требование в 150 слов.
Генеративная модель также способна генерировать стихи, посты для социальных сетей и т.д. Однако следует иметь в виду, что искусственный интеллект пока не так хорош в сложных творческих нишах.Например, сгенерированное стихотворение не соответствует требованиям стихосложения, рифмовки.
Обработка и анализ больших объемов данных
На вопрос о навыках анализа больших данных чат-бот сразу ответил, что он этим не занимается и предлагает использовать сторонние решения. Это связано с тем, что обработка больших объемов данных в режиме переписки невозможна. Пользователь просто не сможет загрузить всю информацию. Например, в случае с ChatGPT требуется сторонний расширенный плагин для анализа данных.
Однако нейронная сеть по-прежнему способна анализировать данные и предлагать решение проблемы, связанной с обработкой данных.
Искусственный интеллект дал правильный ответ, но допустил одну ошибку. Как указано в ответе HSE, способ распределения и медианное значение одинаковы и равны 3.
Технические особенности
Мы рассмотрим нюансы генеративной модели, не вникая в тонкости, понятные только специалистам.
Архитектура модели
В основе YaGPT лежит архитектура Transformer, разработанная командой Google Brain. Она состоит из 2 компонентов:
- Кодирующего. Он получает векторизованную последовательность с информацией о местоположении.
- Декодирование. Обрабатывает часть последовательности на выходе кодера.
Оба компонента состоят из слоев.Они последовательно передают и обрабатывают данные, пока информация не достигнет последнего слоя.
Обучение и наборы данных
Специалисты Яндекса использовали 2 типа данных для обучения языковой модели:
- Информация из Интернета.
- Ответы от ИИ-тренеров.
Такой подход позволяет контролировать качество ответов и предотвращать проблемы, с которыми сталкиваются разработчики других ИИ-сервисов (например, поддельные или предвзятые ответы).Однако из-за этого YandexGPT не может общаться на свежие темы, в отличие от нейронных сетей Google и Bing.
Алгоритмы и технологии, используемые в YandexGPT
YaGPT основан на модифицированном алгоритме GPT-3, способном выполнять широкий спектр задач, включая перевод, написание текста. Для оценки качества большой языковой модели разработчики создали YaMMLU_ru, русскоязычную версию бенчмарка MMLU.
Интеграция с другими сервисами и инструментами Яндекса
Преимуществом решения Яндекса является интеграция с другими сервисами компании.