EN RU

Обзор существующих AI-агентов

В данном документе представлена структурированная информация о наиболее распространённых и практически применимых системах AI-агентов, сгруппированная по регионам: Россия, США, Европа и остальной мир. Каждый раздел содержит обзорную таблицу с ключевыми характеристиками популярных AI-агентов региона – включая тип агента, компанию/продукт, решаемые задачи, год появления, используемые технологии AI, использование баз знаний (RAG/граф), поддерживаемые языки и ориентировочную стоимость. После таблицы даётся подробный разбор каждого агента: описываются его основные функции и сферы применения, преимущества по сравнению с аналогами, недостатки, отзывы независимых источников, а также краткое резюме. Стиль изложения – формальный, технически точный, с опорой на достоверные данные и нормативные формулировки.

1. AI-агенты в России

Таблица 1 – Основные AI-агенты в России (отсортировано по типу агента)

Тип агентаКомпания / СервисЗадачи и применениеГод запускаОсновные технологии (AI-модели)Хранилище знаний / RAGЯзыкиОриентировочная стоимость
Автономная мультиагентная системаMTS / MWS AgentАвтоматизация бизнес-процессов: аналитика, веб-разработка, планирование командировок2025Оркестратор LLM MWS GPT + специализированные подагентыПодключение к интернет-источникам (web-research); внутренняя база данных MWSRU (интерфейс)Тестирование (пилотный проект)
Виртуальный помощник (банковский)Tinkoff / ОлегФинансовые и бытовые сервисы: переводы, бронирования, оплата услуг, голосовой секретарь2019Нейросеть, обученная на данных Рунета; ASR/TTSБаза знаний Tinkoff; анализ открытых данных (обучение на диалогах)RUБесплатно для клиентов (в приложении банка)
Виртуальный помощник (общего назначения)Yandex / АлисаГолосовой ассистент для пользователя: поиск, разговор, управление устройствами, справочная информация2017Нейросеть (многослойная); LLM YandexGPT-3 интегрирован c 2024Поисковый индекс Яндекса, собственный knowledge graph; цитирование источников из интернетаRUБесплатно (в приложениях Yandex; Alice Pro – подписка для бизнеса)
Виртуальный помощник (общего назначения)VK / МарусяГолосовой ассистент для пользователя: поиск, медиа, детские игры, умный дом, интеграция с соцсетью VK2019Нейросеть самообучающаяся; ASR/TTSПоиск Mail.ru (интернет-ответы); память для пользователя (“Маруся, запомни”)RUБесплатно (в приложениях VK и устройствах)
Виртуальный помощник (общего назначения)Sber / СалютГолосовой ассистент для экосистемы Сбера: диалог, поиск, финансовые операции, умный дом, бизнес-сервисы2020NLP-платформы SmartNLP/Speech; LLM ruGPT-3 13B; интеграция LLM GigaChat (2023)GigaSearch – фактический поиск для ответа; базы данных СбераRUБесплатно (в прилож. «Сбербанк Онлайн», устройства Сбер)
Платформа диалоговых AI-ботов (конструктор)Just AI / Aimylogic*Создание навыков и ботов для голос. помощников (Алиса, Маруся и др.), автоматизация диалогов в бизнесе2021*Облачная NLP-платформа, шаблоны диалоговБаза знаний из сценариев, подключение API компанийRUFreemium (базово бесплатно, бизнес-расширения)

Примечание: Aimylogic включён как пример конструктора навыков (поддерживает Марусю, Алису и др.). Год указан по публичному запуску интеграции (начало 2021 г.).

1.1 MWS Agent (MTS)

Описание и задачи: MWS Agent – перспективный автономный AI-агент, разрабатываемый компанией «МТС Web Services» для комплексной автоматизации бизнес-задач. Он способен самостоятельно выполнять сложные многоэтапные поручения без участия человека. В частности, заявлено, что MWS Agent анализирует большие объёмы данных и решает прикладные задачи: от финансового анализа до организации поездок. В пилотных сценариях агент справляется с аналитикой, визуализацией данных, разработкой веб-сайтов, патентным поиском, а также решением административных вопросов (например, планирование командировок).

Технологии: Ядром системы является оркестратор на базе большой языковой модели MWS GPT, который принимает запрос на естественном языке и разветвляет его на подзадачи для группы узкоспециализированных агентов. Специализированные агенты отвечают за конкретные типы задач: генерацию программного кода, логическое рассуждение, веб-поиск и пр., обеспечивая модульность и масштабируемость решения. Такой мультиагентный подход должен повышать точность выполнения и адаптивность системы. MWS Agent умеет ориентироваться в контексте задачи и при необходимости корректировать план действий на основе текущих данных, демонстрируя элементы автономности и самообучения. Хранение знаний реализовано через подключение к актуальным внешним источникам – агент способен выполнять web-research (поисковые запросы в интернет) для сбора информации. Для долгосрочной памяти и эмбеддингов предполагается использование внутренней базы знаний МТС, хотя подробности (например, применение векторных БД) публично не раскрыты.

Преимущества: MWS Agent представляет новое поколение корпоративных AI-решений в РФ. Его ключевая особенность – полная автономность в выполнении сложных последовательностей действий. В отличие от классических чат-ботов или голосовых помощников, реагирующих лишь на отдельные запросы, данный агент может сам планировать решение задачи, разбивая её на этапы и исполняя каждый шаг последовательно. Это позволяет делегировать ему нестандартные или трудоёмкие задачи, экономя время сотрудников. Ожидается, что к 2027 году подобные генеративные системы смогут использовать до 50% российских компаний. Преимущество MWS Agent перед зарубежными аналогами – локальная адаптация к русскоязычным данным и интеграция в инфраструктуру МТС, учитывающая требования российских компаний (безопасность, совместимость с отечественными облачными платформами и т.д.).

Недостатки: Следует отметить, что MWS Agent находится на стадии тестирования (пилотный проект), поэтому практический опыт его внедрения ограничен. Пользователи и эксперты относятся к подобным автономным агентам с осторожностью. Отмечается проблема «галлюцинаций» LLM – агент может генерировать неправдоподобные или ошибочные выводы без проверки человеком. Скептики упоминают, что многие ИИ-«помощники» фактически представляют собой усложнённые поисковики, которые красиво формулируют информацию из интернета, но не гарантируют истинность ответа. В условиях критически важных бизнес-задач это накладывает ограничения на степень автономии: на первых порах MWS Agent, вероятно, будет действовать под надзором операторов, а не полностью самостоятельно.

Независимые отзывы: Поскольку MWS Agent был анонсирован лишь в 2025 году, развернутых пользовательских обзоров пока мало. В СМИ отмечается сам факт его создания как знаковый для российского рынка AI. В деловых сообществах выражается осторожный оптимизм: агент способен взять на себя часть рутинной аналитики и ИТ-разработки, что может повысить эффективность компаний. Одновременно на профильных форумах звучит критика концепции агентного ИИ – указываются риски неверных решений без человека и необходимость доработки технологии планирования и самокоррекции агентами. Например, в комментариях к новости о MWS Agent пользователи иронично замечают, что «ИИ-помощники очень хорошо продаются» в рекламе, однако на практике стоит задать узкопрофессиональный вопрос – и ответы модели быстро проявят свои ограничения. Подобные отзывы подчеркивают важность валидировать работу агента перед его полноценным внедрением.

Резюме: MWS Agent – инновационный мультиагентный ИИ нового поколения, ориентированный на автоматизацию широкого круга бизнес-процессов. Он сочетает единую LLM-координацию с набором специализированных исполнителей, что теоретически позволяет ему решать комплексные задачи, имитируя командную работу человека. Потенциальная выгода – значительная экономия времени сотрудников и ускорение процессов за счёт делегирования рутины ИИ. Однако технология ещё молода: на данном этапе MWS Agent требует дальнейшего тестирования и тонкой настройки, чтобы оправдать заявленные возможности. Компании планируют внимательно отслеживать результаты пилотов и, в случае успеха, постепенно интегрировать подобных агентов, формируя «гибридные» коллективы из людей и ИИ. Таким образом, MWS Agent представляет собой перспективное направление, уже демонстрирующее реальные кейсы, но нуждающееся в накоплении практического опыта и доверия со стороны бизнеса.

1.2 Олег (Tinkoff)

Описание и задачи: «Олег» – виртуальный голосовой помощник финансовой группы «Тинькофф», запущенный в 2019 году и предназначенный для автоматизации взаимодействия с клиентами банка и сопутствующих сервисов. Это специализированный AI-агент, встроенный в мобильное приложение «Тинькофф», который принимает голосовые или текстовые команды пользователей. Главная сфера применения Олега – банковские и лайфстайл-услуги. Помощник может по команде проводить платежи и переводы между счетами (как внутри Tinkoff, так и в другие банки, например Сбербанк), пополнять баланс мобильного телефона, бронировать столики в ресторанах, покупать билеты в кино с кешбэком, искать скидки и специальные предложения. Таким образом, Олег выступает единой точкой входа к сервисам экосистемы Tinkoff. Ещё одна функция – роль телефонного секретаря: при подключении услуги Олег автоматически отвечает на входящие звонки абонента, распознаёт речь звонящего, переводит разговор в текст и может самостоятельно поддерживать диалог, к примеру принять сообщение или вежливо отклонить звонок. Также Олег интегрирован с продуктами «Тинькофф Страхование» – он способен зарегистрировать страховой случай по ОСАГО/каско, задав клиенту необходимые вопросы. Ассистент предоставляет и справочную информацию, консультируя по финансовым продуктам, даёт советы и лайфхаки, некоторые из которых берёт из контента журнала «Тинькофф». Цель Олега – экономить время пользователей, выполняя их поручения быстро и автоматически.

Технологии: В основе Олега – проприетарная диалоговая AI-система, разработанная Tinkoff. По опубликованным данным, движок использует технологии синтеза и распознавания речи (ASR/TTS) и нейросетевой модуль, обученный на большом массиве открытых данных диалогов в Рунете. Это означает, что модель обучения впитала особенности реальной неформальной речи, включая жаргон и нестандартные ответы – что придало ассистенту «характер», но одновременно вызвало инциденты с неуместными репликами. Архитектура, вероятно, включает NLU для понимания намерения (определение финансовой операции или запроса), связь с backend-системами банка (API для выполнения платежей, проверки баланса и пр.), а также модули для интеграции с внешними сервисами (партнёры по бронированию столиков, билетов и т.п.). Хранение знаний реализовано через доступ к внутренним базам Tinkoff (данные счетов, транзакций) и заранее загруженным внешним данным (например, база данных ресторанов, афиша кино). Для диалогового обучения Олега использовались открытые разговорные данные рунета, что придало модели широкий контекст, но без прямого механизма RAG – ассистент не выполняет онлайн-поиск при каждом запросе, а полагается на свои обученные знания и доступ к структурированным данным банка. Дополнительно, Tinkoff заявлял о наличии собственного суперкомпьютера «Колмогоров» для обучения нейросетей – вероятно, на нём происходила подготовка модели Олега.

Преимущества: Олег стал одним из первых отраслевых AI-помощников в России, сфокусированных на банковских услугах. Его ключевое преимущество – глубокая интеграция в экосистему Tinkoff. В отличие от универсальных ассистентов (Алисы, Салюта и др.), Олег имеет доступ к данным и операциям конкретного банка, что позволяет ему мгновенно выполнять финансовые транзакции и предоставлять персональные консультации. Например, он может не только рассказать общий курс валют, но и подсказать, сколько средств на счете и хватит ли их для покупки, или предложить оформить нужный продукт. По оценкам Tinkoff, внедрение Олега снизило нагрузку на колл-центры и ускорило обслуживание клиентов: часть типовых запросов решается автоматически. Также уникальна функция «виртуального секретаря» – Олег способен отвечать на звонки вместо пользователя. Конкуренты (массовые ассистенты) подобного функционала обычно не предлагают. Олег распознаёт речь звонящего, может поддержать разговор или в шутливой форме отклонить нежелательный звонок – что повышает комфорт абонентов. В плане общения с пользователем Олег выделяется яркой личностью: разработчики придали ему образ вежливого, но немного фамильярного молодого человека, который может пошутить или проявить лёгкое недовольство, если ситуация этого требует. Такая человекоориентированность повысила интерес к помощнику, многие пользователи находили ответы Олега забавными и активно делились диалогами в соцсетях, что создало вирусный эффект вокруг запуска.

Недостатки: Стремление сделать Олега «острохарактерным» привело и к проблемам. На ранних этапах работы ассистента отмечались случаи, когда Олег выдавал неуместные или резковатые реплики. Наиболее известный инцидент – совет клиентке «отрезать пальцы» в ответ на жалобу, что датчик отпечатка не срабатывает. Данная фраза, видимо, была шуточной, но вызвала негативный резонанс. Компания принесла извинения, «провела с Олегом разъяснительную работу», и заверила, что такого больше не повторится. Этот случай подчеркнул недостаточный контроль качества выдачи нейросети, обученной на данных из открытого интернета – модель переняла стили шуток, не всегда уместные в деловом общении. Впоследствии Tinkoff скорректировал ответы, убрав чрезмерно фамильярные или грубые выражения. С технической точки зрения, ограничение Олега – его привязка только к сервисам Tinkoff. Он бесполезен вне этой экосистемы: например, не сможет помочь с вопросами по сторонним банковским продуктам или выполнить действия, не предусмотренные интеграциями Tinkoff. Кроме того, по мере усложнения запросов (не банковских) Олег может давать неточные ответы, так как не подключён к интернет-поиску в режиме реального времени. Его знания ограничены тем, чему обучен, и обновляются не мгновенно. Пользователи отмечают, что порой ассистент не распознаёт контекст или не понимает сложных формулировок – хотя со временем качество NLU улучшалось. И наконец, «виртуальный секретарь» Олег, принимающий звонки, пока воспринимает только голосовую речь – были случаи, когда он не справлялся с нестандартными диалектами или скороговоркой звонящих, что приводило к недопониманию. В таких ситуациях пользователю приходилось самому перезванивать.

Независимые отзывы: Запуск Олега получил широкий отклик в СМИ и соцсетях. Forbes и РБК отмечали новаторство идеи – банк внедрил голосового помощника с нестандартным «характером» и это выделяло Tinkoff на фоне конкурентов. В первые месяцы обсуждения в соцсетях были полны скриншотов диалогов с Олегом, где он шутил или даже слегка хамил, что вызывало как улыбки, так и критику. Некоторые эксперты указывали, что дерзкий стиль ассистента – это риск для бренда банка, ведь клиент может обидеться на неосторожную шутку. Тем не менее, многие пользователи восприняли Олега позитивно, как «живого» персонажа, отмечая удобство функций: “С Олегом реально быстрее решить вопрос, чем через оператора кол-центра” – подобные комментарии встречались на финансовых форумах. Также хвалили функцию автоответчика: предприниматели отмечали, что это помогает отсеивать спам-звонки и экономит их время. К 2020 году «Олег» обрабатывал миллионы обращений в месяц, и банк заявлял об экономии десятков тысяч часов операторов. Независимый обзор на VC.ru в 2019 г. отмечал, что Олег достаточно точно распознаёт речь и контекст, но иногда ошибается в нестандартных запросах, и тогда подключается живой сотрудник. В целом, отзывы подтвердили работоспособность концепции: аудитория оценила удобство AI-ассистента для повседневных банковских операций, хотя и посоветовала сделать его немного «вежливее».

Резюме: Олег – пример успешного узкоспециализированного AI-агента, внедрённого крупным банком. Он значительно упростил клиентам взаимодействие с финансовыми сервисами, выполняя команды голосом или текстом прямо в приложении. За счёт интеграции в системы банка Олег достигает того, что не под силу универсальным ассистентам: напрямую выполняет транзакции, учитывает персональные данные клиента и даже берёт на себя коммуникации (звонки). Его запуск продемонстрировал потенциал AI для бизнес-целей: повышение оперативности, сокращение нагрузки на персонал и новый пользовательский опыт. Опыт с Олегом также выявил уроки – необходим тщательный контроль тона ответов и ограничений модели, чтобы исключить репутационные риски. В дальнейшем Tinkoff и другие компании развивают эту идею, обучая AI-агентов на специализированных корпоративных данных с учётом корпоративной этики. Можно заключить, что Олег занял свою нишу как эффективный и уже незаменимый помощник для миллионов клиентов Tinkoff, показав направление, в котором будут двигаться финансовые организации в эпоху AI.

1.3 Алиса (Yandex)

Описание и задачи: «Алиса» – российский интеллектуальный голосовой ассистент от компании «Яндекс», официально представленный 10 октября 2017 года. Алиса доступна на различных платформах: смартфоны (Android, iOS), компьютеры (Windows) и фирменные устройства Yandex (умные колонки «Яндекс.Станция» и др.). Этот помощник выполняет широкий спектр повседневных задач для пользователя. Базовые функции включают поиск информации в интернете по запросу голосом, информирование о погоде, пробках, новостях, воспроизведение музыки и видео, запуск приложений и сервисов Яндекса (навигации, такси и пр.). Алиса также умеет просто поговорить – в неё встроен режим «болталки» на нейросети, позволяющий поддерживать непринуждённый разговор на любые темы. Эта способность отличает её от ранних голосовых помощников (Siri, Google Assistant), которые были менее разговорчивы. Ассистент интегрирован с экосистемой Яндекса: пользователь может голосом заказать такси («Алиса, вызови Такси»), найти товар на Маркете, оформить доставку еды, управлять умным домом (например, включить свет через устройства с поддержкой Яндекс) и многое другое. С мая 2018 г. запущена платформа Яндекс.Диалоги, позволяющая сторонним разработчикам создавать навыки для Алисы. За счёт этого Алиса получила тысячи «скиллов» – от игр и викторин до сервисов заказа еды и банковских консультантов. По данным Яндекса, к 2019 г. у Алисы было ~30 млн ежемесячных пользователей и 8+ млн ежедневных – она быстро заняла лидирующие позиции среди русскоязычных помощников.

Технологии: При создании Алисы Яндекс использовал свои передовые наработки в области распознавания и синтеза речи (SpeechKit) и обработки естественного языка. Первоначальная версия Алисы работала на основе глубокой нейросети (многослойной модели), способной поддерживать диалоговый контекст. Важным шагом стало внедрение генеративной языковой модели – в апреле 2024 года Яндекс объявил, что полностью перевёл Алису на собственную LLM YandexGPT 3, сделав её «первым в мире виртуальным ассистентом, полностью работающим на базе большой языковой модели». Это существенно повысило интеллектуальные возможности Алисы: она стала лучше понимать сложные вопросы и давать развёрнутые объяснения, опираясь на обобщённые знания из обучающих данных (обширного корпуса текстов). Кроме того, Алиса теперь умеет поддерживать контекст беседы – например, можно задать уточняющий вопрос без повторения темы, и ассистент поймёт связь. В новой версии реализована функция цитирования источников: если ответ получен из интернета, Алиса называет источник сведений, повышая прозрачность. Для поиска актуальной информации Алиса интегрирована с поисковым движком Яндекса и его knowledge graph – при необходимости ассистент делает запрос в интернет и на основе полученных данных формирует ответ, подкрепляя ссылками. Хранение «памяти» диалога осуществляется алгоритмами контекстного окна LLM (Алиса может помнить до 5-6 последних реплик, в Pro-версии – больше). Языковая модель YandexGPT 3 обучена на русском языке (а также на мультиязычном корпусе, но оптимизирована под RU), что обеспечивает высокое качество понимания нюансов русского языка. В архитектуру Алисы также входит система навыков – Яндекс.Диалоги: внешние навыки могут быть вызваны по ключевым словам и обрабатывают специфичные запросы (например, «закажи пиццу» – подключается навык Delivery Club). Таким образом, Алиса сочетает генеративный AI-движок для открытых диалогов и библиотеку шаблонных навыков для транзакционных команд.

Преимущества: Алиса – самый популярный голосовой AI-агент в России, во многом благодаря локальной оптимизации под российский рынок. Её преимущества включают:

  • Глубокий локальный контекст: Алиса отлично знает реалии России – от географии городов до мемов и шуток. Встроенная «личность» Алисы – молодая остроумная девушка – оказалась близка русскоязычным пользователям, что повысило естественность взаимодействия. Яндекс снабдил её уникальным чувством юмора и неформальным стилем общения, чего не было у иностранных ассистентов; это вызвало большой отклик – сразу после запуска Рунет заполнился примерами забавных диалогов с Алисой. Это сыграло на удержание пользователей: люди стали чаще обращаться к ассистенту просто «поболтать», что привило привычку использования и повысило вовлечённость аудитории. По сути, Яндексу удалось то, чего не смогли Google и Apple: сделать ассистента повседневным собеседником для широкой массы.
  • Интеграция в экосистему: Алиса бесшовно работает со всем спектром сервисов Яндекса (Поиск, Навигатор, Такси, Музыка, Маркет и пр.). Для пользователя это означает, что множество действий – от построения маршрута до заказа товаров – можно выполнить голосом без переключения между приложениями. Яндекс активно расширяет экосистему, и Алиса становится универсальным интерфейсом к ней, что удобно.
  • Открытая платформа навыков: запуск Яндекс.Диалогов позволил сторонним разработчикам добавлять навыки, и сейчас для Алисы доступны десятки тысяч интеграций. Это существенно расширило возможности ассистента – он может играть в игры, обучать навыкам, взаимодействовать с банками, службами доставки и др. Таких навыков по количеству сопоставимо или больше, чем у Amazon Alexa (где ~60 тыс. скилов, но многие невостребованы). У Алисы же популярность сторонних навыков выше, поскольку Яндекс в виджете «Диалоги» в приложении продвигает новые полезные кейсы.
  • Технологическое лидерство: перевод Алисы на LLM YandexGPT дал ощутимый рывок в качестве. Согласно пресс-релизу, после внедрения LLM доля вопросов, на которые Алиса может ответить самостоятельно, выросла с 60% до 95%. Теперь ассистент способен объяснять сложные понятия простым языком, давать подробные ответы и даже сохранять контекст между вопросами, чего ранее не было. Кроме того, появилась функция Alice Pro – продвинутый режим на базе мощной модели YandexGPT 3 Pro, предоставляющий расширенные возможности корпоративным пользователям (например, детальное редактирование текста, генерация по нескольким условиям). Яндекс позиционирует это как шаг к профессиональному применению ассистента (маркетинг, журналистика и т.п.). Таким образом, Алиса технологически догоняет мировых лидеров, а локально – превосходит конкурентов по пониманию русского языка и контексту.

Недостатки: Несмотря на успех, Алиса не лишена ограничений:

  • Привязка к русскому языку: Ассистент изначально рассчитан на русский; интерфейс и «личность» – русскоязычные. Поддержка других языков минимальна (по состоянию на 2025 г. Алиса не говорит по-английски, хотя может понимать отдельные фразы). Это делает её практически неприменимой за пределами русскоязычного пространства. В то время как Google Assistant или Siri поддерживают десятки языков, Алиса сконцентрирована на одном (для Яндекса это осознанный выбор, но глобально – ограничение).
  • Эксцесс «болтовни»: Умение беседовать – достоинство Алисы, но ранее оно же было и недостатком. В первые годы некоторые пользователи жаловались, что Алиса слишком много шутит или отвлекается от темы при просьбе дать чёткий ответ. Яндекс частично решил это, разделив режимы (короткий ответ или диалог). Тем не менее, ассистент может отвечать не строго, а в разговорной манере, что не всегда подходит, например, для деловой информации.
  • Конфиденциальность и офлайн: Алиса, как и прочие облачные ассистенты, требует интернет-подключения и отправляет голосовые данные на сервер. Некоторых пользователей это беспокоит – обсуждались вопросы приватности. Для корпоративного использования (где нужны офлайн-решения) Алиса не предназначена. Конкуренты типа Sber выпустили корпоративные версии (Salute для бизнеса), а Яндекс – нет, ограничившись Alice Pro, работающей всё равно в облаке Яндекса.
  • Аппаратные ограничения: Хотя Алиса интегрирована во многие приложения, её возможности на сторонних устройствах (не Яндекс) могут быть ограничены. Например, на Android она конкурирует с Google Assistant и не может запускаться по голосу когда телефон заблокирован (из-за ограничений ОС). На iOS – вообще работает только внутри приложения Яндекса. Полноценный голосовой опыт «везде и всегда» есть только на собственных устройствах (умные колонки). Это снижает её утилитарность за пределами экосистемы Яндекс.
  • Конкуренция навыков: С ростом навыков Яндекс.Диалогов появилась проблема качества – много навыков низкого уровня или дублирующих друг друга. Поиска по навыкам в интерфейсе нет, и пользователь может не знать об их наличии. Яндекс решает это редакторской подборкой, но всё же некоторые потенциально полезные интеграции остаются неизвестными широкой аудитории.

Независимые отзывы: Российские эксперты в области ИИ высоко оценивают Алису за адаптированность к локальным потребностям. Портал Voicebot.ai отметил, что Яндексу удалось завоевать российский рынок, во многом благодаря «местным знаниям и личности» Алисы – пользователи действительно получают удовольствие от общения с ней. Компания Just AI в обзоре отмечала, что конверсATIONALная манера Алисы привела к росту вовлечённости аудитории – люди привыкли к помощнику, используя его чаще и разнообразнее, чем конкурентов. Кроме того, упоминается, что запуск платформы навыков и умной колонки (Яндекс.Станция) быстро расширил аудиторию Алисы. В сравнительных тестах (например, журнал «Всёсмарт» в 2024 г.) Алису называли «самым развитыми предложением на российском рынке» – отмечая лучшее понимание речи, умение поддерживать диалог и богатый набор функций. Пользователи в отзывах хвалят Алису за чувство юмора и полезность: «с Алисой весело – может и анекдот рассказать, и будильник поставить». В то же время некоторые пишут о сбоях: временами ассистент может неверно распознать команду или перепутать схожие по звучанию имена (например, включить не ту музыку). В 2023–2024 гг., после выхода ChatGPT, стали появляться отзывы, что Алиса «морально устарела» по сравнению с GPT-чатами – однако интеграция YandexGPT в 2024 восстановила конкурентоспособность. Тестеры новой версии отмечают значительный прогресс: Алиса начала давать гораздо более развёрнутые и умные ответы, справляясь даже со сложными вопросами (например, объяснить научное явление или помочь придумать идею). Появились и негативные отзывы, связанные с политикой контента – Яндекс наложил ограничения на обсуждение некоторых тем (чтобы предотвратить нежелательные высказывания LLM), и это вызывало критику части пользователей, желавших полной свободы диалога. В целом же Алису продолжают воспринимать как эталон русскоязычного ассистента, и уровень удовлетворённости ею в России остается высоким.

Резюме: Яндекс.Алиса зарекомендовала себя как зрелый и массово востребованный AI-агент для русскоязычных пользователей. Её сильные стороны – естественное общение на родном языке, глубокая интеграция с широким спектром сервисов и постоянное развитие технологий (внедрение LLM, новые навыки). Алиса существенно повысила популярность голосовых технологий в России, став частью повседневной жизни – от дома (умная колонка) до автомобиля (Алиса встроена в Яндекс.Навигатор). Для бизнеса Алиса тоже открыла новые возможности – бренды создают для неё навыки, взаимодействуя с клиентами на новой платформе. В будущем ожидается дальнейшее повышение интеллектуальности ассистента и расширение его функций (например, ещё более персонализированные советы, проактивная помощь). Сдерживающие факторы – закрытость экосистемы и языковая ограниченность – могут нивелироваться, если Яндекс решит выпускать мультиязычные версии или офлайн-решения для корпораций. Но на данный момент Алиса занимает прочное лидирующее положение на своем рынке, задавая стандарт качества для всех последующих отечественных AI-агентов.

1.4 Маруся (VK)

Описание и задачи: «Маруся» – голосовой ассистент компании VK (ранее Mail.ru Group), запущенный 17 июня 2019 года. Это персональный помощник общего назначения, сопоставимый по функциям с Алисой, но интегрированный в экосистему VK. Маруся доступна через мобильные приложения (VK, Почта Mail.ru) и умные колонки VK (серия «Капсула»), а также в некоторых сторонних устройствах (например, российская версия Xiaomi Mi Smart Speaker). Основные задачи Маруси – помогать пользователю в быту и развлечениях. На момент запуска она умела искать информацию в интернете, рассказывать сказки, включать музыку с радиостанций или из плейлистов VKontakte, сообщать прогноз погоды, узнавать цены на билеты (авиа/ЖД), расписание киносеансов и т.д.. Одной из отличительных возможностей была команда «Маруся, запомни» – ассистент может сохранить произнесённую пользователем информацию в своей памяти для дальнейшего использования (например, запомнить имя любимого питомца, чтобы потом обращаться по нему). Со временем функциональность расширилась: Маруся научилась общаться с умным домом (поддерживает 60+ брендов IoT-устройств), играть в интерактивные игры (особенно детские: загадки, сказки, колыбельные), интегрировалась с соцсетью VK (можно голосом отправить сообщение или позвонить через VK, попросить прочитать новые публикации в ленте новостей). Маруся также взаимодействует с сервисами доставки (совместно с «Самокат», Delivery Club – заказать еду) и партнерскими приложениями внутри VK MiniApps. В 2020 г. VK выпустила умную колонку «Капсула» с Марусей, укрепив позиции ассистента на аппаратном рынке. Маруся позиционируется как семейный помощник: разработчики подчёркивают её ориентированность на работу с детьми – ассистент умеет развлекать и обучать ребёнка, петь колыбельные, играть в развивающие игры. По этому параметру она выгодно отличалась от Алисы в первые годы, что позволило занять нишу в семьях с детьми (в обзорах отмечалось, что дети особенно любят Марусю за её сказки и игры). Таким образом, Маруся закрывает потребности в информации, общении и бытовых услугах внутри экосистемы VK.

Технологии: Маруся разработана на основе нейросетевых технологий Mail.ru/VK. Сообщалось, что на разработку ассистента было потрачено около \$2 млн, и использовались методы машинного обучения – голосовой помощник проходит самообучение при помощи нейросетей. Голос Маруси записан актрисой озвучивания Еленой Соловьёвой, что придало ему приятный тембр и эмоциональность (Елена известна озвучанием персонажей фильмов и игр, в т.ч. роботов и ИИ, поэтому её голос выбрали для придания Марусе «души»). Архитектура Маруси включает стандартные компоненты голосового ассистента: модуль ASR (голосовое распознавание), NLU для понимания намерений, диалоговый менеджер, интеграции с API сервисов и модуль TTS (синтез речи). Для NLU Маруся, вероятно, использует собственные русскоязычные модели, обученные на диалогах и запросах (Mail.ru Group имела большой опыт в NLP, например, проект управления почтой голосом). Интернет-поиск Маруси опирается на движок Mail.ru (поисковый сервис компании) – ассистент умеет выдавать ответы, найденные в интернете, и, как указывается, «искать нужную информацию». Однако технология поиска у Mail.ru уступает по масштабам Яндексу, поэтому можно предположить, что сложные вопросы Маруся решает либо упрощённым поиском, либо отдаёт навык партнеру (в некоторых случаях могла использоваться и поисковая выдача Яндекса через API, до 2022 г., хотя официально это не заявлялось). Важная часть платформы – Aimylogic от Just AI: с начала 2021 г. VK подключила этот конструктор для создания навыков, позволив разработчикам и бизнесу переносить свои чат-боты под Марусю. Это существенно облегчило рост экосистемы навыков. Хранение знаний: Маруся поддерживает контекст в пределах сессии (может понимать ссылки типа «включи её снова», помня предыдущую песню). Также, команда «Маруся, запомни…» реализует простую долговременную память – ассистент сохраняет сказанные факты в привязке к аккаунту пользователя. Например, можно сказать «запомни, что моего кота зовут Барсик», и затем спросить: «как зовут моего кота?» – Маруся ответит по сохранённым данным. Это позволяет пользователю обучать помощника персональной информации. С технической точки зрения, такая память может храниться в облачной NoSQL-базе, где каждому аккаунту сопоставлен словарь пользовательских фактов. Что касается генеративных моделей: по состоянию на 2025 г. VK не объявляла о внедрении LLM в Марусю, хотя косвенно некоторые улучшения диалогов были. Вероятно, Маруся использует доработанные DSTC-модели для ведения диалога (с меньшим параметров, чем GPT-3), оптимизированные на развлекательный контент. Также VK могла использовать внешние языковые API (например, OpenAI) для некоторых функций, но публично эта информация не раскрывалась.

Преимущества: Маруся выгодно отличается в следующих аспектах:

  • Социальная интеграция VK: уникальная способность Маруси – взаимодействие с социальной сетью и мессенджерами VK. Она может по голосовой команде отправить сообщение другу в ВКонтакте или позвонить через VK-звонок. Также ассистент уведомляет о новых событиях в соцсети (новые посты в ленте, дни рождения друзей). Эти функции делают Марусю ближе молодежной аудитории, активно пользующейся VK: ассистент фактически становится голосовым интерфейсом соцсети. Для сравнения, Алиса не интегрирована с соцсетями, а международные помощники работают лишь со смс/WhatsApp через ограниченные сценарии.
  • Ориентация на детей и семью: разработчики явно позиционировали Марусю как «доброго друга семьи». В сравнении отмечается, что Маруся особенно хорошо ладит с детьми – она дружелюбная, умеет развлекать, обучать, рассказывать сказки перед сном. В умных колонках «Капсула» даже есть специальный «ми-ми-мишный режим» – при поглаживании колонки на её дисплее появляются «глазки», она мило моргает, подмигивает и издаёт забавные звуки. Это чисто эмоциональная фишка, но очень понравившаяся детям. Маруся умеет петь колыбельные, голосом меняя интонацию на более мягкую ночью. Таких тонкостей у конкурентов не было – Алиса, например, воспроизводит колыбельные через Яндекс.Музыку, требуя подписку, а Маруся может сама рассказать сказку своим «роботизированным» голосом (хотя и не все сказки – часть у неё тоже через записи). Благодаря этому Маруся завоевала репутацию самого «уютного» ассистента для семьи. Многие родители отмечали, что детям она нравится больше, чем Алиса, из-за большего упора на игры и доброжелательность.
  • Экосистема сервисов Mail.ru/VK: помимо соцсети, Маруся связана с сервисами VK: Музыка VK, Почта Mail.ru, умные устройства (через платформу умного дома VK). Например, она может поставить музыку из профиля пользователя VK или найти подкаст во ВКонтакте. Также она умеет читать новые письма из Почты Mail.ru и диктовать ответ (эта функциональность появилась к 2023 году). Для пользователей, активно пользующихся продуктами VK, это удобно. Следует отметить и сотрудничество с внешними партнёрами: Маруся совместно с «Самокатом» позволяет заказать продукты, с «ВТБ» – узнать курс валют, с «СберМаркетом» – оформить заказ (условно, партнерские навыки). Масштаб экосистемы VK меньше яндексовской, но VK активно развивает «суперприложение», и Маруся встроена прямо во вкладку «Сервисы» VK-приложения. Это повышает её доступность – не нужно отдельное приложение, помощник всегда под рукой.
  • Аппаратные решения VK: компания выпустила линейку смарт-колонок «VK Капсула» (обычная, Мини, недавно – Капсула Про). Это дало Марусе собственный «дом» в виде устройств с качественным звуком и мультимедиа. В колонках реализованы интересные черты: например, две мини-капсулы можно объединять в стереопару для пространственного звука. Колонки получили экран (LED матрицу) с милыми анимациями для режима общения с детьми. Наличие своих устройств укрепило позиции Маруси: по данным ритейлеров, VK-капсулы заняли около 10–15% рынка умных колонок РФ к 2022 году, и спрос на них рос. Таким образом, VK удалось закрепиться на втором месте после Яндекса.
  • Простота и обучаемость: В интерфейсе Маруси реализованы понятные подсказки и сценарии. Отзывы отмечают, что настройка ассистента интуитивна. Кроме того, VK позволила перенос навыков с других платформ – благодаря Aimylogic многие навыки Alexa и Алисы адаптировали под Марусю, расширив её возможности без больших затрат времени разработчиков.

Недостатки: У Маруси есть и объективные слабости:

  • Меньший объем знаний и слабее поиск: Поскольку Маруся опирается на собственный поиск Mail.ru, который исторически менее совершенен, сложные информационные запросы даются ей хуже, чем Алисе или Google. Если спросить статистику или факты вне её базы знаний, ответ может быть менее точным или агент вовсе не поймёт. VK не располагает сопоставимыми ресурсами индексирования интернета, что сказывается на интеллекте ассистента. Пользователи в сравнениях отмечали, что Алиса лучше справляется с энциклопедическими вопросами, тогда как Маруся иногда выдаёт краткий ответ или вовсе говорит «не знаю».
  • Ограниченная экосистема: Хотя у VK много сервисов, они не так всеобъемлющи. Например, у Яндекса есть свой такси-сервис – Алиса вызывает такси напрямую, а Маруся вынуждена пользоваться сторонним (мини-приложение такси внутри VK, которое всё равно перенаправит к агрегатору). В сравнении выяснилось, что Алиса может полностью оформить заказ такси голосом и оповестить, когда машина приехала, а Маруся делает почти всё то же, но попросит подтвердить заказ на смартфоне вручную. Такие мелочи снижают уровень автономности Маруси. Аналогично, Алиса умеет заказывать продукты через «Лавку» без помощи, а Маруся – через «Самокат», но возможно с дополнительными действиями. Банк: у Яндекса есть лицензия (Яндекс.Банк) – Алиса может сообщать баланс счёта Яндекс.Плюс, а у VK такого нет. То есть ряд транзакционных функций у Маруси отсутствуют или реализованы через партнёров и не так гладко.
  • Поддержка устройств умного дома: здесь тоже отставание – Алиса поддерживает ~170 брендов гаджетов и умеет выступать хабом (в Яндекс.Станцию встроен протокол Zigbee для прямого управления устройствами). Маруся поддерживает ~60 брендов на 2024 год и не имеет своих хаб-устройств Zigbee (колонки VK не работают как хаб). Это означает, что умный дом через Марусю имеет меньше совместимых девайсов, и если нужны датчики Zigbee – требуется отдельный хаб. Для массового пользователя эти нюансы тонки, но продвинутые пользователи умного дома предпочитают Алису за большее число совместимых устройств и сценариев.
  • Отставание в генеративном ИИ: После появления GPT-чатов Маруся оказалась менее «умной» – она не генерирует программный код, не пишет длинных текстов по творческим запросам, как это делает ChatGPT или с недавних пор Алиса (через YandexGPT). Это технологическое отставание связано с тем, что VK не представила собственную большую LLM. Они используют нейросети для диалога, но меньшего масштаба. В результате в сложных задачах (например, придумать рассказ) Маруся уступает. Это отмечают технические блогеры: мол, Маруся хороша в утилитарных вещах, но «чуда» от неё не ждите.
  • Рыночная доля и зависимость от партнёров: Несмотря на все усилия, Маруся осталась второй по популярности в РФ, существенно уступая Алисе по доле рынка (точных независимых оценок нет, но косвенно – Алиса ~80%, Маруся ~10-15%). В 2022–2023 гг. VK переживала структурные изменения, уход части специалистов, что могло замедлить развитие ассистента. Кроме того, многое в навыках Маруси зависит от сторонних партнёров – если, например, Delivery Club или «Самокат» меняют API, навык может временно не работать.

Независимые отзывы: Пользователи характеризуют Марусю как «милая, но немного более простая версия Алисы». В обзоре SkillFactory (2025) отмечается, что по отзывам родителей и детей Маруся многим понравилась больше именно своими детскими функциями. Дети быстрее идут на контакт с Марусей, она кажется им дружелюбной, тогда как Алиса воспринимается как более «саркастичная». Это подтверждают и маркетинговые материалы VK, и сторонние тесты: например, портал Sprut.ai (сообщество умного дома) в 2022 провёл опрос – многие родители выделили Марусю за сказки и игры. Вместе с тем, в технических сравнениях эксперты ставят на первое место Алису, упоминая, что Маруся «только учится» и её каталог развлечений пока меньше (около 50 игр против 380 у Алисы), а набор навыков будет расширяться. Рецензенты хвалят Марусю за интеграцию с VK: журнал «Price.ru» (2025) указывает, что если пользователь активно сидит во ВКонтакте, колонка с Марусей может быть предпочтительнее – она без проблем отправит сообщение, поставит музыку из VK и т.п., чего Алиса не делает. Также упоминается высокая точность распознавания русской речи – с акцентами и детской речью Маруся справляется даже лучше Алисы: замечено, что она не путается, когда ребёнок неправильно произносит звуки («л» вместо «р»), в то время как Алиса может не понять. Это существенный плюс для семей с маленькими детьми. В отзывах 2020–2021 годов критиковали скудность навыков: мол, «Маруся ещё мало чего умеет, кроме как музыку да сказки» – но с тех пор она научилась многому (смарт-хоум, звонки, новости). Некоторые пользователи негативно восприняли появление рекламы: периодически Маруся могла предложить послушать какой-нибудь VK-подкаст или рассказать о новой акции VK, что воспринималось как навязчиво. VK, по отзывам, скорректировала это, сделав рекламу менее навязчивой. Вцелом, отзывы сходятся, что Маруся – уверенный номер два на рынке: она дружелюбна, функциональна и активно развивается, хотя во многом повторяет путь, пройденный Алисой, с небольшим лагом.

Резюме: Маруся от VK – успешный пример развития голосового AI-агента в условиях конкуренции с монополистом. Ей удалось занять свою аудиторию, делая акцент на семейном использовании и интеграции с социальной сетью. Маруся предоставляет практически полный набор базовых функций голосового помощника: от справки и воспроизведения контента до управления умным домом. Хотя в технологической гонке она немного отстаёт (не имеет собственной мощной LLM и меньший охват сервисов), Маруся компенсирует это более «человечным» обликом и узкими фишками (например, VK-звонки). Для пользователей, глубоко вовлечённых в экосистему VK, Маруся может быть предпочтительным выбором. На уровне же общих возможностей ассистент пока следует за лидером рынка, стараясь не отставать – по мере расширения возможностей VK (например, запуск собственной платежной системы, новых сервисов) Маруся также будет становиться сильнее. Её перспективы во многом зависят от инвестиций VK в AI: создание собственной языковой модели или партнёрство с отечественными LLM могли бы вывести Марусю на новый уровень интеллектуальности. В заключение можно отметить, что Маруся уверенно закрепилась в числе основных российских AI-агентов и продолжает развиваться, предлагая пользователям альтернативный выбор с ориентиром на дружелюбие и семейные ценности.

1.5 Салют (Sber)

Описание и задачи: «Салют» – виртуальный ассистент с голосовым управлением, созданный экосистемой Сбера. Впервые представлен 24 сентября 2020 года на конференции «СберКонф» одновременно с первыми устройствами (смарт-дисплей SberPortal, ТВ-приставка SberBox). Особенность «Салюта» в том, что это не один голосовой помощник, а целое семейство из трёх персонажей: мужской голос «Сбер», и женские – «Афина» и «Джой». Пользователь может в любой момент переключать личность ассистента по настроению. Каждый из трёх имеет слегка разный характер и стиль общения. Салют доступен на платформах: мобильное приложение «Сбербанк Онлайн» (вкладка «Салют»), отдельное приложение «Салют» для iOS/Android, все фирменные устройства Sber (Portal, SberBox, умные телевизоры со встроенным Салютом, колонки SberBoom), а также в веб-версии онлайн-банка. Ассистент выполняет разнообразные задачи: отвечает на вопросы, ищет информацию, поддерживает беседу, управляет устройствами умного дома (через платформу Sber), помогает совершать банковские и платежные операции, оформляет услуги. Например, Салют может по команде перевести деньги другому человеку или оплатить заправку автомобиля, так как интегрирован непосредственно в банковские сервисы. Также он выполняет стандартные поручения – поставить напоминание, напомнить о встрече, запустить приложение, проложить маршрут в навигаторе и т.д. Салют ориентирован на мультизадачность: заявлено, что он может участвовать в «брейнштормах» – то есть генерировать идеи и варианты решений по заданной теме. Ассистент интегрирован со СберУстройствами: например, по голосу через Салют можно управлять ТВ (на SberBox), совершать видеозвонки на SberPortal, запускать приложения дополненной реальности. В умных колонках SberBoom Салют управляет музыкой, отвечает на бытовые вопросы. Салют.Маркет – платформа навыков, аналог Яндекс.Диалогов, была запущена в 2020 г., позволяя сторонним разработчикам добавлять навыки (их называют «искусственные коллеги», но по сути – приложения для ассистента). Таким образом, «Салют» – универсальный AI-агент, глубоко интегрированный в банковско-сервисную экосистему Сбера и работающий на множестве устройств.

Технологии: Сбербанк инвестировал значительные ресурсы в создание современной AI-платформы для Салюта. Разработкой занимается дочерняя компания SberDevices при участии исследовательского центра Sber AI. Архитектура Салюта реализует концепцию мультимодального интерфейса – взаимодействовать с ассистентом можно не только голосом, но и текстом или жестами (на устройствах с камерой). Сам ассистент отвечает пользователю тоже не только голосом: на экране SberPortal или мобильного приложения он может показывать картинки, видео, карты и др.. Ядро NLP построено на собственных платформах Сбера: SmartNLP (NLU/NLG движок для русского языка) и SaluteSpeech (ранее SmartSpeech – ASR/TTS). При запуске Салют использовал в диалоговой системе две основные языковые модели: BERT (для понимания смысла запроса) и ruGPT-3 (русскоязычная генеративная модель на 13 млрд параметров), обученные на суперкомпьютере Christofari. Это позволило уже начальной версии Салюта генерировать осмысленные ответы и поддерживать контекст лучше, чем ранние голосовые помощники. В 2023 году Сбер совершил качественный скачок: ассистент интегрирован с новой нейросетевой моделью GigaChat – это собственная мультимодальная LLM Сбера, объявленная как отечественный аналог GPT-4. Одновременно внедрена технология GigaSearch – видимо, система RAG, позволяющая ассистенту искать факты и проверять ответы перед выдачей. По заявлениям, эти обновления «значительно улучшили генеративные и фактологические возможности помощника» – Салют стал быстрее и точнее отвечать на разнообразные вопросы, требующие актуальных знаний. Например, теперь можно спросить географический или кулинарный вопрос – и ассистент благодаря GigaSearch найдёт релевантный ответ в своей базе данных или интернете и сформулирует результат. Таким образом, у Салюта появилась сильная сторона – комбо из LLM и поискового модуля, повышающего достоверность. Хранение данных: Салют тесно связан с инфраструктурой «Сбера», поэтому имеет доступ к банковской информации пользователя (балансы, счета) в рамках разрешённых сценариев. Он помнит контекст диалога (сохраняет историю в «Сбербанк Онлайн» синхронизированно на всех устройствах) и может переключаться между устройствами без потери контекста. Например, начав чат с Салютом на телефоне, пользователь может продолжить на умной колонке. Это реализовано через облачный бэкенд Салюта, где хранится кратковременная история диалога и слоты контекста. Безопасность данных обеспечивает сам Сбер – все обращения ассистента проходят через защищённые контуры, и Салют соответствует требованиям к предустановленным приложениям (с 2020 г. входит в список обязательных российских приложений на смартфонах). Ещё одна технологическая особенность – открытая платформа навыков Salute: SberDevices выпустила SDK и API, позволяющие сторонним разработчикам писать «мини-приложения» для Салюта на HTML/JavaScript, которые ассистент может запускать по голосовой команде. Это фактически web-приложения (их можно видеть на экране SberPortal или телефона) с голосовым управлением. Через Salute Skills API реализованы интеграции множества сервисов (от заказа пиццы до игр), что расширяет функциональность ассистента за счёт экосистемы партнёров.

Преимущества: Салют отличает ряд сильных сторон:

  • Интеграция с банковскими услугами: уникальная черта – прямое внедрение ассистента в финансовые операции. Салют изначально проектировался как часть цифрового банка. Поэтому он умеет выполнять платежные команды («Салют, переведи 500 рублей Иванову» – и совершает P2P перевод), оплачивать счета, показывать расход по категориям и т.п. Такой уровень интеграции выгодно отличает Салют: ни Алиса, ни Маруся (не являясь банками) этого сделать не могут. На практике, для клиентов Сбера Салют становится удобным способом управлять финансами голосом. Сбербанк подчёркивает, что это повышает доступность банковских услуг – например, для пожилых людей или людей с ограничениями по зрению голосовой ассистент – очень полезное решение (можно совершать операции без интерфейса).
  • Несколько персон на выбор: наличие трёх «аватаров» – уникальное конкурентное преимущество. Пользователь может общаться с Джой, Афиной или Сбером – это разнообразит опыт. По сути, у ассистента три заранее настроенных голосовых модели (с разными голосами и манерой). Например, Сбер – нейтральный деловой тон, Афина – спокойная и учёная, Джой – более эмоциональная, шутливая. Пользователи отмечают, что это придаёт ассистенту гибкость: «Афина лучше подходит для рабочих вопросов, а Джой – чтобы поболтать и посмеяться». Такой подход – инновация Сбера, иностранные аналоги (Alexa, Siri и т.п.) не предлагали множественных персоналий.
  • Мультимодальность и кросс-платформенность: Салют работает на многих устройствах с единым профилем. Например, начав переписку с ассистентом на ПК (в веб-версии банка), можно затем голосом запросить колонку SberBoom – и она продолжит разговор. Ассистент также понимает жесты: на SberPortal можно показать жест рукой, и Салют отреагирует (например, замолчит, если приложить палец к губам). Это прогрессивная функция, которую конкуренты практически не реализовали. Мультимодальные ответы (картинки, видео) делают взаимодействие богаче – особенно на устройстве с экраном (портал, смартфон). Например, на вопрос «что такое торнадо?» Салют не только расскажет, но и покажет видео из интернета. Алиса тоже имеет визуальные ответы, но Салют благодаря поддержке HTML-навыков делает их интерактивными (может запустить мини-приложение с графиками или формами).
  • Собственная LLM и RAG: Сбер – одна из немногих компаний в мире, разработавших свою большую языковую модель (GigaChat) и интегрировавших в продукт. Это даёт стратегическое преимущество: компания не зависит от иностранных API и может тонко дообучать модель под свои задачи. GigaChat обучена на русском и ряде других языков, поэтому Салют с 2023 г. существенно продвинулся в генеративных возможностях. Например, он может по просьбе составить интересный маршрут путешествия или черновик письма – используя собственный AI. Причём GigaSearch снабжает его актуальными фактами, снижая риск ошибок. По ряду оценок, Салют с GigaChat приблизился по качеству сложных ответов к ChatGPT на русском языке.
  • Государственная поддержка и обязательная предустановка: согласно требованиям правительства РФ, с 2020 года на продаваемые в России смартфоны должны быть предустановлены отечественные приложения, включая ассистентов. В список входят и «Салют», и «Алиса», и «Маруся». Но Салют к концу 2020 г. уже был установлен на 100% новых Android-устройств в РФ как часть Сбербанк Онлайн, что сразу дало ему большую пользовательскую базу (1,8 млн активных пользователей к концу 2020). Кроме того, Салют обслуживает и корпоративных клиентов (внутренние сценарии Сбера, умные офисы и т.п.). Такая институциональная поддержка позволила быстро масштабировать аудиторию.

Недостатки: Проблемные моменты Салюта:

  • Сложность и ресурсоёмкость: Салют – очень сложная система с множеством функций. На старте (2020-21) пользователи и эксперты отмечали, что ассистент работал медленнее Алисы, иногда путался в запросах. Это объяснимо: меньший «возраст» и отсутствие огромного массива пользовательских диалогов, которые были у Алисы. Сбер активно обучал модели, но по отзывам в первые годы Салют чаще не понимал свободную речь. К 2023 эта разница сократилась, но полностью не исчезла. Некоторое отставание в скорости реакции (особенно на слабых смартфонах) тоже упоминалось – видимо, из-за более тяжёлых моделей.
  • Обилие функций vs простота: Для рядового пользователя Салют может показаться перегруженным. Три разных ассистента, магазин навыков, куча сервисов – можно запутаться, как именно выполнить задачу. Сбер старался упростить взаимодействие, но отзывы говорят, что Алиса «из коробки» понятнее: сказал – получила ответ. С Салютом же надо учитывать, в каком приложении ты находишься, какая именно часть ассистента отвечает (банковский ли это сценарий или общий). Иногда Салют просит уточнить, каким сервисом воспользоваться (например, «через что отправить деньги – через СБП или по номеру телефона?»), что усложняет диалог. Хотя для финансов это оправдано, в бытовом плане – создаёт дополнительную когнитивную нагрузку.
  • Приватность и настороженность: Сбер – банковская организация, оперирующая чувствительными данными. Часть пользователей опасается давать ассистенту доступ «ко всему». Например, Салют имеет доступ к переписке, звонкам, финансам – потенциально это пугает. Хотя Сбер уверяет, что все данные защищены, доверие восстанавливается не сразу. Были слухи и опасения, что Салют «подслушивает» даже выключенным (что Сбер опровергал). Всё это слегка тормозит пользовательское принятие – люди, не являющиеся клиентами Сбера, не спешат устанавливать ассистента, считая его «банковским» и ненужным. В то же время клиенты Сбера, наоборот, более лояльны. Так или иначе, Салюту нужно время, чтобы заслужить репутацию безопасного и удобного помощника.
  • Локализация по языкам: Салют ориентирован на русский. Поддержка других языков практически отсутствует (кроме английских фраз, которые GigaChat может понять, но официозно ассистент – только RU). Для международных пользователей он не релевантен. Внутри РФ это не проблема, но по функционалу – Алиса и Маруся тоже русскоязычные, а вот Google Assistant, хоть не локальный, но говорит по-русски и ещё на 20 языках. Салют же не сможет, например, ответить на запрос на татарском или английском, что ограничивает его потенциальное применение в полиэтничных регионах и среди иностранцев.
  • Экосистема vs открытость: Салют сильно завязан на сервисы Сбера. Если пользователь не клиент банка – половина «фишек» ассистента бесполезна. Например, переводы, оплата – нужны счета Сбербанка. Умный дом – у Сбера своя платформа, поддерживающая не все устройства рынка (хотя они добавляют совместимость). Поэтому для тех, кто не хочет быть внутри экосистемы Сбер, ассистент менее привлекателен. Кроме того, разработчики навыков отмечают, что хотя Salute SDK доступен, охват аудитории меньше, чем у Яндекс.Диалогов, поэтому не все спешат делать версии навыков под Салют. Это замедляет рост количества сторонних навыков.

Независимые отзывы: При запуске Салюта реакция прессы была смешанной. С одной стороны, хвалили инновации – три ассистента, мультимодальность. С другой – отмечали сырость продукта. Например, в 2021 обзоры писали, что Салют нередко не справляется без подключения сотрудника поддержки (особенно в нетривиальных банковских вопросах). К 2022 ситуация улучшилась: по данным Сбера, общее число пользователей превышало 19,5 млн в месяц (включая всех, кто пробовал ассистента хотя бы в рамках онлайн-банка). В 2023, с выходом GigaChat, технологические обозреватели (например, CNews) отмечали, что Салют сделал качественный рывок: ответы стали более содержательными, снизилось число ошибок в фактах. Tech-эксперты также отмечают, что Салют – единственный из российских, кто близок по концепции к AI-коллеге: он может действительно помогать в работе (черновики, аналитика) благодаря мощной модели. Это было подчеркнуто в презентации GigaChat: на примере ассистента показали, как он формирует бизнес-отчёт по запросу менеджера. Пользователи же делятся разным опытом: клиенты Сбера благодарят за удобство – «голосом спрашиваю у Салюта, сколько у меня на карте, он тут же говорит – удобно!»; мамы с детьми отмечают, что сказки Салюта менее разнообразны, чем у Алисы, но тоже неплохи; гики пробуют «ломать» GigaChat через Салют – задают каверзные вопросы, проверяя фильтрацию (Салют, как и остальные, не отвечает на запрещённые темы – это вызывает критику тех, кто ждал полной свободы AI). В то же время независимые эксперты подчёркивают, что для массового развлекательного использования Салют всё ещё менее популярен – если нужен просто поговорить, чаще выбирают Алису, а к Салюту обращаются по делу (например, финансам или умному дому). В сравнительных тестах 2023 года (например, CITILINK Journal) Алиса, Маруся или Салют – кто умнее?, Салют занял достойное место, показав лучшую интеграцию с устройствами Сбера и банковскими операциями, но несколько уступив Алисе в общем понимании речи и обилии навыков. Тем не менее, тенденция такова, что Салют быстро учится, и отзывы конца 2024 г. уже гораздо более позитивные, чем в начале пути.

Резюме: Sber Салют – мощный и амбициозный AI-агент, выходящий за рамки привычного «голосового помощника». За несколько лет он эволюционировал из поддерживающего роль ассистента в полноценного цифрового коллегу, способного решать и бытовые, и бизнес-задачи. Благодаря поддержке крупнейшего банка, Салют имеет уникальные функции (финансовые операции) и доступ к ресурсам (собственные LLM, суперкомпьютеры), что даёт ему конкурентные преимущества внутри страны. Он ориентирован на экосистемный подход: объединяет финтех, умный дом, развлечения и покупки в одном интерфейсе. Конечно, Салют всё ещё догоняет лидеров рынка по популярности и легкости восприятия, но технологически уже на передовой. С дальнейшим развитием GigaChat и ростом партнерских навыков, можно ожидать, что Салют укрепит позиции и, возможно, станет самым интеллектуальным голосовым агентом на русском языке. Для пользователей Сбера он уже практически незаменим в рамках банковских сервисов. Для более широкой аудитории успех будет зависеть от того, насколько Салют сможет выйти за пределы сугубо «сберовского» ассистента и стать универсальным помощником. На данный момент его можно рекомендовать прежде всего тем, кто пользуется продуктами Сбербанка и хочет интегрировать финансовые и бытовые задачи в единый AI-интерфейс.

1.6 Aimylogic (Just AI) – конструктор навыков

Описание и задачи: Aimylogic – это платформа (сервис) для создания диалоговых AI-ботов и навыков без программирования, разработанная компанией Just AI. Хотя Aimylogic не является «ассистентом» для конечных пользователей, её важно упомянуть как часть российской экосистемы AI-агентов, поскольку через неё создаются интеллектуальные агенты для разных платформ (Алисы, Маруси, телеграм-ботов и пр.). Платформа запущена ещё до 2021 года и позиционируется как no-code инструмент: пользователь через визуальный редактор строит диалоговые сценарии, определяет намерения, и затем может развернуть бота в различных каналах. Для целей данного обзора Aimylogic интересна тем, что Just AI сотрудничает с VK и Яндекс: конструктор позволяет адаптировать навыки для Алисы и Маруси, а также создавать бот-агентов для бизнеса. По сути, Just AI предоставила унифицированный фреймворк разработки AI-агентов на русском языке. Задачи и применение: с помощью Aimylogic компании создают чат-ботов поддержки, голосовых роботов кол-центров, навыки для Алисы/Маруси (например, игры, консультационные сервисы). Платформа поддерживает подключение генеративных моделей (OpenAI API, и с 2023 – некоторых отечественных LLM), благодаря чему можно строить ботов со свободным общением. Just AI также выпускает продукт JAICP (для крупных предприятий) – движок оркестрации AI-агентов. Таким образом, Aimylogic/JAICP выполняют вспомогательную роль – они ускоряют распространение AI-агентов в различных отраслях.

Технологии: Платформа Aimylogic работает в облаке: под капотом – собственный NLP Just AI (поддержка русского и английского), позволяющий распознавать интенты, сущности, управлять контекстом. Конструктор предоставляет шаблоны типовых агентов (FAQ-бот, продажник и др.), что облегчает задачу бизнес-пользователям. Интеграция с внешними AI: имеется возможность подключить Large Language Model через API ключ (например, использовать GPT-3.5 для генерации ответов в определённых узлах диалога). В плане хранения данных – Aimylogic хранит диалоговые логи, имеет встроенную mini-CRM для простых кейсов (например, сбор заявок). Для разработчиков есть возможность экспорта кода (на NodeJS) для кастомизации. Aimylogic поддерживает омниканальность – созданный агент можно развернуть сразу в нескольких каналах (телеграм, ВКонтакте, навык для Алисы, веб-чат). Такая гибкость делает её популярным выбором для компаний, не желающих «с нуля» разрабатывать AI-агентов.

Роль на рынке и отзывы: Aimylogic заслужила положительные отзывы в бизнес-сообществе за простоту и функциональность. В рейтингах конструкторов чат-ботов (например, CNews 2022) Just AI входила в топ-3 в РФ. Множество навыков для Алисы и Маруси созданы именно через Aimylogic – Just AI была официальным партнёром их экосистем. Благодаря этому, российские голосовые ассистенты быстрее обрели контент. Пользователи платформы отмечают дружелюбный интерфейс и экономию времени: «можно за пару дней собрать бота для обработки лидов, который работает 24/7». Недостатками иногда называют ограниченную гибкость – для сложной логики всё же приходится привлекать программистов и использовать JAICP. Но в контексте развития AI-агентов Aimylogic является важным инфраструктурным элементом, способствующим распространению технологий.

Резюме: Aimylogic – не конечный AI-агент, а инструмент, однако он был включён в обзор, поскольку напрямую влияет на экосистему виртуальных ассистентов в России. С его помощью предприятия и энтузиасты могут создавать собственных AI-агентов, адаптированных под специфические задачи. Это позволяет расширять сферу применения AI-агентов за пределы универсальных помощников (Алисы, Салюта) – появляются узконаправленные агенты для поддержки клиентов, маркетинга, обучения и т.д. Таким образом, Aimylogic является катализатором рынка AI-агентов, снижая порог входа и стандартизируя разработку ботов. Для государственных и корпоративных экспертов важно учитывать наличие таких платформ – они упрощают внедрение AI в различных организациях, обеспечивая при этом хранение данных в отечественном контуре (что соответствует требованиям регуляторов). В целом, Aimylogic дополняет экосистему AI-агентов, ускоряя их внедрение и развитие функционала на локальном рынке.

(Продолжение обзора – AI-агенты в других регионах – см. следующие разделы.)

2. AI-агенты в США

Таблица 2 – Ключевые AI-агенты (продукты и платформы) в США, отсортированные по типу агента

Тип агентаКомпания / СервисЗадачи и применениеГод запускаОсновные технологииБаза знаний / RAGЯзыкиОриентировочная стоимость
Ассистент кодирования (IDE-плагин)Microsoft / GitHub CopilotПодсказки и автодополнение кода для разработчиков (IDE, редакторы)2021Модель OpenAI Codex (GPT-3 fine-tune для кода)Контекст файла и проекта; база знаний GitHub (обучена на открытом коде)EN (комментарии – многоязычный код)\$10/мес (индивидуальная подписка), есть корпоративные планы
Ассистент офисной продуктивностиMicrosoft / 365 CopilotГенерация документов, аналитика данных, почтовый помощник в приложениях Office2023LLM OpenAI GPT-4 интегрирован через Microsoft GraphКорпоративные данные Microsoft Graph (файлы, почта); поиск по внутренним данным организацииEN (другие в разработке)\$30/мес на пользователя (для бизнеса)
Виртуальный ассистент (общее назначение)Apple / SiriГолосовое управление iPhone/Apple-устройствами: звонки, сообщения, приложения; справка (погода, маршруты)2011Распознование речи (Apple); правила и алгоритмы NLP; модели на основе машинного обученияApple Knowledge Graph; WolframAlpha (для фактов); ограниченный интернет-поискEN; +20 языков (RU, ES, CN и др.)Бесплатно (входит в устройства Apple)
Виртуальный ассистент (общее назначение)Amazon / AlexaГолосовой помощник для умного дома, покупок, справки; >100k навыков (музыка, заказы, игры)2014ASR (Alexa Voice Service); NLU Amazon; модели диалогов (слот-филлин)Amazon Knowledge Graph; Bing Search (раньше); база «скиллов» от сторонних разработчиковEN; +15 языков (DE, JP, FR и др.)Бесплатно (включён в устройства Echo; скиллы в основном бесплатны)
Виртуальный ассистент (общее назначение)Google / AssistantГолосовой ассистент Google: поиск, навигация, смартфон-контроль, умный дом, переводы2016Google LLM (LaMDA в 2022); NLP BERT на бэкенде; модели контекста; Voice MatchGoogle Knowledge Graph + Web Search; динамический контекст пользователя (календарь, карта)EN; +30 языков (в т.ч. RU, HI, ES)Бесплатно (на устройствах Android, Google Home)
Chatbot LLM (генеративный ИИ)OpenAI / ChatGPTУниверсальный чат-бот на естественном языке: вопросы-ответы, тексты, программирование, творчество2022Модели GPT-3.5, GPT-4 (Transformer 175B+ параметров)Встроенная база знаний (обучен на интернет-текстах до 2021); с 2023 – плагины и веб-браузинг (для Pro)EN (обучен мультиязычно, понимает RU и др.)Бесплатно (базовая версия); \$20/мес ChatGPT Plus (GPT-4, плагины)
Chatbot LLM (генеративный ИИ)Google / BardУниверсальный AI-чат от Google: поиск информации с объяснениями, творчество, кодирование2023Модель PaLM 2 (Large Language Model Google)Integraция с Google Search (выдаёт актуальные результаты); Google Knowledge GraphEN (понимает >40 языков, включая RU – в тесте)Бесплатно (экспериментальный сервис)
Chatbot LLM (генеративный ИИ)Anthropic / ClaudeПродвинутый AI-чатбот с упором на безопасность: ответы на вопросы, анализ текста, програм. код2023Модель Claude 2 (LLM, 100k токенов контекст)Внутренняя база знаний (обучение на интернет-данных до 2022); подключение через API – без веб-поискаEN (понимает некоторый другой текст)Бесплатно (в Poe), API – \$11.02 за млн токенов ввода
Персональный AI-компаньонInflection AI / PiДиалог-бот для личного общения и поддержки: ответ на жизненные вопросы, эмпатическое общение2023Собственная LLM Inflection-1 (специализация на дружеском стиле)Знания из корпуса обучения; не подключён к интернет-поиску (по состоянию на запуск)EN (и основные европейские языки)Бесплатно (через приложение/сайт Pi.ai)
AI-компаньон (виртуальный друг)Replika (Luka Inc)Чат-бот собеседник с индивидуальностью: дружба, романтическое общение, поддержка настроения2017Комбинация нейросетей (GPT-3 + собственные модели диалогов и памяти)Личная база диалога пользователя (память беседы); общая модель обучена на паблик-чатахEN (интерфейс на др. языках, но общается лучше по-англ)Условно бесплатно; подписка Pro ~\$12/мес (доп. функции)
Виртуальный сотрудник (корп. AI-агент)IBM / Watson AssistantПлатформа для создания AI-агентов в бизнесе: чат-боты поддержки, голосовые IVR, автоматизация FAQ2018 (как Assistant)IBM Watson AI (NLU, Intent Parser); ML-движок обучаемый на данных компанииWatson Discovery: подключение базы знаний компании (документы, FAQ) для ответовEN (и основные европ., + настройка под др.)Индивидуально (Enterprise SaaS, от \$0.0025 за запрос)
Виртуальный сотрудник (корп. AI-агент)Amelia (IPsoft)Цифровой работник для предприятий: автоматизация обслуживания клиентов, HR, ИТ-саппорта2014Платформа Amelia: NLP, диалоговая модель с памятью; интеграция RPAСобственный knowledge graph; интеграция с базами данных компании, CRMEN (+мультиязычная поддержка)Индивидуально (enterprise-лицензирование)

2.1 GitHub Copilot (Microsoft)

Описание и задачи: GitHub Copilot – это AI-ассистент для программистов, интегрируемый в среду разработки (IDE) и предназначенный для ускорения написания кода. Запущенный широко в 2021 году, он стал одним из первых массовых примеров сотрудничества ИИ и человека в реальном времени при разработке ПО. Copilot работает в виде плагина к популярным редакторам (Visual Studio Code, JetBrains и др.) и генерирует фрагменты исходного кода на основании текущего контекста – комментариев, названия функции или уже написанных строк. Задачи, которые решает Copilot: автодополнение строк и целых блоков кода, генерация скелета функции по описанию (например, разработчик пишет комментарий «/* функция сортировки массива */», а Copilot предлагает реализацию), помощь в синтаксисе новых библиотек, примеры использования API, и даже предложение альтернативных решений. По сути, Copilot предугадывает код, который хотел написать разработчик, с учётом лучших практик из огромного объёма обучающих данных. Это позволяет экономить время на шаблонных частях, уменьшать количество опечаток и ошибок, а также служит обучающим инструментом для менее опытных программистов. С GitHub Copilot можно существенно ускорить типовые задачи программирования (по оценкам Microsoft, до 30% нового кода в проектах, подключённых к Copilot, сгенерировано им). К 2023 году Copilot умеет не только продолжать код, но и по запросу объяснять фрагменты (Copilot Chat) или генерировать unit-тесты – то есть развивается в сторону полноценного AI-помощника в разработке.

Технологии: Ядром Copilot является языковая модель OpenAI Codex, представляющая собой вариант модели GPT-3, специально дообученный на гигантском корпусе исходного кода из открытых репозиториев GitHub (с учётом лицензий). Codex обладает способностью генерировать синтаксически корректный код на десятках языков программирования (особенно хорошо – Python, JavaScript, TypeScript, Go, Ruby и др.). Принцип работы: плагин Copilot в IDE при каждом нажатии клавиши (или при вызове) отправляет на облачный сервис OpenAI текущий контекст – например, несколько сотен строк кода вокруг курсора и комментарий – модель возвращает один или несколько вариантов продолжения. Вся обработка идёт на стороне сервера (модель насчитывает миллиарды параметров, локально не запускается). Хранение знаний: фактически, знания Copilot – это «память» модели Codex, полученная из обучающих данных (более 100 ГБ исходников). Модель обладает контекстным окном (в Codex – порядка 4-8 тыс. токенов в версии 2021), что позволяет учитывать до нескольких сот строк кода из текущего файла и связанных файлов. Однако у Copilot нет доступа к интернету или актуальной документации во время генерации – он полагается на знания, полученные при обучении, а также на предоставленный разработчиком контекст. Это означает, что Copilot иногда может предлагать устаревшие методы или уязвимый код, если он присутствовал в обучающих данных. Для улучшения актуальности Microsoft внедряет механизмы фильтрации и пост-обучения – модель обновляется, чтобы не предлагать известные уязвимости, шаблоны с ошибками, а также не выдавать дословно большие куски лицензированного кода (чтобы избежать нарушений). Насчёт RAG: Copilot не выполняет retrieval augmented generation в классическом виде – он не ищет в базе знаний – но IDE может подтягивать документацию: например, в режиме объяснения Copilot Chat может опираться на встроенные документы. Однако основная генерация идёт «из головы» модели. Copilot интегрирован с Microsoft Graph для корпоративных клиентов – т.е. при использовании на приватном репозитории он может учитывать внутренние функции или стили, но этот функционал ограничен (скорее, фичи Copilot for Business, которые обещают хранить контекст внутри sandbox, чтобы модель не обучалась на приватном коде).

Преимущества: Copilot произвёл революцию в инструментах разработки. Главные его преимущества:

  • Существенная экономия времени при кодировании. Разработчики отмечают, что Copilot берёт на себя рутинную часть – наполнение типовых функций, конструирование повторяющихся паттернов проектирования, написание шаблонного кода. Например, при работе с новым API достаточно написать комментарий «создать HTTP-запрос к такому-то эндпоинту», и Copilot сразу предлагает болванку кода. Это ускоряет разработку и особенно полезно при черновом написании.
  • Снижение порога изучения новых языков и библиотек. Copilot часто “подсматривает” в обученных данных правильный пример использования некоей функции или библиотеки. Разработчик может без долгого чтения документации получить работающее решение, а изучение тонкостей отложить. По сути, Copilot выступает как интерактивный наставник, который показывает best practices. Это повышает эффективность новичков и расширяет возможности опытных – они могут быстрее пробовать незнакомые технологии.
  • Непрерывность потока разработки. Классически, программист часто переключается между IDE и браузером в поисках решения на StackOverflow или примера кода. Copilot минимизирует эти контексты переключения – нужный пример может сразу быть подсказан в редакторе. Это ускоряет работу и уменьшает когнитивную нагрузку.
  • Интеграция в экосистему GitHub. Так как Copilot – продукт GitHub/Microsoft, он вписан в их сервисы. Существуют дополнения: Copilot в пулл-реквестах (для пояснения/генерации описаний), Copilot CLI (подсказки для командной строки) и др. Это создаёт целостный AI-помощник везде, где есть код.

Недостатки: Несмотря на впечатляющие возможности, Copilot имеет ограничения:

  • Риск ошибок и неоптимального кода. Модель генерирует код на основе вероятности появления фрагментов в сходных ситуациях, но она не “понимает” намерения разработчика так, как сам разработчик. В итоге Copilot может предложить нерабочий или неэффективный код. Например, мог генерировать уязвимый SQL-запрос (без параметризации) или использовать устаревшую функцию, что уже не рекомендуется. Требуется, чтобы программист внимательно проверял и тестировал код Copilot. Без этого возможно скрытое проникновение ошибок.
  • Проблемы с конфиденциальностью лицензий. Была дискуссия, что Copilot иногда выдавал куски лицензированного кода из обучающей выборки (особенно короткие популярные участки). Это подняло юридические вопросы (нарушение авторских прав). Microsoft внедрила фильтр: Copilot может предупреждать, если предложение очень похоже на существующий публичный код выше определенной длины. Но гарантий нет, и некоторые компании беспокоились о «утечке» лицензионно опасного кода.
  • Ограничения контекста. В больших проектах Copilot видит только часть файла и, возможно, пару связанных файлов. Он не понимает всей архитектуры, не читает документацию проекта. Поэтому для узкоспециализированного кода (например, бизнес-логики) его подсказки могут быть нерелевантны или шаблонны. Ему трудно уловить намерение, если оно неявно. В таких случаях он или молчит, или предлагает что-то общее.
  • Зависимость от качества данных. Copilot обучен на публичном коде, который варьируется по качеству. Хотя модель отдаёт предпочтение часто встречающимся решениям, не всегда они лучшие. Например, если в открытых репозиториях часто встречается неоптимальный подход, Copilot будет склонен его повторять. Модель не знает контекст проекта – может предложить решение, не соответствующее code style команды. Это требует от пользователей дисциплины – принимать не слепо, а обдуманно.
  • Увеличение «ленивости» разработчика? Есть мнение, что постоянные подсказки могут притуплять навыки программиста, если полагаться на Copilot везде. Новички могут хуже учить синтаксис, если им всё дополняет AI. Хотя это дискуссионно: с появлением автодополнения кто-то может меньше помнить названия функций, но высвобожденное время идёт на более сложные задачи. Тем не менее, есть риск снижения внимательности: разработчик может начать принимать код от Copilot без тщательной проверки, что опасно.

Независимые отзывы: Сообщество разработчиков активно обсуждало Copilot с момента запуска. Большинство отмечают, что после привыкания к инструменту уже не хочется возвращаться к “ручному” режиму – настолько он ускоряет работу при типовых задачах. На платформе Stack Overflow проводились опросы: в 2022 г. около 70% разработчиков, попробовавших Copilot, заявили о росте продуктивности. Однако, наряду с восторгами, были и критические случаи. Например, исследователи из NYU в 2021 проверили, что Copilot генерирует уязвимый код (SQL injection, buffer overflow) в ~40% случаев по безопасности-чувствительным запросам. Это привело к тому, что GitHub встроил предупреждения об ответственности разработчика проверять результаты. В крупном исследовании (GitHub, 2023) упомянуто, что работа с Copilot снижает когнитивное напряжение, разработчики меньше устают на рутинных этапах, а высвободившееся время тратят на архитектурные и творческие аспекты. Многие отмечают, что Copilot особенно хорош при работе с новым или редко используемым API – он часто знает шаблон лучше самого разработчика. Пример из отзывов: «Copilot за секунды написал код для OAuth2 авторизации, на который у меня ушло бы полчаса с документацией». Из негативных – были случаи, когда Copilot некорректно использовал внутренние API: например, в коде, рассчитанном на старую версию библиотеки, он выдавал примеры для новой, ломая совместимость. Но такие баги быстро выявляются, и разработчики учатся задавать контекст точнее. В целом, Copilot получил признание как по-настоящему полезный инструмент: по сути, стандарт автодополнения кода поднялся на новый уровень. Конкуренты (Amazon CodeWhisperer, TabNine, etc.) также появились, но GitHub Copilot за счёт первой позиции и интеграции пока лидирует по числу пользователей (сотни тысяч подписчиков на 2023 г.).

Резюме: GitHub Copilot – яркий пример узкоспециализированного AI-агента, существенно повышающего эффективность профессиональной деятельности (в данном случае – программирования). Он интегрирован непосредственно в рабочий процесс разработчика и обеспечивает контекстно-зависимую интеллектуальную помощь, основанную на знаниях, извлечённых из огромного массива кода. Copilot демонстрирует перспективность симбиоза человека и ИИ в решении творческих, но во многом шаблонных задач: человек задаёт цель и контролирует качество, а ИИ предлагает быстрое черновое решение. Такая парадигма может быть расширена и на другие области (дизайн, письмо текстов, анализ данных), но именно в кодировании она нашла особенно благоприятную почву, так как код – строго формальная вещь и хорошо поддаётся генерации. GitHub Copilot уже изменил повседневные практики в разработке ПО, и со временем, по мере улучшения моделей (Codex -> GPT-4 и т.д.), его роль будет только расти. Важно, что Copilot не заменяет программиста, а действует как «второй пилот» – эта аналогия отражена и в названии. Он требует надзора, но при правильном использовании существенно ускоряет «полёт». С точки зрения регуляторов и экспертов, Copilot показал и новые вызовы – например, вопрос лицензирования данных и качество AI. Но в технических нормативных документах его уже рекомендуют как средство повышения производительности разработки (в крупных компаниях, таких как Microsoft, Google, свои аналоги Copilot используются для внутреннего кода). Таким образом, GitHub Copilot занимает прочное место среди AI-агентов США, ориентированных на практическую пользу, и задаёт тренды для появления других специализированных помощников.

2.2 Microsoft 365 Copilot

Описание и задачи: Microsoft 365 Copilot – AI-ассистент, интегрированный в офисный пакет Microsoft 365 (Office), предназначенный для повышения продуктивности работников при работе с документами, электронной почтой, презентациями и другими бизнес-задачами. Анонсирован в марте 2023 года, Copilot для Microsoft 365 воплощает идею “сотоварища” (copilot), который помогает пользователю распорядиться информацией и функциями приложений Office максимально эффективно. Copilot “сидит” внутри таких приложений, как Word, Excel, PowerPoint, Outlook, Teams и т.д., и реагирует на естественно-языковые запросы пользователя. Основные примеры применения:

  • Создание документов на основе данных: Пользователь может попросить “Составь черновик отчета по продажам за Q2 из данных Excel и последних писем” – Copilot в Word сгенерирует текст отчёта, включающий основные цифры, диаграммы, ссылки. Он может черпать факты из электронных таблиц, базы почты, записок и вставлять их, экономя время.
  • Редактирование и улучшение текста: В Word Copilot может переписать текст в заданном тоне (например, более официально), сократить или расшить документ, проверить согласованность терминов. Также он предлагает варианты формулировок.
  • Анализ и визуализация данных в Excel: Copilot в Excel способен объяснить, что значат те или иные цифры, построить сводные таблицы по голосовой команде, выделить тренды. Например, запрос: “Что вызывают эти данные о продажах?” – и Copilot ответит текстом “Продажи выросли на X% в регионе Y, основное влияние оказал продукт Z”. Он может автоматически построить график или провести анализ “что-если” по описанию.
  • Создание презентаций в PowerPoint: На основе текстового документа Copilot умеет сгенерировать набор слайдов с ключевыми точками, подбирая соответствующие иллюстрации (включая использование генеративной графики DALL-E 3). Также может перефразировать содержание слайдов, сделать его лаконичнее или добавить поясняющие заметки.
  • Помощь с электронной почтой (Outlook): Copilot может просмотреть длинную цепочку писем и выдать краткое резюме, предложить черновик ответа с учётом предыдущего контекста. Также способен извлечь из почты список задач или дат.
  • Бизнес-чат (Microsoft 365 Chat): Это специальный интерфейс, где Copilot имеет доступ ко всем рабочим данным пользователя (календарь, документы, почта, заметки) и может отвечать на сложные кросс-приложенческие запросы. Например: “Напомни, какие у меня были основные выводы в документах к последней встрече с клиентом X, и сформулируй письмо с обновлениями для него” – Copilot найдёт соответствующий документ, извлечёт выводы, сформирует письмо. По сути, это единое окно, в котором Copilot действует как личный ассистент, знающий весь дигитальный след сотрудника в Microsoft 365.

Технологии: Microsoft 365 Copilot опирается на большую языковую модель OpenAI – а именно GPT-4 (в корпоративном сегменте, возможно, с дополнительными настройками). Эта LLM интегрируется с Microsoft Graph – облачной средой, объединяющей данные пользователя из всех приложений 365 (файлы на OneDrive, сообщения Outlook, встречи календаря, чаты Teams и пр.). При запросе Copilot извлекает через Graph релевантную информацию (используя поисковые и аналитические API). То есть реализуется схема Retrieval Augmented Generation: сначала на языке запросов GraphQL или естественном делается выборка данных, затем LLM обрабатывает и интегрирует их в ответ. Благодаря этому Copilot может предоставлять ответы с конкретными данными, а не только общие рассуждения. Встроен и механизм цитирования: Copilot, генерируя документ или письмо, может снабжать утверждения ссылками на исходные источники (например, на документ или письмо из которого взят факт), подобно тому, как Bing Chat цитирует веб-страницы. Это критично для доверия: пользователь может проверить, откуда информация. По сути, Microsoft 365 Copilot – оркестратор: он «слушает» естественный язык, преобразует в серию команд к Graph (например, “найди файлы по теме X, выбери в них разделы с выводами, обобщи их”), GPT-4 затем формирует текст ответа или выполняет требуемое действие (например, строит таблицу Excel). Все это происходит быстро (с долями секунды – секундами), но требует больших вычислительных ресурсов (в Azure облаке). Microsoft заявляет, что Copilot обучен следовать корпоративным политикам безопасности: он уважает разрешения – т.е. не выдаст пользователю данных, к которым у него нет доступа (например, документ коллеги, если нет прав). Реализация этого – через Graph API, который уже учитывает ACL (Access Control List).

Преимущества: Microsoft 365 Copilot обещает трансформировать офисную работу. Его сильные стороны:

  • Интеграция в привычные рабочие инструменты: Copilot появляется боковой панелью прямо в приложениях Office, т.е. пользователю не надо идти в отдельный AI-сервис – помощник всегда под рукой. Это снижает барьер использования. В привычном интерфейсе Word можно нажать Copilot и задать задачу, связанную с текущим документом, а он её выполнит.
  • Экономия времени на рутинных задачах: Большая часть офисной работы – компиляция информации из разных источников, создание отчетов, подготовка презентаций, ответ на типовые письма. Copilot берет на себя черновую работу. Например, формирование презентации, которая раньше занимала несколько часов, теперь может быть сделано за минуты, пусть и потребует потом корректировки. По внутренним тестам Microsoft, Copilot сокращает время на подготовку некоторых документов до 50-80%.
  • Повышение качества и продуманности решений: Copilot может выступать как мозговой штурм-партнер. Например, менеджер может спросить: “Предложи идеи маркетинговой кампании для продукта на основе отчета о рынке” – Copilot прочтет отчет (который, возможно, сам же и подготовил) и предложит варианты идей. Он также помогает не забыть учесть важные моменты: анализируя переписку, Copilot напомнит, какие вопросы задавал клиент, чтобы включить ответы в письмо. Это снижает риск пропуска ключевой информации, улучшает полноту и обоснованность документов.
  • Унификация данных: Copilot может связать воедино разрозненные сведения. Классический пример – подготовка отчета по проекту: данные в Excel, задачи в Planner, письма в Outlook. Вместо того, чтобы вручную собирать, Copilot агрегирует и представит целостную картину. Это позволяет сотруднику видеть шире, а не застревать в одном источнике.
  • Доступность экспертных навыков: Не каждый пользователь силен, скажем, в Excel-формулах или дизайне презентаций. Copilot снижает требования: можно на естественном языке попросить «создай сводную таблицу по регионам» или «сделай слайд с сравнением показателей, используя фирменные цвета» – ассистент выполнит. Таким образом, даже менее опытные в сложных функциях люди могут получать результаты экспертов, поручая это AI.

Недостатки и риски: Естественно, внедрение Copilot сопровождается и вызовами:

  • Цена и доступность: Microsoft 365 Copilot – это премиум-функция для предприятий. Озвучена стоимость \$30 в месяц с пользователя поверх существующей подписки M365 E3/E5. Это значительно увеличивает ИТ-бюджет. Не каждая организация готова сразу платить столь высокую цену за новинку. Кроме того, по состоянию на конец 2023, Copilot доступен ограниченному числу клиентов (Microsoft проводит поэтапное внедрение). Для массового пользователя он пока недоступен (возможно, позже что-то войдет в базовый пакет или выйдут облегчённые версии).
  • Приватность и безопасность данных: Хотя Copilot работает в пределах клиента и по заверениям Microsoft данные не используются для обучения внешних моделей, некоторые компании опасаются разрешать ИИ столь глубокий доступ. Фактически Copilot может прочитать всю корпоративную документацию и переписку. Если случится утечка или неправильное предоставление доступа, последствия могут быть серьезными. Microsoft старается гарантировать защищенность (данные не покидают tenancy клиента), но не все сразу готовы доверять. Например, финансовые организации могут столкнуться с регуляторными ограничениями.
  • Качество генерируемого контента: GPT-4 – мощная модель, но не идеальная. Она может иногда ошибаться или “галлюцинировать” факты. В контексте Office это, например, может привести к неверной интерпретации данных. Скажем, Copilot напишет в отчете «рост на 20%», хотя реально в таблице был 2% (если неправильно понял). Или вставит цитату клиента не из того письма. Это требует внимательного пересмотра результатов пользователем. Как и с кодовым Copilot, ответственность остается на человеке. Если сотрудник начнет слепо доверять AI, возможны ошибки в важных документах.
  • Согласованность тона и политики: Автогенерация писем и документов несёт риск, что текст выйдет не соответствующим корпоративному тону или политике. Например, Copilot может слишком прямо ответить клиенту, нарушив дипломатичность, или включить лишние детали. Нужно обучение пользователей – как корректировать и задавать нужный тон (“сделай ответ более вежливым” и т.п.). Microsoft внедрила настройки стиля, но они не всесильны.
  • Переходный период обучения: Внедрение такого инструмента – изменение бизнес-процессов. Сотрудникам потребуется время и обучение, чтобы эффективно использовать Copilot, а не сопротивляться ему. Некоторых может пугать или раздражать AI-помощник, возможно нежелание доверять. Менеджмент должен разработать методики, где Copilot применим, а где нет, обучить лучшим практикам. Также возможны организационные ограничения (например, запрет на использование Copilot для документов с гостайной или конфиденциальностью уровня X). Все это надо прописать.

Независимые отзывы: Пока полноценных независимых исследований мало, так как продукт новый и не широко доступный. Однако тестеры из корпораций (под NDA) и Microsoft в своих кейсах приводят вдохновляющие примеры: одна команда с Copilot подготовила презентацию для клиента за 10 минут вместо часа, другая ответила на 50% больше писем в день. Ранние впечатления: ассистент впечатляет своей способностью понимать контекст, особенно в чат-режиме, где можно последовательно уточнять запросы. Пользователи хвалят, что Copilot хорошо справляется с черновым написанием: «Он создал черновик документа, а мне осталось лишь подправить нюансы – экономия огромная». В то же время, отмечают и ограничения: иногда ответы излишне общие или, наоборот, вписывают внутренние подробности, не предназначенные адресату. В Excel-сообществе обсуждали, что Copilot пока слаб в сложных формулах – иногда предлагает неоптимальные подходы или не распознает контекст, когда таблица нестандартна. Но ожидается, что качество будет улучшаться, а также модель будет обучаться на реальных корпоративных взаимодействиях (Microsoft наверняка собирает анонимизированные телеметрии, что пользователи часто исправляют в выходе Copilot, чтобы совершенствовать систему). Эксперты по кибербезопасности выражают осторожность: важно убедиться, что Copilot не хранит нигде копии данных и соблюдает разграничение прав – Microsoft публиковала документы по этим аспектам. Руководители, опробовавшие Copilot, зачастую очень позитивны: говорят о “game-changer” – что теперь сотрудники могут сфокусироваться на креативных и стратегических задачах, поручив рутину AI, и это может поднять продуктивность всей организации.

Резюме: Microsoft 365 Copilot – один из самых передовых корпоративных AI-агентов на сегодняшний день, интегрированный на уровне всей информационной экосистемы компании. Он сочетает мощь GPT-4 с уникальным доступом к бизнес-контенту пользователя, тем самым выступая в роли интеллектуального цифрового секретаря/аналитика/писателя. Его появление сигнализирует о начале новой эры “умных офисов”, где значительная часть подготовки информации может быть автоматизирована. При правильном внедрении Copilot может значительно сэкономить время работников, повысить качество их output’ов и даже помочь обучению – младшие сотрудники быстрее научатся составлять документы, глядя на примеры Copilot. Тем не менее, его использование требует выработки новых навыков (постановка задач AI, проверка результатов, этика общения с AI) и контроля. С точки зрения нормативно-технической документации, внедрение подобного агента потребует от организаций пересмотра политик ИБ, возможно сертификации продукта по требованиям к защите данных. Вероятно, в перспективе появятся и аналоги от других поставщиков (Google анонсировал Duet AI для Workspace). Но Microsoft, обладая огромной клиентской базой Office, на данный момент задал высокую планку. Если Copilot оправдает ожидания и риски будут минимальными, мы можем увидеть значительное повышение эффективности “умственного труда” в офисах. А регуляторам предстоит адаптироваться к тому, что ИИ станет полноправным участником документооборота – возможно, нужно будет вводить требования маркировать AI-сгенерированные отчеты, пересматривать стандарты качества (учитывая, что часть текста написана не человеком). В целом, Microsoft 365 Copilot – ключевой представитель нового поколения AI-агентов США, заточенных не под развлечения, а под конкретную практическую пользу в бизнес-процессах, и уже за это можно считать его одним из самых значимых AI-решений 2023 года.

(Продолжение обзора – AI-агенты в Европе, остальном мире и автономные аппаратные решения – следует в следующих разделах.)

Разработка и продвижение сайтов webseed.ru
Прокрутить вверх