AIRI со Сбером разрабатывают новое поколение экономичных ИИ-моделей

Анна Сальникова Редактор новостной ленты

Научно-исследовательский институт AIRI при поддержке «Сбера» работает над новым поколением компактных систем искусственного интеллекта. Об этом на Петербургском международном экономическом форуме сообщил генеральный директор AIRI Иван Оселедец, передает ТАСС.

Речь идет о семействе моделей Optimal Cognitive Core. Такие решения должны выполнять роль «когнитивного ядра», взаимодействовать с внешними инструментами и при этом не требовать большого объема вычислительных мощностей.

В AIRI отметили, что многие крупные языковые модели развиваются за счет увеличения числа параметров. Они хранят большой объем знаний во внутренних весах, что позволяет отвечать на широкий круг вопросов, но делает обучение и использование таких систем более затратным.

Кроме того, в институте указали, что подобные модели при подготовке ответа часто опираются на собственную «память», даже когда пользователь передает актуальный контекст. Это может приводить к ошибочным результатам.

Новый подход AIRI предполагает создание компактного ядра, которое будет сосредоточено не на хранении сведений, а на анализе информации, построении логических связей и работе с внешними источниками данных.

Первой моделью семейства стала OCC-RAG. В институте сообщили, что она обучена отвечать на вопросы по внешним источникам, связывать факты из разных частей текста, использовать только предоставленный пользователем контекст и отказываться от ответа, если данных в источнике недостаточно.

По данным AIRI, небольшой размер модели позволяет обрабатывать запросы в полтора-два раза быстрее решений на базе крупных языковых моделей. Также она в среднем расходует в полтора раза меньше токенов при генерации ответа, поскольку ориентирована на анализ контекста, а не на длинные универсальные рассуждения.

Решение размещено в открытом доступе. Его можно применять в областях, где важно отвечать строго по документам и снижать риск ошибок. Среди таких сфер в AIRI назвали финансовые сервисы, корпоративные базы знаний, клиентскую поддержку, а также юридические, медицинские и комплаенс-системы.

Следующим этапом развития проекта станет превращение специализированной модели для ответов по контексту в активное ядро. Планируется, что система сможет самостоятельно искать недостающую информацию в поисковых системах, базах данных, корпоративных сервисах и хранилищах кода, а также обращаться за помощью к другим ИИ-моделям.

Оселедец отметил, что для большинства прикладных задач важнее способность модели рассуждать и опираться на предоставленные данные, чем объем ее внутренней памяти. По его словам, создание такого когнитивного ядра может стать шагом к будущему, в котором небольшие модели будут эффективно работать с инструментами, поиском, базами данных и корпоративными системами.

Ранее «Сбер» и Т-Банк указывали на сложности с поиском площадок для строительства центров обработки данных, необходимых в том числе для развития технологий искусственного интеллекта, а также на нехватку свободных мощностей.

Рекомендуем также:

  1. Каждый месяц теряете деньги: как правильно перейти с социальной пенсии на страховую и получать на 14 000 рублей больше
  2. Опасные паразиты больше не подойдут близко: простое средство помогает забыть о клещах на участке
  3. Похвала может обернуться против вас: как отвечать, чтобы не навредить себе, рассказывает Бехтерева
  4. Каждый месяц теряете деньги: как правильно перейти с социальной пенсии на страховую и получать на 14 000 рублей больше
  5. Новое правило уже действует по всей стране: что теперь запрещено делать владельцам жилья со счётчиками

Есть жалобы? Канал для добрых казанцев, которых вывели из себя. Делитеcь тем, что вас разозлило: Злой Казанец