Как маленькие языковые модели меняют агентный ИИ: эффективность и практичность

Изменения в сфере агентного ИИ

Большие языковые модели (LLM) известны своими способностями вести человеческие разговоры. Однако с быстрым ростом агентных ИИ систем роль LLM смещается к выполнению повторяющихся и специализированных задач. Более половины крупных IT-компаний уже используют ИИ-агентов на базе LLM для принятия решений, планирования и выполнения задач, опираясь на централизованные облачные API. Значительные инвестиции в инфраструктуру LLM подтверждают уверенность в их ключевой роли в будущем ИИ.

Маленькие языковые модели: эффективность и подходящесть

Исследователи из NVIDIA и Georgia Tech утверждают, что маленькие языковые модели (SLM) обладают достаточной мощностью для многих агентных задач и при этом более эффективны и экономичны, чем крупные модели. Поскольку многие агентные операции повторяются и просты, SLM часто подходят лучше. Они предлагают гибридный подход: LLM решают сложные разговорные задачи, а SLM — более простые и рутинные. Авторы ставят под сомнение текущее доминирование LLM и предлагают переход на большую долю SLM, что способствует более рациональному использованию ресурсов.

Возможности и преимущества SLM в агентных системах

SLM могут эффективно работать на потребительских устройствах, обеспечивая меньшую задержку, снижение энергопотребления и более простую настройку. Поскольку многие задачи агентных систем сосредоточены и повторяются, SLM зачастую достаточно и даже предпочтительнее крупных моделей. Предлагается создание модульных агентных систем, где по умолчанию используются SLM, а LLM подключаются только при необходимости, что способствует устойчивости, гибкости и доступности интеллектуальных систем.

Дебаты вокруг доминирования LLM

Некоторые специалисты считают, что LLM всегда будут лучше справляться с общими языковыми задачами благодаря масштабированию и семантическим возможностям. Другие отмечают, что централизованное использование LLM экономически выгодно за счет эффекта масштаба. Также LLM получили преимущество благодаря раннему развитию и вниманию индустрии. Тем не менее, исследователи указывают, что SLM адаптивны, дешевле в эксплуатации и эффективно выполняют конкретные подзадачи в агентных системах. Основные препятствия для широкого применения SLM — уже вложенные инвестиции, уклон в сторону LLM при оценке и низкая осведомленность общественности.

Как перейти от LLM к SLM

Переход включает несколько этапов: безопасный сбор данных использования с защитой приватности, очистка и фильтрация чувствительной информации, кластеризация задач для определения подходящих для SLM. Затем выбираются и дообучаются соответствующие SLM с помощью специализированных наборов данных, часто с использованием эффективных методов вроде LoRA. Иногда результаты LLM служат руководством для обучения SLM. Этот процесс повторяется, модели регулярно обновляются, чтобы соответствовать меняющимся задачам и запросам пользователей.

В сторону устойчивого и ресурсосберегающего агентного ИИ

Авторы предлагают переход на SLM для повышения эффективности и устойчивости агентных ИИ, особенно для узких и повторяющихся задач. Они подчеркивают, что SLM часто достаточно мощны и гораздо экономичнее по сравнению с универсальными LLM. Для более сложных разговорных функций рекомендуется использовать комбинацию моделей. Приглашая к открытому диалогу и публичному обсуждению, исследователи стремятся стимулировать более продуманный и ресурсосберегающий подход к развитию ИИ.

Для дополнительной информации ознакомьтесь с оригинальной научной работой и следите за обсуждениями в социальных сетях и сообществах.