Искусственный интеллект объяснен: Руководство по пониманию ИИ-агентов
25 июл. 2025 г.
Вы, вероятно, слышали термин "AI agent" (AI-агент), часто используемый в последнее время. Он стал горячим словцом в технических кругах, обещающим революционизировать всё, начиная от обслуживания клиентов и заканчивая личной продуктивностью. Но что, собственно говоря, такое AI-агент и почему вам это должно быть интересно?
Вот в чем дело: "AI-агент" стал общим термином, который охватывает всё, начиная от простых чат-ботов и заканчивая сложными автономными системами. И это, на самом деле, нормально! Ключ в том, чтобы понять, где разные AI-инструменты находятся на спектре агентного ИИ - потому что не все агенты созданы равными, и знание разницы поможет вам установить правильные ожидания и выбрать нужные инструменты для ваших потребностей.
Что такое AI-агент? Понимание спектра автономии агентного ИИ
Термин агент стал горячей темой в мире ИИ. Некоторые считают, что он должен быть зар RESERVED exclusively for автономных систем — ИИ, который может воспринимать, принимать решения и действовать независимо с течением времени. Другие используют его гораздо шире, применяя это имя ко всему, начиная от сопилотов и чат-ботов до умных поисковых инструментов. Правда такова: обе стороны имеют свои аргументы. Вот почему полезно отступить и определить, что мы действительно имеем в виду, когда говорим об “AI-агентах”. Насколько много агентства есть у каждого типа ИИ-системы?
По своей сути, по крайней мере, лингвистически, агент — это просто нечто, что действует от имени чего-то или кого-то другого. По этому определению, почти все ИИ-системы являются агентами так или иначе: они существуют для выполнения задачи, решения проблемы или достижения результата. Будь то реактивное или проактивное, ручное или автономное выполнение, весь ИИ можно понять как агенты с целью.
Но не все агенты созданы равными. Агентство — это спектр; по мере продвижения по спектру ИИ-системы переходят от простых отвечающих машин к системам, которые рассуждают, адаптируются и действуют с возрастающей автономией.
Опираясь на концепции, разработанные ведущими исследователями ИИ, мы можем нанести на карту развивающийся ландшафт агентства ИИ. Вот как современный спектр агентного ИИ делится:
Низкий уровень агентного ИИ (традиционные ИИ-приложения):
Реактивные: вы задаете вопрос, они дают ответ
Ориентированы на выполнение одной задачи: они выполняют одну функцию за раз
Требуют человеческого ввода для каждого действия
Не сохраняют контекст между сеансами
Примеры: простые чат-боты, AI-написания
Средний уровень агентного ИИ (агенты, вызывающие инструменты):
Могут выбирать, какие инструменты использовать в зависимости от ситуации
Обрабатывают многоступенчатые задачи с некоторым руководством
Принимают решения в рамках заданных параметров
Сохраняют некоторый контекст и память
Примеры: AI-помощники, которые могут исследовать и составлять отчеты, инструменты автоматизации рабочего процесса
Высокий уровень агентного ИИ (многоступенчатые агенты):
Работают в циклах, непрерывно предпринимая действия, пока не достигнут цели
Могут определить, когда продолжить работу или когда они закончили
Обрабатывают сложные, многоступенчатые рабочие процессы независимо
Учится на каждом этапе и корректирует свой подход
Примеры: продвинутые исследовательские агенты, автономные системы обслуживания клиентов
Автономный экономический ИИ (независимые агенты):
Могут управлять своими ресурсами и принимать финансовые решения
Взаимодействуют с блокчейн-системами и протоколами DeFi
Могут владеть и управлять цифровыми активами или криптовалютой
Работают с минимальным человеческим контролем в течение длительного времени
Примеры: автономные торговые боты, инвестиционные фонды, управляемые ИИ, самоподдерживающиеся цифровые компании
Децентрализованный автономный ИИ (системы DeAI):
Работают в распределенных сетях без центрального контроля
Принимают коллективные решения через механизмы консенсуса
Существуют на блокчейн-инфраструктуре с неизменной логикой
Не могут контролироваться или отключаться каким-либо единым субъектом
Примеры: децентрализованные рынки предсказаний, автономные DAOs, распределенные сети ИИ
Ключевой момент заключается в том, что все эти системы являются "агентами", они просто работают на различных уровнях автономии. По мере продвижения вверх по спектру агенты становятся более способными к независимым действиям и принятию решений, предоставляя вам более мощную автоматизацию, но требуя больше доверия к способностям принятия решений ИИ. Новейшие уровни - автономные экономические агенты и децентрализованный ИИ - представляют собой границу, где ИИ-системы начинают работать с истинной независимостью, потенциально изменяя наше представление о собственности, контроле и экономическом участии в цифровую эпоху.
Как создаются AI-агенты
В зависимости от того, где агент находится на спектре агентства, его проектирование и техническая сложность будут варьироваться. От простых чат-ботов до децентрализованных автономных систем каждый AI-агент сочетает в себе определенный набор компонентов, определяющих, насколько много агентства у него есть.
На низком уровне агенты являются реактивными инструментами, которые полностью управляются человеческим вводом. На высоком уровне они работают независимо, управляют ресурсами и принимают решения с течением времени с минимальным (или отсутствующим) вмешательством человека.
Вот разбивка того, как агенты создаются на каждом уровне автономии:
Создание низкого уровня агентного ИИ: традиционные ИИ-приложения и реактивные инструменты
Эти агенты простые и безгосударственные. Они не принимают решений, кроме как в ответ на прямую инструкцию.
Ключевые компоненты:
Предобученная LLM (или модель специфического целевого назначения ML): Используется в безгосударственном, реактивном режиме (например, GPT-4, Claude)
Интерфейс фронтенда: Веб/приложение UI для взаимодействия с пользователем
Системный запрос: Тщательно составленные инструкции, формирующие ответы модели
Нет памяти: Нет осознания прошлых взаимодействий или текущего состояния
Нет использования инструментов: Только текст ввод, текст вывод
Нет планирования или принятия решений
Технический стек:
LLM API (например, OpenAI) + Запрос + UI. Полностью работает через вызовы API.
Сценарии использования:
Статические чат-боты, базовые помощники Q&A, инструменты для написания AI
Создание AI среднего уровня агентного ИИ: агенты, вызывающие инструменты и ориентированные на задачи
Эти агенты выходят за рамки статических ответов. Они могут выбирать инструменты, выполнять многоступенчатые задачи и поддерживать контекст на уровне сеанса. Они идеальны для сценариев, когда вам нужен более умный помощник, который может действовать через несколько систем.
Ключевые компоненты:
Ядро LLM: Интерпретирует входные данные, предоставляет рассуждения и генерирует выводы
Интеграция инструментов: Подключается к внешним сервисам, таким как API, базы данных, калькуляторы или поисковые системы
Управляющий слой (например, LangChain, LlamaIndex): Управляет тем, как агент связывает инструменты, память и языковой вывод; маршрутизирует действия на основе намерения
Краткосрочная память: Отслеживает контекст текущего сеанса и предыдущие шаги для более когерентных ответов
Менеджер состояния: Мониторит прогресс задач, выводы инструментов и текущие цели, чтобы держать агента на верном пути
Ограниченная автономия: Выполняет задачи в рамках заранее определенных ограничений (без самопроинициированных циклов или постоянных целей)
Технический стек:
OpenAI или Anthropic LLM + LangChain / LlamaIndex для управления + Векторная база данных (например, Pinecone, Weaviate) + APIs инструментов
Сценарии использования:
AI-сопилоты, контекстные исследовательские помощники, помощники рабочего процесса, многозадачные боты
Создание AI высокого уровня агентного ИИ: автономные многоступенчатые агенты
Эти агенты могут стремиться к целям во времени, корректировать свою стратегию на основе обратной связи и обрабатывать сложные, многоступенчатые задачи с минимальным или отсутствующим вводом пользователя.
Ключевые компоненты:
Ядро LLM + Планировщик: LLM интерпретирует цель; модуль планирования разбивает её на выполнимые подзадачи (например, используя ReAct, Tree-of-Thought или API планировщика).
Автономный бегун цикла: Выполняет итеративный цикл план → действие → оценка до успеха или завершения
Интеграция инструментов: Расширенный набор инструментов, включая веб-браузеры, интерпретаторы кода, векторный поиск и API-коннекторы
Долгосрочная память: Хранит историю задач, изученные поведения и стратегические коррективы между сеансами
Менеджер состояния и обратной связи: Отслеживает, что было сделано, интерпретирует выводы инструментов и адаптирует рабочий процесс соответственно
Безопасность и границы: Жестко закодированные или изученные ограничения, чтобы предотвратить нежелательное поведение или бесконечные циклы
Технический стек:
Управление: LangGraph (для отслеживания состояния на основе графа), AutoGen (координация многоагентов), CrewAI (структурированные команды задач)
Память: Векторные базы данных (например, Chroma, Weaviate), JSON-Хранение или пользовательские модули памяти
Среда выполнения: Локальные среды, облачные работники или изолированные среды (например, Docker + асинхронные очереди задач)
Сценарии использования:
Полностью автономные исследовательские агенты
Боты генерации кода, которые отлаживают и тестируют свои собственные результаты
Сложные менеджеры рабочего процесса
Самосовершенствующиеся работники знаний
Создание автономных экономических агентов: финансово независимый ИИ
Эти агенты работают независимо в финансовых средах. Они контролируют кошельки на цепи, взаимодействуют с умными контрактами и выделяют капитал на основе закодированной логики или изученных стратегий.
Ключевые компоненты:
Ядро LLM + Экономический планировщик: Интерпретирует рыночный контекст или цели и определяет, как действовать. Поскольку нет универсальной библиотеки "экономической логики", большинство команд пишут пользовательский код стратегии или дорабатывают конкретные модели вознаграждения.
Доступ к криптокошельку: Привязан к идентичности в цепи; позволяет агентам отправлять/получать средства и подписывать транзакции
Взаимодействие с умными контрактами: Может вызывать, триггерить или запрашивать контракты на различных цепочках, таких как Ethereum, Solana или BNB Chain
Распределитель ресурсов: Управляет расходами (например, затраты на газ, диверсификация портфеля, ребалансировка)
Экономические целевые функции: Закодированные стратегии или поведение, максимизирующие полезность (например, прибыль, рост TVL, минимизация затрат)
Безопасность и защиты: Ограничения по скорости, ручные переключатели для обхода и ограничения расходов для предотвращения неконтролируемого финансового поведения
Технический стек:
SDK для кошельков: Safe, ethers.js или web3.py для хранения и подписи
Интеграции DeFi: Uniswap SDK, API Aave, модули Gnosis Paymaster
LLM + Планировщик: LangChain + модули экономической логики или обертки для агентного О
Мониторинг: Инструменты оповещения или стражи ИИ (например, GuardrailsAI, Helm, PromptLayer и т.д.)
Сценарии использования:
Автономные торговые агенты с активным управлением портфелем
Агенты оптимизации доходности через несколько протоколов DeFi
Менеджеры казны для DAOs или систем LLM-as-a-service
Боты, генерирующие доход, которые автономно запускают и управляют микросервисами
Создание децентрализованных автономных ИИ (систем DeAI)
Это самые продвинутые AI-агенты — предназначенные для автономной и постоянной работы на децентрализованной инфраструктуре, без какого-либо единственного субъекта, контролирующего их поведение, данные или вычисления. Системы DeAI объединяют ИИ-модели (часто большие языковые модели), нацепную логику, распределенные вычисления и управление сообществом, чтобы создать агентов, которые действуют независимо и развиваются на основе коллективного принятия решений.
Ключевые компоненты:
Ядро модели LLM или ИИ: Движок рассуждений за агентом. Хотя большая часть вывода моделей происходит вне цепи, системы DeAI стремятся децентрализовать этот уровень, используя:
Инференция на основе TEE: Модели работают в надежных окружениях (например, Intel SGX), которые публикуют проверяемые аттестации в блокчейн
Децентрализованные сети вычислений: Работы распределяются по сетям, таким как Bittensor, Gensyn или Akash
zkML (обучение с нулевым раскрытием): Быстро развивающийся метод для доказательства в цепи, что конкретная модельproduced produce a specific output without revealing proprietary data
IPFS или Arweave для хранения моделей: Обеспечивает прозрачность и аудит всех версий модели
Логика выполнения на цепи: Все правила, регулирующие действия агента, разрешения и потоки стимулов, записаны в смарт-контрактах. Эти контракты могут автономно управлять фондами казны, триггерить рабочие процессы и взаимодействовать с другими агентами или dApps.
Распределенное хостинг: Агенты работают в распределенных хранилищах, вычислениях и сетях блокчейна (например, Sahara Blockchain, Filecoin, Arweave, Akash), уменьшая зависимость от любой единственной точки отказа.
Управляющий слой: Обновления, изменения в поведении или перестановки моделей определяются DAOs, управляемыми токенами, сообществами ставок или гибридными моделями управления, что обеспечивает, чтобы никакой один субъект не мог односторонне изменить логику агента.
Репутация и стимулы: Участники (например, валидаторы данных, узлы вывода) зарабатывают токены на основе производительности и участия, с механизмами за штрафы или удаления за плохое поведение.
Автономия по дизайну: Эти агенты созданы для автономной работы, эволюции и принятия решений без непосредственного человеческого контроля. Через программируемое управление и доступ к ресурсам они могут существовать и адаптироваться со временем — даже переживая своих создателей.
Технический стек:
Уровень модели: LLM с открытыми весами или управляемыми DAO + zkML или защищенный вывод TEE
Блокчейн: Sahara AI, Ethereum / L2s, цепочки на основе EVM и т.д.
Хранение: IPFS, Arweave, Lighthouse
Управление: Рамочные структуры DAO (Snapshot, Tally, Zodiac)
Безопасность / Приватность: TEEs, Подтверждения с нулевым раскрытием, MPC—основанный контроль доступа
Среда выполнения: Контракты на цепи для агентов + оффлайн сети для вычислений с проверяемым выводом
Сценарии использования:
Децентрализованные рынки предсказаний и исследовательские агенты
Сообщественно управляемые модели ИИ с доказуемыми, проверяемыми выводами
Агенты на цепи, управляющие совместными вычислениями и распределением капитала
Автономные услуги с собственным управлением, работающие независимо от корпораций или правительств
В отличие от большинства современных ИИ-систем, агенты DeAI не зависят от одной компании для хостинга модели, определения поведения или контроля финансирования. Вместо этого ими управляют смарт-контракты и сообщества, а выводы модели все чаще подтверждаются с помощью безопасных, децентрализованных методов. Хотя децентрализованная иньеровка все еще развивается, инфраструктура быстро эволюционирует. Результат: агенты, которые никто не может выключить, изменить или подвергнуть цензуре, и которые могут координировать, развиваться и действовать самостоятельно.
Создание собственных AI-агентов
Чем дальше вы двигаетесь по спектру агентности, тем более сложным становится построение. Хотя простых агентов теперь можно создавать с помощью инструментов без кода, создание высокоавтономных, многоступенчатых или экономически независимых агентов по-прежнему требует специального знания, инфраструктуры и тщательной оркестровки. Эти агенты часто являются индивидуальными, с пользовательской логикой, цепочками инструментов, системами памяти и средами выполнения.
Вот где Sahara AI вступает в дело.
Независимо от того, только ли вы начинаете свое путешествие или строите сложные системы, мы предлагаем инструменты и поддержку, соответствующие вашим потребностям:
Для предприятий: Мы предоставляем практическую поддержку и инфраструктуру для создания индивидуальных автономных агентов, адаптированных к рабочим процессам и атмосфере данных вашей организации.
Для разработчиков ИИ и пользователей, интересующихся ИИ: Наш агентный конструктор с низким и без кода позволяет легко создавать и внедрять более простых агентов — не требуется команда ML. А наш AI Marketplace предоставляет вам доступ к высококачественным, проверенным наборам данных для повышения возможностей вашего агента, независимо от того, тренируете ли вы, дорабатываете или создаете с нуля.
Создание агентов не бывает универсальным. Чем больше автономии и интеллекта вы хотите, тем больше инфраструктуры вам нужно. Но благодаря современным инструментам и платформам барьер вхождения никогда не был ниже.
Свяжитесь с нами, чтобы узнать больше о наших индивидуальных агентах для вашего предприятия или ознакомьтесь с нашей платформой для разработчиков ИИ.