State of Agent Engineering
LangChain State of Agent Engineering показывает, что AI-агенты переходят из экспериментов в production, но ключевой барьер теперь не “можно ли собрать агента”, а “можно ли сделать его надежным, наблюдаемым и проверяемым”. Это важный отчёт для AI4SDLC, потому что он описывает новую инженерную дисциплину вокруг production agents.
Методология и данные
1 блокОпрос 1 300+ специалистов о сценариях применения AI-агентов, зрелости внедрения, барьерах и инженерных практиках.
Ключевые результаты
4 блокаЧто исследовали
Фрагмент из раздела отчета
LangChain опросил более 1 300 professionals — инженеров, product managers, business leaders и executives — о том, как организации строят, тестируют и запускают AI-агентов. В фокусе: production adoption, use cases, blockers, observability, evaluations и практики agent engineering.
Production adoption
Фрагмент из раздела отчета
57% организаций уже имеют agents in production, ещё значительная доля активно готовится к запуску. Крупные enterprise-компании лидируют по adoption: они чаще переводят агенты из пилотов в реальные production workflows. Это показывает, что агентная тема перестала быть только экспериментом R&D-команд.
Quality как главный blocker
Фрагмент из раздела отчета
Качество outputs остаётся главным препятствием: hallucinations, inconsistency, policy adherence и непредсказуемое поведение агента становятся сложнее, когда workflow содержит много шагов. Даже высокая надежность отдельного шага может давать слабый end-to-end success rate в длинной цепочке.
Observability есть, evals ещё догоняют
Фрагмент из раздела отчета
Отчёт подчёркивает: observability уже стала почти обязательной практикой для команд с production agents — почти 90% таких команд используют tracing или другую форму наблюдаемости. Но formal evaluations внедрены слабее: многие команды видят, что агент сделал, но ещё не умеют системно измерять, насколько хорошо он это сделал.
Подробности из отчетаПоказатьСкрыть
LangChain State of Agent Engineering показывает, что AI-агенты переходят из экспериментов в production, но ключевой барьер теперь не “можно ли собрать агента”, а “можно ли сделать его надежным, наблюдаемым и проверяемым”. Это важный отчёт для AI4SDLC, потому что он описывает новую инженерную дисциплину вокруг production agents.
Что исследовали
LangChain опросил более 1 300 professionals — инженеров, product managers, business leaders и executives — о том, как организации строят, тестируют и запускают AI-агентов. В фокусе: production adoption, use cases, blockers, observability, evaluations и практики agent engineering.
Production adoption
57% организаций уже имеют agents in production, ещё значительная доля активно готовится к запуску. Крупные enterprise-компании лидируют по adoption: они чаще переводят агенты из пилотов в реальные production workflows. Это показывает, что агентная тема перестала быть только экспериментом R&D-команд.
Quality как главный blocker
Качество outputs остаётся главным препятствием: hallucinations, inconsistency, policy adherence и непредсказуемое поведение агента становятся сложнее, когда workflow содержит много шагов. Даже высокая надежность отдельного шага может давать слабый end-to-end success rate в длинной цепочке.
Observability есть, evals ещё догоняют
Отчёт подчёркивает: observability уже стала почти обязательной практикой для команд с production agents — почти 90% таких команд используют tracing или другую форму наблюдаемости. Но formal evaluations внедрены слабее: многие команды видят, что агент сделал, но ещё не умеют системно измерять, насколько хорошо он это сделал.
Coding agents как daily workflow
Coding agents занимают заметное место среди ежедневных workflows: Cursor, Claude Code и GitHub Copilot упоминаются среди лидирующих инструментов. При этом LangChain показывает, что агентная инженерия шире coding assistants: customer service, research, data analysis и internal automation также становятся production use cases.
Практический вывод
Главный урок отчёта — агентные системы требуют полноценной engineering discipline: tracing, evals, durable state, model/tool swapping, rollback и policy controls. Для software teams это означает, что успешный AI adoption зависит не только от выбранной модели, но и от инфраструктуры проверки и эксплуатации агентов.