Мы построили Wagecore, чтобы ответить на один вопрос по каждой профессии умственного труда: замещение человека ИИ дешевле операционно, или только теоретически? Ниже — пять выводов из прогона нашей матрицы способностей v1 по пятнадцати профессиям. Самый неуютный из них — заодно и самый простой.
Прежде чем перейти к выводам: это модельное чтение, а не опрос. Мы пока не собрали данные о принятии продукта пользователями в масштабе, и цифры взяты из прозрачной, вручную составленной матрицы, откалиброванной по опубликованным исследованиям (MIT CSAIL по жизнеспособности автоматизации, BCG по извлечению ценности от ИИ на уровне предприятий и разборы после инцидентов у Klarna, Uber и других). Версионирование матрицы, определения осей и правила порогов — всё на нашей странице методологии. Мы говорим об этом сразу, потому что матрица открыта и поддаётся аудиту, а чтение становится точнее со временем, по мере того как всё больше профессий вычисляется и перекалибровывается. Сегодня картина принятия ранняя — v0 — и мы прямо это говорим.
Пятнадцать профессий
Корпус v1 охватывает пять технических профессий (разработчик ПО, дата-инженер, инженер по машинному обучению, продакт-менеджер, продуктовый дизайнер), пять профессий, смежных с операциями (руководитель поддержки клиентов, sales engineer, инженерный менеджер, финансовый аналитик, аккаунт-менеджер) и пять творческих профессий широкого профиля (контент-маркетолог, менеджер growth-маркетинга, UX-исследователь, рекрутер, аналитик бизнес-операций). У каждой профессии — от шести до восьми репрезентативных задач, оценённых по девяти осям: четыре оси кластера способностей, три оси кластера надёжности, модификатор операционной экономики и демпфер человеческого преимущества, состоящий из пяти канонических осей неустранимой ценности.
Согласно ADR-016, каждая задача попадает в один из четырёх классов замещения — Replaceable (ИИ выполняет задачу от начала до конца при минимальном надзоре), AI-augmented (ИИ делает большую часть работы, за человеком — решения и контекст), Human-led + AI-assisted (ведёт человек, ИИ — это инструментарий) и Human-critical (ИИ не даёт чистой ценности или даёт отрицательную из-за доверия, регулирования, ответственности или сложности отношений). Пороги детерминированы, зашиты в код и подробно разобраны в каноническом посте по таксономии.
Вывод 1 — Большая часть умственного труда живёт в двух средних классах
По 91 ячейке (профессия × задача) в корпусе v1 базовое распределение по классам замещения в пересчёте на количество задач примерно такое: 4% Replaceable, 38% AI-augmented, 27% Human-led + AI-assisted, 31% Human-critical. Корзина Replaceable узкая — лишь горстка задач в корпусе одновременно проходит порог способностей ≥ 75, надёжности ≥ 80 И низкой цены ошибки. Два средних класса несут наибольшую массу — 65% в сумме.
Это важно, потому что доминирующая публичная подача экономики труда с ИИ бинарна. «В безопасности vs под угрозой». «Заберут ли роботы мою работу, да или нет». Данные не подтверждают ни один из полюсов как большинство. Честное чтение таково: умственный труд раскладывается на портфель задач, где ИИ операционно дешевле для одних, дороже для других и в чистом виде — ни туда ни сюда для многих.
Для разработчика ПО в корпусе v1 ни одна из восьми смоделированных задач не попадает в Replaceable в качестве базового класса — даже документация, где способности оцениваются высоко, не проходит порог надёжности или цены ошибки при выпуске в продакшн-код. Профессия примерно наполовину AI-augmented (реализация функции по чёткой спецификации, черновик код-ревью, написание тестов) и разделена между Human-led + AI-assisted (проектирование систем, разбор инцидентов на дежурстве) и Human-critical (менторство, архитектурные решения с многолетним контекстом). Взвешенное по долям чтение помещает профессию на территорию Augmentation — не Replaceable, не Human-critical.
Вывод 2 — Способности убежали вперёд надёжности
Из 91 ячейки (профессия × задача) в нашей матрице v1 31 набирает по способностям ≥ 75 — заметно выше порога, который популярные фреймворки «риска ИИ» трактуют как «модель это умеет». Из этих 31 лишь 5 также набирают по надёжности ≥ 80 — порог, который в сочетании с низкой ценой ошибки запускает Replaceable в нашем наборе правил. Остальные 26 задач с высокими способностями не проходят порог надёжности. Они технически достижимы в демо и недостижимы в продакшне.
Это тот самый «паттерн Klarna», о котором мы писали отдельно. Модель может закрыть тикет службы поддержки. Модель не может закрыть его с той частотой отказов, которую готов терпеть бизнес. Разрыв между этими двумя предложениями — там, где живёт большинство случаев отката.
Примеры из корпуса. Задача дата-инженера по мониторингу пайплайнов набирает по способностям в высоком диапазоне, а по надёжности — в районе 75: способности проходят планку Replaceable, надёжность — нет. Задача growth-маркетолога по написанию заголовков набирает по способностям низкие 80-е, а по надёжности — середину 60-х — тот же паттерн. Задача UX-исследователя по синтезу транскриптов ложится в ту же форму: высокие способности, надёжность среднего уровня. Во всех трёх случаях популярная подача «риска ИИ» пометила бы задачу как автоматизируемую. Пороги надёжности и цены ошибки говорят: не с той частотой отказов, которую готов терпеть бизнес, плюс цена ошибки, когда надзор что-то пропускает.
Во всех трёх случаях популярная подача пометила бы задачу «автоматизируемой». Оценка надёжности говорит: не с учётом цены человеческого надзора для отлова ошибок плюс цены ошибки, когда надзор что-то пропускает.
Вывод 3 — Цена ошибки — самая недооценённая ось в публичном дискурсе
Wagecore оценивает цену ошибки множителем от 1 до 5 для каждой задачи, где 1 означает «неверный результат дёшево обнаружить и исправить», а 5 — «неверный результат создаёт регуляторный, финансовый или репутационный ущерб, который накапливается». В корпусе v1 примерно 38% задач набирают 4 или 5 — они бьют выше своего веса при назначении итогового класса замещения.
Согласно Правилу 1 из ADR-016, любая задача с errorCostMultiplier ≥ 5 попадает
в Human-critical вне зависимости от способностей. Оценка способностей может
быть 95 — если уверенно-неверный вывод ИИ катастрофичен, развёртывание такого ИИ
несёт чистую отрицательную ожидаемую ценность. Математика проста: цена одной
редкой ошибки, амортизированная по всем разам, когда ИИ не ошибается, должна
выгодно сравниваться с полной стоимостью человека. Для задач, где цена редкой
ошибки велика (медицинская подпись, финансовое заверение, регуляторная отчётность),
математика не сходится.
Два примера. Задача финансового аналитика «подготовить комментарий к отклонениям аудиторского уровня» набирает способности 70, надёжность 60, цену ошибки 5. Способности среднего уровня; цена ошибки загоняет всю задачу в Human-critical. Задача руководителя поддержки клиентов «ответить на запрос регулятора» набирает способности 68, надёжность 55, цену ошибки 5. Тот же порог.
Теперь сравните с тем, куда эти задачи помещают популярные фреймворки «риска ИИ». Обе задачи попадают в полосу «средней-высокой подверженности ИИ» в инструментах, которые взвешивают только способности. Ось цены ошибки переворачивает вывод. Если вы финансовый аналитик и читаете инструмент, который ранжирует вашу профессию как «подверженную на 78%», неявное утверждение таково: 78% вашей работы операционно замещаемы уже сегодня. Реальность в том, что результаты аудиторского уровня — самая высокорычажная часть роли — операционно не замещаемы сегодня вне зависимости от способностей и, возможно, не станут замещаемыми никогда, потому что ось юридической ответственности структурно человеческая.
Вывод 4 — Пять осей человеческого преимущества не независимы
Мы оцениваем каждую задачу по пяти каноническим осям неустранимой человеческой ценности: доверие (устойчивые отношения), неоднозначность (считывание незнакомой обстановки), ответственность (именная регулируемая подпись), убеждение (изменение чьего-то поведения через человеческую динамику) и контекст (многолетняя история, которая не помещается в окно контекста модели).
В корпусе v1 оси качественно группируются в две группы. Задачи, помеченные доверием, также, как правило, помечены ответственностью — эти две сходятся на фидуциарной работе (медицинское, юридическое, финансовое заверение, именная регулируемая подпись). Задачи, помеченные неоднозначностью, как правило, сходятся с контекстом — открытая работа с суждениями вроде архитектуры, проектирования систем или стратегии руководства. Эти два кластера в корпусе существенно не пересекаются.
Следствие в том, что «human-critical работа» — не что-то одно. Есть как минимум два различимых вида: фидуциарная работа (аудитор, врач, юрист, именной терапевт — высокое доверие, высокая ответственность) и работа с суждениями в условиях неоднозначности (архитектор, старший продакт, ведущий дизайнер — высокая неоднозначность, высокий контекст). Экономика автоматизации этих видов различается. У фидуциарной работы есть структурные человеческие якоря (регулирование, профессиональное лицензирование, именная ответственность). У работы с суждениями в условиях неоднозначности якоря архитектурные (ни одно окно контекста не удержит многолетний граф технического долга; ни один промпт не схватит политическую карту организации).
Говорим это с методологической оговоркой: корпус составлен вручную, оси сегодня закодированы строковыми тегами по каждой задаче, а не числовыми оценками, и мы публикуем этот вывод о кластеризации как рабочую гипотезу. Панель оценщиков v1.5 (Claude + класса GPT-4 + класса Gemini) оценит эти оси от 0 до 4 по структурированной рубрике согласно ADR-017, и медианы будут проштампованы в матрицу — с этого момента корреляции кластеров станут измеримыми. Если качественная структура кластеров устоит, вывод реален. Если она развалится, мы скажем об этом на странице методологии и обновим пост.
Вывод 5 — Надзор, а не инференс, — доминирующая операционная стоимость
Для типичной ячейки v1 — при сложении минут надзора на задачу, полной ставки проверяющего и текущего ценообразования на токены в константах нашей модели затрат — крупнейшая отдельная строка операционной стоимости ИИ — это надзор (минуты человеческой проверки на единицу вывода, помноженные на полную ставку проверяющего). Не токены. Не оркестрация. Не интеграция. Драйвер номер один того, выйдет ли развёртывание ИИ в чистый плюс по экономике, — это сколько минут человеческого внимания всё ещё требует каждый вывод ИИ.
Это та строка, которую большинство публичных анализов стоимости ИИ пропускает. Строку токенов дёшево посчитать и легко защитить («миллион токенов стоит $X»). Строка надзора требует знать ось надёжности, ось цены ошибки и полную ставку проверяющего. Три числа, которые большинство инструментов-калькуляторов отказывается спрашивать.
Следствие: улучшения способностей, снижающие строку токенов без снижения минут надзора, не сдвигают экономику существенно. Улучшения надёжности, урезающие надзор с десяти минут на вывод до двух минут на вывод, меняют ответ для всей профессии. Вот почему наша методология взвешивает надёжность и цену ошибки как пороги и демпферы, а не как слагаемые суммы. Способности определяют, какие задачи входят в модель; надёжность умножает операционную жизнеспособность; цена ошибки делит её; человеческое преимущество её демпфирует.
Структурный прогноз: следующее поколение значимых снижений стоимости труда с ИИ придёт не от более дешёвого инференса. Оно придёт от улучшений надёжности, которые существенно сокращают минуты надзора на вывод. Руководитель Nvidia, сказавший Axios в апреле 2026, что «стоимость вычислений намного превосходит стоимость сотрудников», описывал строку инференса. Строку надёжности структурно куда труднее продавить, и именно поэтому откаты после развёртывания (Klarna, пережигание бюджета на ИИ-кодинг у Uber) кучкуются на тех развёртываниях, где надёжность не догнала способности.
Что мы сознательно не моделировали
Три вещи, названные так, чтобы вы могли спорить с нами по правильной оси. Во-первых, ценность опциона — ценность отсрочки развёртывания ИИ до того, как улучшатся способности или стоимость. Задача, которая сегодня набирает Human-led + AI-assisted, может через два года сдвинуться в AI-augmented; опцион подождать имеет для фирмы реальную ожидаемую ценность. Мы не оцениваем это, потому что у нас нет защитимой кривой снижения для надёжности. Кривые способностей поддаются расчёту; кривые надёжности — нет.
Во-вторых, ценность стратегического перераспределения. Когда ИИ замещает 20% часов задач профессии, освободившиеся часы можно перенаправить на более высокорычажную работу. Экономическая ценность этого перенаправления зависит от того, уходит ли освободившееся время на работу высокой предельной ценности (архитектура, менторство, удержание клиентов) или на боковую активность. Наша модель исходит из чистой экономии на освободившихся часах, что недооценивает потенциал в лучшем случае и избегает переобещаний в среднем. Мы сознательно консервативны.
В-третьих, терминальная ценность за пределами Года 5. Слой финансовой проекции (NPV / IRR / срок окупаемости, доступный подписчикам Pro на каждой Wagecard) считает на пять лет вперёд. Мы не экстраполируем дальше, потому что допущения о затухании способностей и стоимости становятся произвольными очень быстро. Мы предпочитаем пятилетний ответ, который можем защитить, двадцатилетнему, которому никто не поверит.
Что это значит, если вы читаете как работник умственного труда
Заглавный тезис — спокойный. Большинство профессий в корпусе v1 не находятся в заголовочной беде из-за подверженности ИИ сегодня, и фреймворк прогнозирует, что они не окажутся в заголовочной беде и в ближайшие пять лет. Это не оправдание благодушия. Два средних класса (AI-augmented, Human-led + AI-assisted) — там, где происходит операционный сдвиг, и они требуют от работника активно менять то, как он использует ИИ — не бояться его, не превозносить, а работать с ним как с новым базовым уровнем инструментария.
Если хотите конкретное чтение для своей роли, географии и набора задач, мастер Wagecard занимает около трёх минут. Анонимный предпросмотр до входа; зарплата не требуется, если только вы не хотите чтение по рыночному процентилю. Цифры на вашей Wagecard берутся из той же матрицы, из которой мы вывели выводы выше.
Что это значит, если вы читаете как руководитель развёртывания
Два режима отказа, которые мы видим чаще всего в публичных откатах, — это (1) выкатки способностей-без-надёжности, недооценившие нагрузку надзора, и (2) задачи, Replaceable-по-заголовку, но на деле Human-critical-по-цене-ошибки. Оба диагностируемы заранее. Способности и надёжность чисто раскладываются в нашей матрице; цена ошибки — множитель от 1 до 5 на задачу. Диагностика занимает около часа, если выписать задачи. Разбор после инцидента занимает около квартала, если диагностику пропустить.
Если вы отвечаете за развёртывание ИИ для команды или организации, B2B-представление — это поток «вставь роли», выдающий то же выведенное из матрицы чтение по всему штату. Методология та же; поверхность — уровня организации.
Ещё одна оговорка
Мы до запуска. Цифры выше берутся из вручную составленной матрицы v1, откалиброванной по публичным исследованиям. Когда выйдет панель оценщиков v1.5 (цель — Q3 2026), матрица будет прогнана регрессионным тестом против трёх модельных оценщиков, и медианы будут проштампованы в ту же структуру данных. Если любой из пяти выводов выше перевернётся после этого прохода, мы скажем об этом на странице методологии, обновим этот пост новыми цифрами и проштампуем версию. Ячейки v1 останутся читаемыми; штамп версии на каждой Wagecard фиксирует, какая матрица произвела чтение.
Со временем чтение обостряется по мере того, как заполняется реальное принятие — какие ИИ-инструменты действительно используются, с какой интенсивностью, по разрезу роль × география × опыт. Сегодня у нас этого нет ни по одной ячейке; цифры выше — модельные чтения, а не данные о принятии. Пороги прозрачности на /insights показывают ровно там, где эти данные есть и где их ещё нет, по числу N, в реальном времени — включая нули.
Вот и весь питч: открытая методология, потому что заслуживающая доверия экономика обязана поддаваться аудиту. Каждое число выходит с методом, который его произвёл, и полосой доверия, чтобы вы могли проверить чтение, а не верить ему.
Комментарии и возражения по методологии приветствуются. Быстрейший способ поспорить с фреймворком — вычислить свою собственную Wagecard и сказать нам, какая ячейка выглядит неверной. Версия матрицы на каждой Wagecard фиксирует снимок, который вы видели; мы ведём журнал аудита того, как он менялся.