Инженеры машинного обучения строят системы, которые автоматизируют чужую работу. Вопрос о рекурсии — «заменит ли AI тех ML-инженеров, которые обучают AI?» — задают каждому ML-инженеру за ужином. По большей части это неправильный вопрос. Настоящая картина экспозиции для ML-инжиниринга интереснее: роль попадает в зону AI-аугментации, операционная строка расходов на AI для задач ML-инжиниринга уникально высока, а работа категории Human-critical концентрируется в более узкой полосе, чем у инженеров-программистов.
Шесть задач ML-инжиниринга, которые мы смоделировали
ML-инжиниринг — гибридная роль: отчасти инженер-программист, отчасти прикладной исследователь, отчасти платформенный инженер. Наш корпус v1 моделирует репрезентативные задачи роли: обучение модели на размеченном датасете, оценка качества модели, вывод обученной модели в продакшн, отладка регрессий модели в проде, проектирование тренировочного пайплайна (данные → признаки → обучение → оценка → деплой) и предложение новых подходов к моделированию.
Разбор на уровне ячеек
Обучение модели на размеченном датасете в нашем seed-наборе v1 — AI-augmented: механическая часть (запуск задач fit, отслеживание гиперпараметров, смена learning rate) — высокой автоматизируемости, и инструменты AutoML откусывают этот слой работы уже три года. В зоне AI-augmented, а не Replaceable, задачу удерживают решения, которые всё ещё остаются за ML-инженерами: какую версию датасета брать для обучения, какой holdout-режим честен для конкретного деплоя, важна ли регрессия на отдельном срезе. Эти решения не автоматизируются, и в нашей матрице они сидят на той же задаче.
Оценка качества модели и написание отчёта об оценке — AI-augmented. Собрать таблицу метрик — механика. Решить, какая метрика важна для решения о деплое, — суждение. AI отлично справляется с таблицей и посредственно — с выводом.
Вывод обученной модели в продакшн за API — AI-augmented. Шаблонный код (FastAPI-обработчик, батчинг, мониторинг) — высокой автоматизируемости. Нешаблонные решения — бюджет по latency, политика retry, стратегия отката версий — на стороне человека. Ячейка уверенно в средней полосе.
Отладка регрессий модели в продакшене опускается до Human-led + AI-assisted, и именно здесь операционная стоимость AI для роли резко растёт. Ось надёжности тут слабая: AI уверенно ставит неверный диагноз регрессиям, а ошибочный диагноз одновременно тянет за собой и стоимость надзора, и стоимость последующей ошибки. Минут надзора на одну сессию отладки много. Часов у задачи мало, но долларовый вес каждого часа велик.
Проектирование тренировочного пайплайна попадает в Human-led + AI-assisted на глубоком конце. AI может набросать DAG пайплайна; AI не может решить, что обновление данных должно пройти до полуночи по UTC, потому что европейский стейкхолдер смотрит дашборд в 7 утра по CET, а SLA вышестоящего хранилища — 2 часа ночи по UTC, и потому буферная логика должна быть три часа, а не учебные 30 минут. Ось контекста высокая. Неоднозначность высокая.
Предложение новых подходов к моделированию — задача роли категории Human-critical. Способность AI средняя — он может предложить правдоподобные архитектуры. Надёжность слабая — предложения представляют собой рекомбинации паттернов из тренировочного корпуса, которые могут не подойти к реальной задаче. Ось неоднозначности набирает максимум по шкале несводимой ценности: решить, какую проблему атаковать, — это то, что определяет сеньорность ML-инженера. У AI нет доли в исследовательском направлении компании.
Грубо в разрезе типичной недели
Для ML-инженера уровня mid-to-senior в компании, деплоящей модели (не в лаборатории foundation-моделей — это другая ячейка), базовое распределение v1 по смоделированным задачам такое: ноль Replaceable, примерно половина AI-augmented (обучение, отчёты об оценке, деплой продакшн-API), остальное делится между Human-led + AI-assisted (отладка регрессий, проектирование пайплайна) и Human-critical (решения о подходе к моделированию). Заголовочный пилл — зона AI-аугментации.
Это выглядит похоже на картину для инженерии ПО — и по сути так и есть, на поверхности. Разница проявляется на оси операционной стоимости AI, где у задач ML-инжиниринга самые высокие показатели минут надзора на единицу выхода во всём нашем корпусе. Отладка регрессии требует часов человеческого внимания на каждый предложенный AI диагноз. Поэтому операционная стоимость определяется не инференсом — её определяет время ревьюера по полной ставке senior ML-инженера. Паттерн Klarna работает здесь иначе: высокоспособный AI-ассистент, которому нужен надзор ML-инженера, занимается зарплатным арбитражем против самого дорогого пула ревьюеров в команде.
Вопрос о рекурсии
Версия «за ужином»: «Заменит ли AI тех ML-инженеров, которые обучают AI?» Честный ответ по картине v1: не к 2027 году. Две ячейки, которые выглядят наиболее автоматизируемыми — обучение и сборка таблиц оценки — уже в основном автоматизированы, и так со времён AutoML. Оставшаяся работа ML-инженера сосредоточена в проектировании пайплайнов, отладке регрессий и выборе подходов к моделированию — трёх ячейках, где разрыв между способностью и надёжностью наибольший, а операционная стоимость AI самая высокая.
Структурная картина в том, что ML-инжиниринг — одна из немногих ролей, где рост способности на самом деле повышает спрос на зарплату за оставшуюся human-critical работу, потому что более высокая способность на задачах нижней половины освобождает часы ML-инженера для высокорычаговой работы над исследовательским направлением, которая накапливается против защищённых модельных активов компании. Здесь работает фреймворк permissionless leverage Навала: ML-инженеры, которые используют помощь AI, чтобы закрыть механический слой, получают из тех же часов больше, а не меньше.
Что мы не моделируем — ячейку лаборатории foundation-моделей
Наш корпус v1 моделирует типичного прикладного ML-инженера в компании, деплоящей модели. Мы не моделируем ML-инженера foundation-лаборатории (Anthropic, OpenAI, DeepMind, Mistral и т.д.). У этой роли другая форма — доля Human-critical заметно выше, доля AI-augmented ниже, а финансовый слой существенно другой, потому что выход этой роли И ЕСТЬ измеряемый субститут. Мы добавим её в расширении корпуса v1.5. Пока трактуйте этот пост как картину для прикладного ML-инженера, а не для инженера foundation-лаборатории.
Что с этим делать
Спокойный экономический ход для прикладного ML-инженера в 2026 году — отдать AI отчёты об оценке и API-обработчики, а освободившиеся часы потратить на мышцу отладки регрессий и суждение в проектировании пайплайнов. Это ячейки, где сеньорность накапливается. Распознавание паттернов продакшн-регрессий — это тот навык, который оттачивается с повторениями и плохо передаётся; выборы в моделировании, которые хорошо смотрятся в ноутбуке и падают в проде, учат операционной строгости, которую AI не может отрепетировать за вас.
Рассчитайте свою персональную Wagecard на wagecore.ai/start. Если вы работаете в foundation-лаборатории, ближайшее совпадение в нашем корпусе — роль machine-learning-engineer с ручными override; мы скажем об этом на странице результата. Картина, выведенная из матрицы, — на /roles/machine-learning-engineer , живая кросс-ячейковая картина — на /insights/machine-learning-engineer . Методология открыта на /methodology.