Ми побудували Wagecore, щоб відповісти на одне питання щодо кожної професії розумової праці: заміщення людини ШІ дешевше операційно, чи лише теоретично? Нижче — п'ять висновків із прогону нашої матриці спроможностей v1 по п'ятнадцяти професіях. Найнезатишніший із них — водночас і найпростіший.
Перш ніж перейти до висновків: це модельне читання, а не опитування. Ми ще не зібрали дані про прийняття продукту користувачами в масштабі, і цифри взяті з прозорої, укладеної вручну матриці, відкаліброваної за опублікованими дослідженнями (MIT CSAIL щодо життєздатності автоматизації, BCG щодо вилучення цінності від ШІ на рівні підприємств і розбори після інцидентів у Klarna, Uber та інших). Версіонування матриці, визначення осей і правила порогів — усе на нашій сторінці методології. Ми говоримо про це одразу, бо матриця відкрита й піддається аудиту, а читання стає точнішим із часом, у міру того як дедалі більше професій обчислюється й перекалібровується. Сьогодні картина прийняття рання — v0 — і ми прямо це кажемо.
П'ятнадцять професій
Корпус v1 охоплює п'ять технічних професій (розробник ПЗ, дата-інженер, інженер з машинного навчання, продакт-менеджер, продуктовий дизайнер), п'ять професій, суміжних з операціями (керівник підтримки клієнтів, sales engineer, інженерний менеджер, фінансовий аналітик, акаунт-менеджер) і п'ять творчих професій широкого профілю (контент-маркетолог, менеджер growth-маркетингу, UX-дослідник, рекрутер, аналітик бізнес-операцій). Кожна професія має від шести до восьми репрезентативних задач, оцінених за дев'ятьма осями: чотири осі кластера спроможностей, три осі кластера надійності, модифікатор операційної економіки та демпфер людської переваги, що складається з п'яти канонічних осей неусувної цінності.
Згідно з ADR-016, кожна задача потрапляє до одного з чотирьох класів заміщення — Replaceable (ШІ виконує задачу від початку до кінця за мінімального нагляду), AI-augmented (ШІ робить більшу частину роботи, за людиною — рішення й контекст), Human-led + AI-assisted (веде людина, ШІ — це інструментарій) і Human-critical (ШІ не дає чистої цінності або дає від'ємну через довіру, регулювання, відповідальність чи складність стосунків). Пороги детерміновані, зашиті в код і докладно розібрані у канонічному пості з таксономії.
Висновок 1 — Більша частина розумової праці живе у двох середніх класах
По 91 клітинці (професія × задача) в корпусі v1 базовий розподіл за класами заміщення в перерахунку на кількість задач приблизно такий: 4% Replaceable, 38% AI-augmented, 27% Human-led + AI-assisted, 31% Human-critical. Кошик Replaceable вузький — лише жменька задач у корпусі одночасно проходить поріг спроможностей ≥ 75, надійності ≥ 80 І низької ціни помилки. Два середні класи несуть найбільшу масу — 65% сукупно.
Це важливо, бо домінантна публічна подача економіки праці з ШІ бінарна. «У безпеці vs під загрозою». «Чи заберуть роботи мою роботу, так чи ні». Дані не підтверджують жоден із полюсів як більшість. Чесне читання таке: розумова праця розкладається на портфель задач, де ШІ операційно дешевший для одних, дорожчий для інших і в чистому вигляді — ані туди ані сюди для багатьох.
Для розробника ПЗ у корпусі v1 жодна з восьми змодельованих задач не потрапляє до Replaceable як базовий клас — навіть документація, де спроможності оцінюються високо, не проходить поріг надійності або ціни помилки при випуску в продакшн-код. Професія приблизно наполовину AI-augmented (реалізація функції за чіткою специфікацією, чернетка код-рев'ю, написання тестів) і поділена між Human-led + AI-assisted (проєктування систем, розбір інцидентів на чергуванні) і Human-critical (менторство, архітектурні рішення з багаторічним контекстом). Зважене за частками читання поміщає професію на територію Augmentation — не Replaceable, не Human-critical.
Висновок 2 — Спроможності втекли вперед надійності
Зі 91 клітинки (професія × задача) в нашій матриці v1 31 набирає за спроможностями ≥ 75 — помітно вище за поріг, який популярні фреймворки «ризику ШІ» трактують як «модель це вміє». З цих 31 лише 5 також набирають за надійністю ≥ 80 — поріг, який у поєднанні з низькою ціною помилки запускає Replaceable в нашому наборі правил. Решта 26 задач із високими спроможностями не проходять поріг надійності. Вони технічно досяжні в демо й недосяжні в продакшні.
Це той самий «патерн Klarna», про який ми писали окремо. Модель може закрити тікет служби підтримки. Модель не може закрити його з тією частотою відмов, яку готовий терпіти бізнес. Розрив між цими двома реченнями — там, де живе більшість випадків відкату.
Приклади з корпусу. Задача дата-інженера з моніторингу пайплайнів набирає за спроможностями у високому діапазоні, а за надійністю — в районі 75: спроможності проходять планку Replaceable, надійність — ні. Задача growth-маркетолога з написання заголовків набирає за спроможностями низькі 80-ті, а за надійністю — середину 60-х — той самий патерн. Задача UX-дослідника із синтезу транскриптів лягає в ту саму форму: високі спроможності, надійність середнього рівня. У всіх трьох випадках популярна подача «ризику ШІ» позначила б задачу як автоматизовну. Пороги надійності та ціни помилки кажуть: не з тією частотою відмов, яку готовий терпіти бізнес, плюс ціна помилки, коли нагляд щось пропускає.
У всіх трьох випадках популярна подача позначила б задачу «автоматизовною». Оцінка надійності каже: не з урахуванням ціни людського нагляду для вилову помилок плюс ціни помилки, коли нагляд щось пропускає.
Висновок 3 — Ціна помилки — найбільш недооцінена вісь у публічному дискурсі
Wagecore оцінює ціну помилки множником від 1 до 5 для кожної задачі, де 1 означає «хибний результат дешево виявити й виправити», а 5 — «хибний результат створює регуляторну, фінансову чи репутаційну шкоду, що накопичується». У корпусі v1 приблизно 38% задач набирають 4 або 5 — вони б'ють вище своєї ваги при призначенні підсумкового класу заміщення.
Згідно з Правилом 1 з ADR-016, будь-яка задача з errorCostMultiplier ≥ 5
потрапляє до Human-critical незалежно від спроможностей. Оцінка спроможностей
може бути 95 — якщо впевнено-хибний вивід ШІ катастрофічний, розгортання такого ШІ
несе чисту від'ємну очікувану цінність. Математика проста: ціна однієї рідкісної
помилки, амортизована по всіх разах, коли ШІ не помиляється, має вигідно
порівнюватися з повною вартістю людини. Для задач, де ціна рідкісної помилки велика
(медичний підпис, фінансове засвідчення, регуляторна звітність), математика не
сходиться.
Два приклади. Задача фінансового аналітика «підготувати коментар до відхилень аудиторського рівня» набирає спроможності 70, надійність 60, ціну помилки 5. Спроможності середнього рівня; ціна помилки заганяє всю задачу в Human-critical. Задача керівника підтримки клієнтів «відповісти на запит регулятора» набирає спроможності 68, надійність 55, ціну помилки 5. Той самий поріг.
Тепер порівняйте з тим, куди ці задачі поміщають популярні фреймворки «ризику ШІ». Обидві задачі потрапляють у смугу «середньої-високої підданості ШІ» в інструментах, які зважують лише спроможності. Вісь ціни помилки перевертає висновок. Якщо ви фінансовий аналітик і читаєте інструмент, який ранжує вашу професію як «піддану на 78%», неявне твердження таке: 78% вашої роботи операційно заміщувані вже сьогодні. Реальність у тому, що результати аудиторського рівня — найважільніша частина ролі — операційно не заміщувані сьогодні незалежно від спроможностей і, можливо, не стануть заміщуваними ніколи, бо вісь юридичної відповідальності структурно людська.
Висновок 4 — П'ять осей людської переваги не незалежні
Ми оцінюємо кожну задачу за п'ятьма канонічними осями неусувної людської цінності: довіра (сталі стосунки), неоднозначність (зчитування незнайомої обстановки), відповідальність (іменний регульований підпис), переконання (зміна чиєїсь поведінки через людську динаміку) і контекст (багаторічна історія, яка не вміщується в вікно контексту моделі).
У корпусі v1 осі якісно групуються у дві групи. Задачі, позначені довірою, також, як правило, позначені відповідальністю — ці дві сходяться на фідуціарній роботі (медичне, юридичне, фінансове засвідчення, іменний регульований підпис). Задачі, позначені неоднозначністю, як правило, сходяться з контекстом — відкрита робота із судженнями на кшталт архітектури, проєктування систем чи стратегії керівництва. Ці два кластери в корпусі суттєво не перетинаються.
Наслідок у тому, що «human-critical робота» — не щось одне. Є щонайменше два розрізнювані види: фідуціарна робота (аудитор, лікар, юрист, іменний терапевт — висока довіра, висока відповідальність) і робота із судженнями в умовах неоднозначності (архітектор, старший продакт, провідний дизайнер — висока неоднозначність, високий контекст). Економіка автоматизації цих видів відрізняється. Фідуціарна робота має структурні людські якорі (регулювання, професійне ліцензування, іменна відповідальність). Робота із судженнями в умовах неоднозначності має якорі архітектурні (жодне вікно контексту не втримає багаторічний граф технічного боргу; жоден промпт не схопить політичну карту організації).
Кажемо це з методологічним застереженням: корпус укладено вручну, осі сьогодні закодовані рядковими тегами по кожній задачі, а не числовими оцінками, і ми публікуємо цей висновок про кластеризацію як робочу гіпотезу. Панель оцінювачів v1.5 (Claude + класу GPT-4 + класу Gemini) оцінить ці осі від 0 до 4 за структурованою рубрикою згідно з ADR-017, і медіани будуть проштамповані в матрицю — з цього моменту кореляції кластерів стануть вимірними. Якщо якісна структура кластерів устоїть, висновок реальний. Якщо вона розвалиться, ми скажемо про це на сторінці методології й оновимо пост.
Висновок 5 — Нагляд, а не інференс, — домінантна операційна вартість
Для типової клітинки v1 — при складанні хвилин нагляду на задачу, повної ставки рецензента й поточного ціноутворення на токени в константах нашої моделі витрат — найбільший окремий рядок операційної вартості ШІ — це нагляд (хвилини людської перевірки на одиницю виводу, помножені на повну ставку рецензента). Не токени. Не оркестрація. Не інтеграція. Драйвер номер один того, чи вийде розгортання ШІ в чистий плюс за економікою, — це скільки хвилин людської уваги все ще вимагає кожен вивід ШІ.
Це той рядок, який більшість публічних аналізів вартості ШІ оминає. Рядок токенів дешево порахувати й легко захистити («мільйон токенів коштує $X»). Рядок нагляду вимагає знати вісь надійності, вісь ціни помилки й повну ставку рецензента. Три числа, які більшість інструментів-калькуляторів відмовляється запитувати.
Наслідок: покращення спроможностей, що знижують рядок токенів без зниження хвилин нагляду, не зсувають економіку суттєво. Покращення надійності, що вріжуть нагляд із десяти хвилин на вивід до двох хвилин на вивід, змінюють відповідь для всієї професії. Ось чому наша методологія зважує надійність і ціну помилки як пороги й демпфери, а не як доданки суми. Спроможності визначають, які задачі входять у модель; надійність множить операційну життєздатність; ціна помилки ділить її; людська перевага її демпфірує.
Структурний прогноз: наступне покоління значущих знижень вартості праці з ШІ прийде не від дешевшого інференсу. Воно прийде від покращень надійності, які суттєво скорочують хвилини нагляду на вивід. Керівник Nvidia, що сказав Axios у квітні 2026, що «вартість обчислень значно перевершує вартість співробітників», описував рядок інференсу. Рядок надійності структурно куди важче продавити, і саме тому відкати після розгортання (Klarna, перепал бюджету на ШІ-кодинг у Uber) купчаться на тих розгортаннях, де надійність не наздогнала спроможності.
Що ми свідомо не моделювали
Три речі, названі так, щоб ви могли сперечатися з нами за правильною віссю. По-перше, цінність опціону — цінність відстрочки розгортання ШІ до того, як покращаться спроможності чи вартість. Задача, яка сьогодні набирає Human-led + AI-assisted, може за два роки зсунутися в AI-augmented; опціон почекати має для фірми реальну очікувану цінність. Ми не оцінюємо це, бо в нас немає захисної кривої зниження для надійності. Криві спроможностей піддаються розрахунку; криві надійності — ні.
По-друге, цінність стратегічного перерозподілу. Коли ШІ заміщує 20% годин задач професії, звільнені години можна перенаправити на більш важільну роботу. Економічна цінність цього перенаправлення залежить від того, чи йде звільнений час на роботу високої граничної цінності (архітектура, менторство, утримання клієнтів) чи на бічну активність. Наша модель виходить із чистої економії на звільнених годинах, що недооцінює потенціал у найкращому випадку й уникає переобіцянок у середньому. Ми свідомо консервативні.
По-третє, термінальна цінність за межами Року 5. Шар фінансової проєкції (NPV / IRR / термін окупності, доступний передплатникам Pro на кожній Wagecard) рахує на п'ять років уперед. Ми не екстраполюємо далі, бо припущення про згасання спроможностей і вартості стають довільними дуже швидко. Ми віддаємо перевагу п'ятирічній відповіді, яку можемо захистити, перед двадцятирічною, якій ніхто не повірить.
Що це означає, якщо ви читаєте як працівник розумової праці
Заголовна теза — спокійна. Більшість професій у корпусі v1 не перебувають у заголовковій біді через підданість ШІ сьогодні, і фреймворк прогнозує, що вони не опиняться в заголовковій біді й у найближчі п'ять років. Це не виправдання благодушності. Два середні класи (AI-augmented, Human-led + AI-assisted) — там, де відбувається операційний зсув, і вони вимагають від працівника активно міняти те, як він використовує ШІ — не боятися його, не звеличувати, а працювати з ним як з новим базовим рівнем інструментарію.
Якщо хочете конкретне читання для своєї ролі, географії та набору задач, майстер Wagecard займає близько трьох хвилин. Анонімний перегляд до входу; зарплата не потрібна, якщо тільки ви не хочете читання за ринковим процентилем. Цифри на вашій Wagecard беруться з тієї самої матриці, з якої ми вивели висновки вище.
Що це означає, якщо ви читаєте як керівник розгортання
Два режими відмови, які ми бачимо найчастіше в публічних відкатах, — це (1) викатки спроможностей-без-надійності, що недооцінили навантаження нагляду, і (2) задачі, Replaceable-за-заголовком, але насправді Human-critical-за-ціною-помилки. Обидва діагностовні заздалегідь. Спроможності й надійність чисто розкладаються в нашій матриці; ціна помилки — множник від 1 до 5 на задачу. Діагностика займає близько години, якщо виписати задачі. Розбір після інциденту займає близько кварталу, якщо діагностику оминути.
Якщо ви відповідаєте за розгортання ШІ для команди чи організації, B2B-представлення — це потік «встав ролі», що видає те саме виведене з матриці читання по всьому штату. Методологія та сама; поверхня — рівня організації.
Ще одне застереження
Ми до запуску. Цифри вище беруться з укладеної вручну матриці v1, відкаліброваної за публічними дослідженнями. Коли вийде панель оцінювачів v1.5 (ціль — Q3 2026), матриця буде прогнана регресійним тестом проти трьох модельних оцінювачів, і медіани будуть проштамповані в ту саму структуру даних. Якщо будь-який із п'яти висновків вище перевернеться після цього проходу, ми скажемо про це на сторінці методології, оновимо цей пост новими цифрами й проштампуємо версію. Клітинки v1 залишаться читаними; штамп версії на кожній Wagecard фіксує, яка матриця породила читання.
Із часом читання загострюється в міру того, як заповнюється реальне прийняття — які ШІ-інструменти справді використовуються, з якою інтенсивністю, за розрізом роль × географія × досвід. Сьогодні в нас цього немає по жодній клітинці; цифри вище — модельні читання, а не дані про прийняття. Пороги прозорості на /insights показують точно там, де ці дані є й де їх ще немає, за числом N, у реальному часі — включно з нулями.
Ось і весь пітч: відкрита методологія, бо економіка, гідна довіри, зобов'язана піддаватися аудиту. Кожне число виходить із методом, що його породив, і смугою довіри, щоб ви могли перевірити читання, а не вірити йому.
Коментарі та заперечення щодо методології вітаються. Найшвидший спосіб посперечатися з фреймворком — обчислити свою власну Wagecard і сказати нам, яка клітинка виглядає хибною. Версія матриці на кожній Wagecard фіксує знімок, який ви бачили; ми ведемо журнал аудиту того, як він змінювався.