На прошлой неделе я добавил Mira в уже работающую цепочку обработки.



Ничего особенного. Она извлекает пункты из контрактов и отправляет их на классификацию дальше по цепочке. Точность модели была хорошей. Задержка — тоже. Никто не жаловался на производительность.

Проблема была не в модели.

Проблема — в утверждении.

Каждый извлечённый пункт всё равно должен был быть проверен человеком, прежде чем двигаться дальше. Не потому, что модель была плохой. Потому что соответствие требованиям не заботится о доверительных оценках. Им важны доказательства. В политике прямо сказано «человеческая проверка». Эта строка не меняется просто потому, что показатели улучшаются.

Вместо того чтобы снова спорить о точности модели, я попробовал что-то другое.

Я установил SDK Mira.
Указал ему конечную точку. Добавил ключ. Запустил первый вызов.

Ответ выглядел нормально. Если смотреть только на вывод, можно было подумать, что ничего не изменилось.

Разница проявилась в логах.

Первая пункт: простая вещь. Ссылка на дату. Применимое право. Стандартный язык. Валидация прошла почти мгновенно. Кворум сформировался быстро. Стейк заложен. Сертификат выдан. Хэш вывода закреплён.

Готово.

Вторая пункт казалась похожей на первый взгляд. Тот же набор контрактов. Но в этом был оговор о возмещении с условной формулировкой. Такой язык, который меняет смысл в зависимости от того, как его читаешь. Или какую юрисдикцию имеешь в виду.

На этот раз проверка заняла больше времени.

Можно было видеть, как валидаторы формируют мнения. Разные модели. Разные запуски обучения. Каждая оценивает одно и то же утверждение независимо.

Некоторые склонялись к одному. Некоторые — к другому.

Вес кворума увеличился.
Пауза.
Опять увеличился.

В конце концов он пересёк порог. Сертификат напечатан. Проверка прошла.

Но выделялось ещё одно — вес несогласия.

Хотя утверждение прошло, уровень разногласий был выше, чем у первого пункта. Это число оставалось видимым.

В старой цепочке этого бы не было. Модель возвращала бы ответ уверенным тоном. Всё казалось одинаково уверенным. Никогда бы не узнал, что возможны несколько разумных интерпретаций.

Здесь же утверждение всё равно проходит. Но видно, насколько чисто было согласие.

Я проверил ещё пункты.

Та же картина каждый раз.

Явные фактические утверждения проходят быстро. Консенсус формируется быстро. Меньше разногласий. Легко.

Интерпретационные утверждения требуют больше времени. Уверенность колеблется, прежде чем стабилизироваться. Иногда уровень разногласий остаётся высоким даже после выдачи сертификата.

Это стало интересно.

Никто не запрашивал этот сигнал. Исходная цель была проста: заменить «человеческую проверку» чем-то криптографическим.

Но как только в логах появился вес несогласия, рабочий процесс сам по себе изменился.

Рецензенты начали сначала проверять пункты с высоким уровнем разногласий. Не потому, что проверка не прошла. А потому, что система показывала, где есть реальная неопределённость.

Пункты с ясным согласием перестали автоматически получать вторую проверку.

Очередь на проверку сократилась.

Не потому, что модель стала умнее. А потому, что неопределённость перестала скрываться.

Старая цепочка всё сводила к одному. Каждый вывод казался одинаково уверенным. Поэтому люди относились ко всему как к потенциально рискованному.

Теперь есть градация.

Некоторые пункты явно надёжны. Некоторые — явно нет. А некоторые — в серой зоне.

Эта серая зона раньше была невидимой.

Mira не притворяется, что разногласия не существуют. Она их фиксирует. Сертификат не просто говорит «да». Он показывает, насколько сильно сеть согласна.

И оказывается, именно это было нужно соответствию требованиям.

Не ещё один процент точности.

Не более сложная модель.

Просто способ увидеть, где модель может ошибаться.

Когда это видно, ты уже не проверяешь всё одинаково.
MIRA3,43%
Посмотреть Оригинал
post-image
post-image
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 1
  • Репост
  • Поделиться
комментарий
0/400
ybaservip
· 1ч назад
Алмазные руки 💎
Посмотреть ОригиналОтветить0
  • Закрепить