Поговорим об архитектуре онлайн-оценки LLM-продуктов с использованием LLM-as-a-Judge и формализованных правил качества,
а также о развитии платформ метрик, применении ML для поиска аномалий и ограничениях универсальных детекторов в недетерминированных
системах.