Наблюдаемость сегодня — не только метрики и дашборды: это ещё и контроль изменений, когда ошибка стоит репутации поиска, и контроль качества там, где ответы генерирует модель. На треке соединяются «классическая» инженерная зрелость релизов с темой, которая всплыла у многих команд за последние годы: как оценивать LLM в проде не разовой разметкой, а регулярным процессом — с формализованными правилами качества и подходами вроде LLM-as-a-Judge.