Зачем зубрить факты, если можно научить читать? Дообучаем маленькую LLM для RAG на примере Meno-Lite

Технологии и фреймворки

Алгоритмы

Иван Бондаренко

Зал №7

Тезисы

Современные LLM переоценены как хранилища фактов. В реальном продакшене (RAG, ассистенты, агенты) факты хранятся в базах знаний, а задача LLM — грамотно работать с поисковой выдачей, которая поступает во входной контекст модели. Гнаться за пресловутой PhD-level LLM — здесь значит просто сжигать компьют без экономической отдачи. В докладе расскажу, как мы дообучили небольшую 7B-модель, прокачав её «языковые навыки», а не знания о мире. В результате получилась Meno-Lite — модель, которая на равных конкурирует с 70B-гигантами в задачах, где ответ можно извлечь из контекста.

Аудитория

Специалист по данным / Специалист по машинному обучению, Руководитель команды / Технический руководитель

Уровень сложности

Средний

Записи выступлений доступны платным участникам CodeFest
В свободном доступе появятся через пол года

Залогиниться

Презентация

Презентация (на Я.Диске)

Технологии и фреймворки

НГУ

Иван Бондаренко

31 мая, 12:00 (GMT+7)

Зал №7

Зачем зубрить факты, если можно научить читать? Дообучаем маленькую LLM для RAG на примере Meno-Lite

Иван Бондаренко

Тезисы

Аудитория

Уровень сложности

Презентация

Иван Бондаренко

Иван Бондаренко

Другие спикеры трека Технологии и фреймворки

Сергей Иванов

Егор Шестопалов

Дмитрий Еникеев

Даниил Рублев

Мария Кондаурова

Виктор Вершанский

Кирилл Красиков

Алексей Артюшин

Кирилл Ковалёв

Никита Нагорнов

Анатолий Чуриков

Дмитрий Егоров

Дмитрий Кузнецов