Где взять данные для предобучения LLM — Анатолий Потапов, Тинькофф
Желтый AI Желтый AI
2.02K subscribers
8,597 views
349

 Published On Nov 2, 2023

Вы вдруг решили, что вам недостаточно LLaMA-2 и вы очень хотите сделать свою LLM. Где взять данные для предобучения? Большая часть проблем в воспроизведении результатов ChatGPT лежит именно в данных для предобучения. Модель берет все свои знания о мире с этапа претрейна, алаймент же позволяет их вытащить. Анатолий рассказал, какие есть тонкости и нюансы при подготовке датасетов для предобучения и что они уже сделали с командой.

Наш телеграм: https://t.me/tinkoffai
Дайджесты, статьи и анонсы митапов: https://t.me/itstinkoff
Жизнь команда изнутри и вакансии по направлениям: https://t.me/tinkoffjobs
Блог на Хабре: https://l.tinkoff.ru/habr-tinkoff

#ai #ml #rl #тинькофф

show more

Share/Embed