Слитой на GitHub библиотекой могут воспользоваться разработчики по всему миру — она не только ускорит обучение нейросетей, но и снизит расход ресурсов графических процессоров до 20%.
В открытом доступе появился ускоритель обучения нейросетей «Яндекса». Использование YaFSDP сократит расходы на оборудование для обучения больших языковых моделей и прочих нейросетей, утверждают в «Яндексе».
Как отмечается в пресс-релизе компании, библиотека подойдёт, в том числе, для экспресс-обучения ИИ, предназначенного для генерации картинок. Упомянуто, что использование YaFSDP позволит исследователям по всему миру серьёзно уменьшить нагрузку на оборудование.
«Яндекс» создал YaFSDP, когда обучал свою генеративную модель YandexGPT 3. Тесты показали, что, например, использование библиотеки для LLaMA 2 сократит предварительное обучение почти на две недели — с 66 до 53 дней.
В благонадёжности YandexGPT недавно усомнился бывший президент России Дмитрий Медведев. Протестировав сервис, встроенный в «Алису», он пришёл к выводу, что этот искусственный интеллект — «страшный трус». Дело в том, что нейросеть уклонилась от ответов на вопросы о памятниках Бандере на Украине, изъятии российских активов в США и расстоянии между Киевом и Белгородом. Политик даже увидел основания для признания сервисов «Яндекса» очень неполными, а действующих менеджеров компании — иноагентами.