Международный IT-гигант Meta представил новый комплекс ИИ-моделей под названием Llama 2. В отличие от предыдущей модели LLaMA, эта версия доступна для свободного скачивания и применения не только в научных целях. Разработчики могут использовать Llama 2 для реализации своих коммерческих и творческих проектов.
Набор включает в себя ИИ-программы различных размеров: от семи до семидесяти миллиардов параметров. Для обучения были учтены более 1 млн пользовательских аннотаций. Разработчики применили технику контролируемой доводки и метод обучения с подкреплением, чтобы поднять качество и уровень безопасности. Модели доступны на облачных платформах Microsoft Azure, Amazon Web Services, Hugging Face.
Генеральный директор Meta, Марк Цукерберг, подчеркнул, что открытый исходный код способствует прогрессу, так как он позволяет большему количеству пользователей опробовать новые технологии. Поэтому было решено сделать открытой и Llama 2.
«Когда программное обеспечение находится в общем доступе, больше людей может изучить его и заметить потенциальные проблемы»,
— заявил Цукерберг.
Однако ограничения все же есть. Компании, желающие использовать программу для поддержки более 700 миллионов активных пользователей в месяц, должны запросить специальную лицензию у Meta*.
Новая версия основана на архитектуре предыдущей, но обучена на большем количестве токенов и способна обрабатывать больший объем текста. Тем не менее, специалисты предупредили, что Llama 2 еще не доведена до идеала и может генерировать «оскорбительный или предвзятый контент».
Разработчики уверены, что бесплатная Llama 2 откроет компаниям новые горизонты экспериментов с ИИ. Например, производитель чипов Qualcomm уже объявил о планах по созданию «ИИ-реализаций на базе Llama 2» для смартфонов и ПК начиная с 2024 года.
Первая LLaMA была анонсирована в феврале. Тогда Марк Цукерберг подчеркнул, что разработка «обеспечит перспективные возможности в сфере генерации текстов, диалогов, резюмирования текстовых данных и выполнения более сложных задач, включая доказательство теорем и предсказание структуры белков».
Источник: securitylab.ru