🔥 Meta выпустила Llama 3

опубликовано  19 апр 2024
Фото - Meta выпустила Llama 3
Компания Meta выпустила две новые большие языковые модели из линейки Llama 3 с различными конфигурациями параметров (8B/70B) и открытым исходным кодом. Разработчики призывают сообщество активно подключаться к тестированию, а программистов со всего мира — помочь найти любые недостатки или критические ошибки.
В ближайшие месяцы мы выпустим несколько моделей с новыми возможностями, включая мультимодальность, способность общения на нескольких языках, более длинное контекстное окно и более мощные общие возможности,
— говорится в заявлении компании.
По словам разработчиков, им удалось снизить количество отказов, повысить креативность ответов и улучшить генерацию кода. Модели также проверялись не только стандартными синтетическими тестами, но и с использованием повседневных запросов обычных пользователей, продемонстрировав положительные результаты (см. изоб. 2).
Результаты тестирования. Источник: официальный сайт Meta.

Результаты тестирования. Источник: официальный сайт Meta.

Набор данных для обучения новых моделей, собранный исключительно из открытых источников, превышает показатели Llama 2 в семь раз. Кроме того, около 5% информации взято из неанглоязычных источников, чтобы подготовить модели к использованию в разных странах мира. Протестировать Llama 3 уже можно в официальных приложениях Meta.

Больше актуальных новостей
Sidebar ad banner