DeepSeek выпустила улучшенную версию ИИ-модели R1 с 685 млрд параметров

Китайский стартап DeepSeek выпустил обновлённую версию ИИ-модели R1 и разместил её на платформе Hugging Face под открытой MIT-лицензией. В заявлении компании в WeChat сообщается, что модель получила незначительное обновление и её можно свободно использовать в коммерческих проектах.

DeepSeek выпустила улучшенную версию ИИ-модели R1 с 685 млрд параметров

Источник изображения: John Cameron / Unsplash

В репозитории Hugging Face пока нет подробного описания модели. Только конфигурационные файлы и «веса» (weights) — числовые параметры, которые определяют её поведение и возможности. Обновлённая R1 содержит 685 миллиардов параметров, что делает её крайне ресурсоёмкой и, как отмечает TechCrunch, без дополнительной оптимизации запустить такую модель на обычных пользовательских компьютерах вряд ли возможно.

Напомним, проект DeepSeek привлёк широкое внимание в начале этого года после релиза первой версии R1, которая составила конкуренцию моделям OpenAI. Однако успех стартапа вызвал обеспокоенность у некоторых регуляторов в США — они считают, что технологии компании могут представлять потенциальную угрозу национальной безопасности.

Несмотря на это, DeepSeek продолжает развивать свою ИИ-платформу. Открытая лицензия MIT позволяет разработчикам и бизнесу свободно тестировать и внедрять R1 в свои продукты, хотя для работы с моделью и требуются серьёзные вычислительные мощности.

Источник: 3dnews.ru

Next Post

Акции HP Inc обвалились на 15 % после публикации квартального прогноза с учётом влияния таможенных пошлин

Входящая в тройку крупнейших производителей ПК и ноутбуков американская компания HP Inc. на этой неделе отчиталась о результатах прошедшего фискального квартала и дала прогноз на следующий. Хотя выручка прошлого квартала превзошла ожидания аналитиков, прогноз по удельной прибыли на текущий разочаровал их, и виной всему стало потенциальное влияние таможенных пошлин на […]