Свяжитесь с нами

Искусственный интеллект за $1 вместо $70: модель DeepSeek V3.1 показывает результаты, сопоставимые с GPT-5 и Claude 4

21 августа 2025

Время чтения 2 мин.

224 Просмотров

Искусственный интеллект за $1 вместо $70: модель DeepSeek V3.1 показывает результаты, сопоставимые с GPT-5 и Claude 4

Китайский стартап DeepSeek произвел настоящий фурор в мире технологий, продемонстрировав свою новейшую разработку — модель искусственного интеллекта DeepSeek V3.1. Эта модель впечатляет своей масштабностью: она содержит 685 миллиардов параметров, что делает её одной из крупнейших среди существующих решений в области ИИ. Более того, разработка была опубликована в открытом доступе через платформу Hugging Face, что существенно расширяет возможности разработчиков по всему миру и снимает геополитические ограничения, связанные с доступом к передовым технологиям.

Первые результаты тестирования показали, что DeepSeek V3.1 способна конкурировать с крупнейшими моделями, такими как GPT-5 от OpenAI и Claude 4 от компании Anthropic. В частности, модель набрала 71,6% на бенчмарке Aider — тесте, предназначенном для оценки способности писать программный код и решать задачи, связанные с программированием. Эти результаты свидетельствуют о высокой эффективности алгоритма и его потенциале для использования в разнообразных сферах, от автоматизированной разработки программ до интеллектуальных систем поддержки.

Одним из главных преимуществ DeepSeek V3.1 является возможность обработки до 128 000 токенов контекста. Это примерно соответствует объему около 400 страниц текста, что значительно расширяет возможности применения модели в задачах анализа больших объемов информации. Несмотря на такую нагрузку, модель сохраняет высокую скорость отклика, что важно для взаимодействия в реальном времени в пользовательских приложениях и интеграции с бизнес-процессами.

Дополнительно, модель поддерживает различные форматы точности вычислений — от популярного BF16 до экспериментального FP8. Это дает разработчикам возможность оптимизировать производительность работы модели под специфические аппаратные платформы, экономить ресурсы и достигать наилучшей эффективности. Особенно важным является инновационная «гибридная архитектура», которая объединяет функции чата, рассуждения и генерации кода в единую систему. В отличие от предыдущих моделей, часто страдавших от снижения эффективности при расширении функций, DeepSeek V3.1 удалось сохранить высокие показатели во всех ключевых направлениях работы, что делает ее одним из самых универсальных решений на рынке.

Особое внимание стоит уделить инновации в архитектуре — исследователи внедрили четыре новых специальных токена, каждый из которых расширяет функциональность модели. Токены поиска позволяют подключаться к внешним веб-ресурсам в режиме реального времени, что значительно расширяет информационный контекст и повышает точность ответов. Токены рассуждения обеспечивают модель возможностью проведения внутренних логических операций и сложных аналитических вычислений. Эти инновационные механизмы помогают DeepSeek V3.1 достигать более высокой степени интеллектуальности и адаптивности, делая её более пригодной для сложных задач, требующих глубоко аналитического подхода.

Запуск DeepSeek V3.1 состоялся в период, когда мировое сообщество активно обсуждает выход GPT-5 и Claude 4. Это подчеркивает важность китайской разработки, которая сразу же привлекла внимание специалистов и энтузиастов индустрии. Глобальное сообщество разработчиков встретило новость о модели с большим интересом и положительным настроением, отмечая её потенциал для революции в области искусственного интеллекта и внедрения его в различные сферы экономики и науки.

В целом, DeepSeek V3.1 представляет собой впечатляющий прорыв в развитии технологий искусственного интеллекта. Его масштабность, гибкость, способность обрабатывать большие объемы информации и инновационная архитектура делают его конкурентоспособным примером современных решений. Успех этой модели открывает новые горизонты для дальнейшего развития ИИ и показывает, что Китай становится важным игроком на глобальной арене в сфере передовых технологий.

Вас может заинтересовать

Авиакомпания «Ангара» может прекратить полёты из-за частых сбоев

412

Финансы

Авиакомпания «Ангара» может прекратить полёты из-за частых сбоев

2 сентября 2025

Девушка сталкивается с призраком в новом жутком трейлере хоррора DreadOut 3

431

Игры

Девушка сталкивается с призраком в новом жутком трейлере хоррора DreadOut 3

2 сентября 2025

«Русский автомобиль»: ГАЗ и Geely разрабатывают новую «Волгу», обещая минимум одну приятную неожиданность

502

Технологии

«Русский автомобиль»: ГАЗ и Geely разрабатывают новую «Волгу», обещая минимум одну приятную неожиданность

2 сентября 2025

Зверский тигр напал на мужчину и оторвал ему голову

399

Происшествия

Зверский тигр напал на мужчину и оторвал ему голову

2 сентября 2025

Свяжитесь с нами

Игры

Девушка сталкивается с призраком в новом жутком трейлере хоррора DreadOut 3

Первый геймплей стильной MOBA с гигантами: Amazon Games представляет “March of Giants”

Экранизация пьесы “Гарри Поттер и Проклятое дитя” отменена

В команде Skyblivion возник конфликт из-за сроков выхода: Ди Киз считает, что релиз в этом году нереален

Криптовалюта

Майкл Сэйлор: крупнейший обладатель биткоинов станет лидером на крипторынке

Japan Post Bank начнет внедрение собственной цифровой валюты — DCJPY

Metaplanet объявила о намерении приобрести 210 000 биткоинов

Хакеры усиливают атаки на владельцев токенов LEASH

Политика

Си Цзиньпин заявил, что Россия и Китай стали главными победителями во Второй мировой войне

Омбудсмен ЛНР озвучила точную цифру погибших жителей региона по вине ВСУ с начала года

День Х: эксперты разоблачили скрытые послания в общении Путина, Си и Моди в Китае

В КНДР разработали новый двигатель для межконтинентальных ракет Хвасон

Происшествия

Зверский тигр напал на мужчину и оторвал ему голову

Си Цзиньпин заявил, что Москва и Китай сыграли ключевые роли в победе во Второй мировой войне

Меркачева: коррупция в СИЗО могла стать причиной «нахрапистого» побега террористов

Гости вечеринки подали в суд на изувеченную в Дубае порнозвезду Ковальчук

Технологии

«Русский автомобиль»: ГАЗ и Geely разрабатывают новую «Волгу», обещая минимум одну приятную неожиданность

Audi кардинально пересматривает стратегию и планирует продавать не менее 2 миллионов автомобилей в год

Конкурент Haval Dargo с запасом хода 1000 км и разгоном до 100 км/ч за 6,6 секунд — начались предварительные заказы на новое поколение BAIC BJ30

Новые Toyota Harrier в России: заказать дешевле, чем купить в наличии

Финансы

Авиакомпания «Ангара» может прекратить полёты из-за частых сбоев

Опрос: почти треть россиян рассматривают возможность взять ипотеку при снижении ставки ЦБ

Основной прогноз: насколько еще ЦБ сможет понизить ставку к декабрю

Россиянам сообщили, кто с 1 сентября получит повышенные пенсии

Искусственный интеллект за $1 вместо $70: модель DeepSeek V3.1 показывает результаты, сопоставимые с GPT-5 и Claude 4

Вас может заинтересовать

Авиакомпания «Ангара» может прекратить полёты из-за частых сбоев

Девушка сталкивается с призраком в новом жутком трейлере хоррора DreadOut 3

«Русский автомобиль»: ГАЗ и Geely разрабатывают новую «Волгу», обещая минимум одну приятную неожиданность

Зверский тигр напал на мужчину и оторвал ему голову

Категории

Контакты

Свяжитесь с нами

Игры

Криптовалюта

Политика

Происшествия

Технологии

Финансы

Поиск

Искусственный интеллект за $1 вместо $70: модель DeepSeek V3.1 показывает результаты, сопоставимые с GPT-5 и Claude 4

Вас может заинтересовать

Категории

Контакты