tgoop.com/PromptLab_Mozlab/152
Last Update:
На что способна «убийца Nvidia» — нейросеть DeepSeek (и правда ли она так хороша)
Вчера вечером на волне новостей о взлетевшей «чудо-нейросети», обвалившей акции ИИ-компаний и лишившей Nvidia (-17%!) первого места в мировом рейтинге капитализации, не смог отказать себе в удовольствии протестировать ее.
Естественно, взял один из своих самых навороченных промптов на сложный поиск решений (по ссылке кейс, промпт и какие результаты он давал в прошлом).
Ну что же, поехали! Так ли она хороша на практике? Пройдем по шагам.
1. Удобство.
Предельный уровень комфорта испытал я, работая с ней. Приложение в аппсторе, автоматическая регистрация, и, главное, работает без каких-либо дополнительных усилий. Скачал — нажал — работает, понимаете? ;)
2. Скорость.
Выше всяких похвал (но пишут, что иногда тормозит из-за перегрузки). Я не сталкивался.
3. Интерфейс.
Очень-очень похож на ChatGPT. На мой взгляд, иногда до степени смешения. Однако удобно, минималистично, приятно. Берет почти любые файлы, но «разговаривать» пока не умеет.
4. Объем контекста.
На вход («по ее словам») дает 128К токенов (это 200-250 страниц). По сравнению с Гемини с ее контекстным окном в 2000К это не кажется восхитительным… но у меня 90% даже сложных проектов в этот объем вполне укладывается. Длина выдаваемого ответа — 4К токенов (6-8 страниц текста), что тоже отлично. Проверил. Похоже на правду.
То есть, для большинства задач по поиску решений — очень хорошо.
5. Качество ответа.
DeepSeek: приемлемо+ (4/5), на мой взгляд, на уровне GPT-4. При этом о1 (вот ее ответ) выигрывает по полноте, форматированию ответа и ощущению «исчерпывающих рассуждений» по теме (моя оценка — 5/5). Вот, посмотрите результаты моего тестирования. А вот оценки от профессионала.
6. Удержание контекста.
С третьего похожего по сложности промпта (первый и основной приведен в комментариях, вторым прошу покритиковать себя и убрать дублирование, а третьим — сделать итоговую идеальную модель) DeepSeek начала слегка путаться (обещала 10 пунктов, написала 9). При этом o1 и Gemini прекрасно удержали контекст даже на 4-5 промпте в цепочке.
Итого:
DeepSeek выигрывает по удобству (запуск без дополнительных сервисов и усилий), быстрая, умеет работать в фоне, тк приложение (интернет-версии, если закрыть браузер, приостанавливают выполнение заданий). Для простых и средних задач «на ходу» с телефона — идеальна. Не подходит для сложных задач и длинных промптинг-стратегий. Не хватает голосового режима.
Вполне тянет на модель первого выбора для несложных повседневных задач за счет (1) скорости запуска, (2) приятного и простого интерфейса и (3!) возможности работать в фоновом режиме при (4) хорошем контекстном окне и (5) адекватном качестве ответов.
PS: Бонус — для сравнения ответ ГигаЧат (через Тг-интерфейс). Оценка — 3,5-4/5. Качество идей, даже в сравнении с ChatGPT-o1, порадовало. Вижу заметный прогресс. Отдельно порадовало, что получилось отправить длинный запрос. Впрочем, смотрите и сравнивайте сами.
============
Каталог промптов и кейсов применения нейросетей в бизнесе и HR при принятии решений (30+ кейсов)
BY Лаборатория Промптинга Mozlab
Share with your friend now:
tgoop.com/PromptLab_Mozlab/152