PROMPTLAB_MOZLAB Telegram 152
На что способна «убийца Nvidia» — нейросеть DeepSeek (и правда ли она так хороша)

Вчера вечером на волне новостей о взлетевшей «чудо-нейросети», обвалившей акции ИИ-компаний и лишившей Nvidia (-17%!) первого места в мировом рейтинге капитализации, не смог отказать себе в удовольствии протестировать ее.

Естественно, взял один из своих самых навороченных промптов на сложный поиск решений (по ссылке кейс, промпт и какие результаты он давал в прошлом).

Ну что же, поехали! Так ли она хороша на практике? Пройдем по шагам.

1. Удобство.

Предельный уровень комфорта испытал я, работая с ней. Приложение в аппсторе, автоматическая регистрация, и, главное, работает без каких-либо дополнительных усилий. Скачал — нажал — работает, понимаете? ;)

2. Скорость.

Выше всяких похвал (но пишут, что иногда тормозит из-за перегрузки). Я не сталкивался.

3. Интерфейс.

Очень-очень похож на ChatGPT. На мой взгляд, иногда до степени смешения. Однако удобно, минималистично, приятно. Берет почти любые файлы, но «разговаривать» пока не умеет.

4. Объем контекста.

На вход («по ее словам») дает 128К токенов (это 200-250 страниц). По сравнению с Гемини с ее контекстным окном в 2000К это не кажется восхитительным… но у меня 90% даже сложных проектов в этот объем вполне укладывается. Длина выдаваемого ответа — 4К токенов (6-8 страниц текста), что тоже отлично. Проверил. Похоже на правду.

То есть, для большинства задач по поиску решений — очень хорошо.

5. Качество ответа.

DeepSeek: приемлемо+ (4/5), на мой взгляд, на уровне GPT-4. При этом о1 (вот ее ответ) выигрывает по полноте, форматированию ответа и ощущению «исчерпывающих рассуждений» по теме (моя оценка — 5/5). Вот, посмотрите результаты моего тестирования. А вот оценки от профессионала.

6. Удержание контекста.

С третьего похожего по сложности промпта (первый и основной приведен в комментариях, вторым прошу покритиковать себя и убрать дублирование, а третьим — сделать итоговую идеальную модель) DeepSeek начала слегка путаться (обещала 10 пунктов, написала 9). При этом o1 и Gemini прекрасно удержали контекст даже на 4-5 промпте в цепочке.

Итого:

DeepSeek выигрывает по удобству (запуск без дополнительных сервисов и усилий), быстрая, умеет работать в фоне, тк приложение (интернет-версии, если закрыть браузер, приостанавливают выполнение заданий). Для простых и средних задач «на ходу» с телефона — идеальна. Не подходит для сложных задач и длинных промптинг-стратегий. Не хватает голосового режима.

Вполне тянет на модель первого выбора для несложных повседневных задач за счет (1) скорости запуска, (2) приятного и простого интерфейса и (3!) возможности работать в фоновом режиме при (4) хорошем контекстном окне и (5) адекватном качестве ответов.

PS: Бонус — для сравнения ответ ГигаЧат (через Тг-интерфейс). Оценка — 3,5-4/5. Качество идей, даже в сравнении с ChatGPT-o1, порадовало. Вижу заметный прогресс. Отдельно порадовало, что получилось отправить длинный запрос. Впрочем, смотрите и сравнивайте сами.

============

Каталог промптов и кейсов применения нейросетей в бизнесе и HR при принятии решений (30+ кейсов)



tgoop.com/PromptLab_Mozlab/152
Create:
Last Update:

На что способна «убийца Nvidia» — нейросеть DeepSeek (и правда ли она так хороша)

Вчера вечером на волне новостей о взлетевшей «чудо-нейросети», обвалившей акции ИИ-компаний и лишившей Nvidia (-17%!) первого места в мировом рейтинге капитализации, не смог отказать себе в удовольствии протестировать ее.

Естественно, взял один из своих самых навороченных промптов на сложный поиск решений (по ссылке кейс, промпт и какие результаты он давал в прошлом).

Ну что же, поехали! Так ли она хороша на практике? Пройдем по шагам.

1. Удобство.

Предельный уровень комфорта испытал я, работая с ней. Приложение в аппсторе, автоматическая регистрация, и, главное, работает без каких-либо дополнительных усилий. Скачал — нажал — работает, понимаете? ;)

2. Скорость.

Выше всяких похвал (но пишут, что иногда тормозит из-за перегрузки). Я не сталкивался.

3. Интерфейс.

Очень-очень похож на ChatGPT. На мой взгляд, иногда до степени смешения. Однако удобно, минималистично, приятно. Берет почти любые файлы, но «разговаривать» пока не умеет.

4. Объем контекста.

На вход («по ее словам») дает 128К токенов (это 200-250 страниц). По сравнению с Гемини с ее контекстным окном в 2000К это не кажется восхитительным… но у меня 90% даже сложных проектов в этот объем вполне укладывается. Длина выдаваемого ответа — 4К токенов (6-8 страниц текста), что тоже отлично. Проверил. Похоже на правду.

То есть, для большинства задач по поиску решений — очень хорошо.

5. Качество ответа.

DeepSeek: приемлемо+ (4/5), на мой взгляд, на уровне GPT-4. При этом о1 (вот ее ответ) выигрывает по полноте, форматированию ответа и ощущению «исчерпывающих рассуждений» по теме (моя оценка — 5/5). Вот, посмотрите результаты моего тестирования. А вот оценки от профессионала.

6. Удержание контекста.

С третьего похожего по сложности промпта (первый и основной приведен в комментариях, вторым прошу покритиковать себя и убрать дублирование, а третьим — сделать итоговую идеальную модель) DeepSeek начала слегка путаться (обещала 10 пунктов, написала 9). При этом o1 и Gemini прекрасно удержали контекст даже на 4-5 промпте в цепочке.

Итого:

DeepSeek выигрывает по удобству (запуск без дополнительных сервисов и усилий), быстрая, умеет работать в фоне, тк приложение (интернет-версии, если закрыть браузер, приостанавливают выполнение заданий). Для простых и средних задач «на ходу» с телефона — идеальна. Не подходит для сложных задач и длинных промптинг-стратегий. Не хватает голосового режима.

Вполне тянет на модель первого выбора для несложных повседневных задач за счет (1) скорости запуска, (2) приятного и простого интерфейса и (3!) возможности работать в фоновом режиме при (4) хорошем контекстном окне и (5) адекватном качестве ответов.

PS: Бонус — для сравнения ответ ГигаЧат (через Тг-интерфейс). Оценка — 3,5-4/5. Качество идей, даже в сравнении с ChatGPT-o1, порадовало. Вижу заметный прогресс. Отдельно порадовало, что получилось отправить длинный запрос. Впрочем, смотрите и сравнивайте сами.

============

Каталог промптов и кейсов применения нейросетей в бизнесе и HR при принятии решений (30+ кейсов)

BY Лаборатория Промптинга Mozlab


Share with your friend now:
tgoop.com/PromptLab_Mozlab/152

View MORE
Open in Telegram


Telegram News

Date: |

"Doxxing content is forbidden on Telegram and our moderators routinely remove such content from around the world," said a spokesman for the messaging app, Remi Vaughn. 4How to customize a Telegram channel? Avoid compound hashtags that consist of several words. If you have a hashtag like #marketingnewsinusa, split it into smaller hashtags: “#marketing, #news, #usa. Find your optimal posting schedule and stick to it. The peak posting times include 8 am, 6 pm, and 8 pm on social media. Try to publish serious stuff in the morning and leave less demanding content later in the day. Add up to 50 administrators
from us


Telegram Лаборатория Промптинга Mozlab
FROM American