PROMPTLAB_MOZLAB Telegram 152
На что способна «убийца Nvidia» — нейросеть DeepSeek (и правда ли она так хороша)

Вчера вечером на волне новостей о взлетевшей «чудо-нейросети», обвалившей акции ИИ-компаний и лишившей Nvidia (-17%!) первого места в мировом рейтинге капитализации, не смог отказать себе в удовольствии протестировать ее.

Естественно, взял один из своих самых навороченных промптов на сложный поиск решений (по ссылке кейс, промпт и какие результаты он давал в прошлом).

Ну что же, поехали! Так ли она хороша на практике? Пройдем по шагам.

1. Удобство.

Предельный уровень комфорта испытал я, работая с ней. Приложение в аппсторе, автоматическая регистрация, и, главное, работает без каких-либо дополнительных усилий. Скачал — нажал — работает, понимаете? ;)

2. Скорость.

Выше всяких похвал (но пишут, что иногда тормозит из-за перегрузки). Я не сталкивался.

3. Интерфейс.

Очень-очень похож на ChatGPT. На мой взгляд, иногда до степени смешения. Однако удобно, минималистично, приятно. Берет почти любые файлы, но «разговаривать» пока не умеет.

4. Объем контекста.

На вход («по ее словам») дает 128К токенов (это 200-250 страниц). По сравнению с Гемини с ее контекстным окном в 2000К это не кажется восхитительным… но у меня 90% даже сложных проектов в этот объем вполне укладывается. Длина выдаваемого ответа — 4К токенов (6-8 страниц текста), что тоже отлично. Проверил. Похоже на правду.

То есть, для большинства задач по поиску решений — очень хорошо.

5. Качество ответа.

DeepSeek: приемлемо+ (4/5), на мой взгляд, на уровне GPT-4. При этом о1 (вот ее ответ) выигрывает по полноте, форматированию ответа и ощущению «исчерпывающих рассуждений» по теме (моя оценка — 5/5). Вот, посмотрите результаты моего тестирования. А вот оценки от профессионала.

6. Удержание контекста.

С третьего похожего по сложности промпта (первый и основной приведен в комментариях, вторым прошу покритиковать себя и убрать дублирование, а третьим — сделать итоговую идеальную модель) DeepSeek начала слегка путаться (обещала 10 пунктов, написала 9). При этом o1 и Gemini прекрасно удержали контекст даже на 4-5 промпте в цепочке.

Итого:

DeepSeek выигрывает по удобству (запуск без дополнительных сервисов и усилий), быстрая, умеет работать в фоне, тк приложение (интернет-версии, если закрыть браузер, приостанавливают выполнение заданий). Для простых и средних задач «на ходу» с телефона — идеальна. Не подходит для сложных задач и длинных промптинг-стратегий. Не хватает голосового режима.

Вполне тянет на модель первого выбора для несложных повседневных задач за счет (1) скорости запуска, (2) приятного и простого интерфейса и (3!) возможности работать в фоновом режиме при (4) хорошем контекстном окне и (5) адекватном качестве ответов.

PS: Бонус — для сравнения ответ ГигаЧат (через Тг-интерфейс). Оценка — 3,5-4/5. Качество идей, даже в сравнении с ChatGPT-o1, порадовало. Вижу заметный прогресс. Отдельно порадовало, что получилось отправить длинный запрос. Впрочем, смотрите и сравнивайте сами.

============

Каталог промптов и кейсов применения нейросетей в бизнесе и HR при принятии решений (30+ кейсов)
👍2120🔥11



tgoop.com/PromptLab_Mozlab/152
Create:
Last Update:

На что способна «убийца Nvidia» — нейросеть DeepSeek (и правда ли она так хороша)

Вчера вечером на волне новостей о взлетевшей «чудо-нейросети», обвалившей акции ИИ-компаний и лишившей Nvidia (-17%!) первого места в мировом рейтинге капитализации, не смог отказать себе в удовольствии протестировать ее.

Естественно, взял один из своих самых навороченных промптов на сложный поиск решений (по ссылке кейс, промпт и какие результаты он давал в прошлом).

Ну что же, поехали! Так ли она хороша на практике? Пройдем по шагам.

1. Удобство.

Предельный уровень комфорта испытал я, работая с ней. Приложение в аппсторе, автоматическая регистрация, и, главное, работает без каких-либо дополнительных усилий. Скачал — нажал — работает, понимаете? ;)

2. Скорость.

Выше всяких похвал (но пишут, что иногда тормозит из-за перегрузки). Я не сталкивался.

3. Интерфейс.

Очень-очень похож на ChatGPT. На мой взгляд, иногда до степени смешения. Однако удобно, минималистично, приятно. Берет почти любые файлы, но «разговаривать» пока не умеет.

4. Объем контекста.

На вход («по ее словам») дает 128К токенов (это 200-250 страниц). По сравнению с Гемини с ее контекстным окном в 2000К это не кажется восхитительным… но у меня 90% даже сложных проектов в этот объем вполне укладывается. Длина выдаваемого ответа — 4К токенов (6-8 страниц текста), что тоже отлично. Проверил. Похоже на правду.

То есть, для большинства задач по поиску решений — очень хорошо.

5. Качество ответа.

DeepSeek: приемлемо+ (4/5), на мой взгляд, на уровне GPT-4. При этом о1 (вот ее ответ) выигрывает по полноте, форматированию ответа и ощущению «исчерпывающих рассуждений» по теме (моя оценка — 5/5). Вот, посмотрите результаты моего тестирования. А вот оценки от профессионала.

6. Удержание контекста.

С третьего похожего по сложности промпта (первый и основной приведен в комментариях, вторым прошу покритиковать себя и убрать дублирование, а третьим — сделать итоговую идеальную модель) DeepSeek начала слегка путаться (обещала 10 пунктов, написала 9). При этом o1 и Gemini прекрасно удержали контекст даже на 4-5 промпте в цепочке.

Итого:

DeepSeek выигрывает по удобству (запуск без дополнительных сервисов и усилий), быстрая, умеет работать в фоне, тк приложение (интернет-версии, если закрыть браузер, приостанавливают выполнение заданий). Для простых и средних задач «на ходу» с телефона — идеальна. Не подходит для сложных задач и длинных промптинг-стратегий. Не хватает голосового режима.

Вполне тянет на модель первого выбора для несложных повседневных задач за счет (1) скорости запуска, (2) приятного и простого интерфейса и (3!) возможности работать в фоновом режиме при (4) хорошем контекстном окне и (5) адекватном качестве ответов.

PS: Бонус — для сравнения ответ ГигаЧат (через Тг-интерфейс). Оценка — 3,5-4/5. Качество идей, даже в сравнении с ChatGPT-o1, порадовало. Вижу заметный прогресс. Отдельно порадовало, что получилось отправить длинный запрос. Впрочем, смотрите и сравнивайте сами.

============

Каталог промптов и кейсов применения нейросетей в бизнесе и HR при принятии решений (30+ кейсов)

BY Лаборатория Промптинга Замышляева


Share with your friend now:
tgoop.com/PromptLab_Mozlab/152

View MORE
Open in Telegram


Telegram News

Date: |

Other crimes that the SUCK Channel incited under Ng’s watch included using corrosive chemicals to make explosives and causing grievous bodily harm with intent. The court also found Ng responsible for calling on people to assist protesters who clashed violently with police at several universities in November 2019. Telegram is a leading cloud-based instant messages platform. It became popular in recent years for its privacy, speed, voice and video quality, and other unmatched features over its main competitor Whatsapp. Ng was convicted in April for conspiracy to incite a riot, public nuisance, arson, criminal damage, manufacturing of explosives, administering poison and wounding with intent to do grievous bodily harm between October 2019 and June 2020. Telegram offers a powerful toolset that allows businesses to create and manage channels, groups, and bots to broadcast messages, engage in conversations, and offer reliable customer support via bots. Telegram has announced a number of measures aiming to tackle the spread of disinformation through its platform in Brazil. These features are part of an agreement between the platform and the country's authorities ahead of the elections in October.
from us


Telegram Лаборатория Промптинга Замышляева
FROM American