PROMPTLAB_MOZLAB Telegram 173
Промптинг устарел, данные рулят! Мой опыт работы с данными для получения блестящих результатов от нейросетей

Хм, а это только у меня теперь работа с нейросетями — это на 70% подготовка данных и только 30% — собственно промптинг?

Поймал себя на мысли, что у меня возникла довольно продвинутая система предподготовки данных для работы с нейросетями. Я бы даже слегка выпендрился и сказал, что создаю свою нейросеть с «вручную управляемой» технологией RAG (Retrieval-Augmented Generation, в комментах подробнее).

Как устроена моя система хранения предподготовленых данных?

1. Папка с книгами по важным темам (с реальной книгой ИИ работает лучше, чем со своими «воспоминаниями» о ней). Плюс ссылки на реальные страницы

2. Папки с файлами с длинными промптами (удобнее, чем гонять между разными нейросетями, выискивая и копируя из одной в другую)

3. Специальный личный Тг-канал с промптами и находками, где темы = сообщения, а промпты и интересные находки = комменты (иначе не протолкнуться от длинных полотен)

4. (!) Папка с «цифровыми двойниками» людей, их контента и других полезностей, чтобы не искать и сразу давать полный контекст, если приспичит что-то спросить или поискать

* Файл со всеми постами моего основного канала
* Файл со всеми постами канала моей жены-психолога
* Файл со всеми постами канала моей дочери-кинопродюсера
* Файл про собаку дочери с кучей ветеринарной инфо
* Файл про меня рабочего, ещё один — про меня нерабочего
* Файл про то, как организован маркетинг у нас в компании
… и ещё две дюжины всякого

5. Папка с образцами удачных ответов нейросети по разными темам (чтобы быстро дать и сказать: «примерно так!»)

6. Ещё куча всего

Понимаете?

Когда мне надо решить какую-то задачу (например, дочка советуется по поводу того, какую работу выбрать) — у меня все готово для того, чтобы мгновенно скормить нейросети увесистый пакет данных и получить предельно точный ответ. И это прекрасно, потому что никакой промпт не даст такой точности (разве что в него всю эту информацию скопировать).

А когда я сталкиваюсь с полезным контентом (или получаю классный ответ) — я тут же закидываю его в соответствующую папку.

Я — продвинутый пользователь?

Эх, не зря, не зря Альтман сказал в том недавнем интервью, что молодежь, дескать, организует работу с нейросетью весьма навороченным образом:

«Они действительно используют его как операционную систему. Эм, у них есть сложные способы его настройки, чтобы подключать к куче файлов, и у них в голове или, знаете, где-то, куда они копируют и вставляют, запомнены довольно сложные промпты, и, эм, то, я думаю, все это круто и впечатляюще»

Хотя разве я молодежь?;) Но, впрочем, я уже писал, что корректнее было бы сказать: продвинутые и обычные пользователи нейросети.

А почему бы не хранить всё это внутри нейросети?

Потому что это влияет на контекст ответов. Читая ответ ЧатГПТ, который уже накопил кучу контекста по мне, я сталкиваюсь с предвзятыми ответами (в первую очередь, из файлов и книг, которые я загружал). Особенно если запускаю новый чат из папки проекта — там вообще кошмар. Просто новый чат — полегче, но все равно заметно, что он использует накопленные данные обо мне.

А заходя, к примеру, в Гемини, который контент не копит — я получаю «чистые» акценты. Менее предвзятые. Но для качественного ответа, очевидно, нужны исчерпывающие данные. Получается, собирая и структурируя данные для формирования конкретного запроса, я спасаюсь из тщательно формирующегося для меня пузыря. И заодно — никаких галлюцинаций!

Ну и попутно формирую цифровую копию моей жизни. Как и говорил Альтман.

А как у вас?

Какие папки, промпты и предзаготовленные данные у вас есть? Или вы этим не занимаетесь и просто промптите «с листа»? Пишите в комментариях и заполняйте опрос!
🔥1811👍3



tgoop.com/PromptLab_Mozlab/173
Create:
Last Update:

Промптинг устарел, данные рулят! Мой опыт работы с данными для получения блестящих результатов от нейросетей

Хм, а это только у меня теперь работа с нейросетями — это на 70% подготовка данных и только 30% — собственно промптинг?

Поймал себя на мысли, что у меня возникла довольно продвинутая система предподготовки данных для работы с нейросетями. Я бы даже слегка выпендрился и сказал, что создаю свою нейросеть с «вручную управляемой» технологией RAG (Retrieval-Augmented Generation, в комментах подробнее).

Как устроена моя система хранения предподготовленых данных?

1. Папка с книгами по важным темам (с реальной книгой ИИ работает лучше, чем со своими «воспоминаниями» о ней). Плюс ссылки на реальные страницы

2. Папки с файлами с длинными промптами (удобнее, чем гонять между разными нейросетями, выискивая и копируя из одной в другую)

3. Специальный личный Тг-канал с промптами и находками, где темы = сообщения, а промпты и интересные находки = комменты (иначе не протолкнуться от длинных полотен)

4. (!) Папка с «цифровыми двойниками» людей, их контента и других полезностей, чтобы не искать и сразу давать полный контекст, если приспичит что-то спросить или поискать

* Файл со всеми постами моего основного канала
* Файл со всеми постами канала моей жены-психолога
* Файл со всеми постами канала моей дочери-кинопродюсера
* Файл про собаку дочери с кучей ветеринарной инфо
* Файл про меня рабочего, ещё один — про меня нерабочего
* Файл про то, как организован маркетинг у нас в компании
… и ещё две дюжины всякого

5. Папка с образцами удачных ответов нейросети по разными темам (чтобы быстро дать и сказать: «примерно так!»)

6. Ещё куча всего

Понимаете?

Когда мне надо решить какую-то задачу (например, дочка советуется по поводу того, какую работу выбрать) — у меня все готово для того, чтобы мгновенно скормить нейросети увесистый пакет данных и получить предельно точный ответ. И это прекрасно, потому что никакой промпт не даст такой точности (разве что в него всю эту информацию скопировать).

А когда я сталкиваюсь с полезным контентом (или получаю классный ответ) — я тут же закидываю его в соответствующую папку.

Я — продвинутый пользователь?

Эх, не зря, не зря Альтман сказал в том недавнем интервью, что молодежь, дескать, организует работу с нейросетью весьма навороченным образом:

«Они действительно используют его как операционную систему. Эм, у них есть сложные способы его настройки, чтобы подключать к куче файлов, и у них в голове или, знаете, где-то, куда они копируют и вставляют, запомнены довольно сложные промпты, и, эм, то, я думаю, все это круто и впечатляюще»

Хотя разве я молодежь?;) Но, впрочем, я уже писал, что корректнее было бы сказать: продвинутые и обычные пользователи нейросети.

А почему бы не хранить всё это внутри нейросети?

Потому что это влияет на контекст ответов. Читая ответ ЧатГПТ, который уже накопил кучу контекста по мне, я сталкиваюсь с предвзятыми ответами (в первую очередь, из файлов и книг, которые я загружал). Особенно если запускаю новый чат из папки проекта — там вообще кошмар. Просто новый чат — полегче, но все равно заметно, что он использует накопленные данные обо мне.

А заходя, к примеру, в Гемини, который контент не копит — я получаю «чистые» акценты. Менее предвзятые. Но для качественного ответа, очевидно, нужны исчерпывающие данные. Получается, собирая и структурируя данные для формирования конкретного запроса, я спасаюсь из тщательно формирующегося для меня пузыря. И заодно — никаких галлюцинаций!

Ну и попутно формирую цифровую копию моей жизни. Как и говорил Альтман.

А как у вас?

Какие папки, промпты и предзаготовленные данные у вас есть? Или вы этим не занимаетесь и просто промптите «с листа»? Пишите в комментариях и заполняйте опрос!

BY Лаборатория Промптинга Замышляева


Share with your friend now:
tgoop.com/PromptLab_Mozlab/173

View MORE
Open in Telegram


Telegram News

Date: |

But a Telegram statement also said: "Any requests related to political censorship or limiting human rights such as the rights to free speech or assembly are not and will not be considered." Hashtags Your posting frequency depends on the topic of your channel. If you have a news channel, it’s OK to publish new content every day (or even every hour). For other industries, stick with 2-3 large posts a week. A new window will come up. Enter your channel name and bio. (See the character limits above.) Click “Create.” Telegram channels enable users to broadcast messages to multiple users simultaneously. Like on social media, users need to subscribe to your channel to get access to your content published by one or more administrators.
from us


Telegram Лаборатория Промптинга Замышляева
FROM American