NN_FOR_SCIENCE Telegram 2482
🚀 Как построить LLM-микросервис

🗺️ Ситуация — короткий пролог

Нац-парк расставил 600 камер. Каждую ночь сыпятся сотни тысяч кадров.
Люди: 3 стажёра, 400 снимков в час, precision 0.90, recall 0.55. Устают, ошибаются.
Цель: автоматизировать так, чтобы, при сравнимом precision (когда мы сказали что зверь на фото есть, он там правда был) обнаруживать больше зверей на снимках (увеличить recall).

Как построить LLM-микросервис, который справится с этой задачей за секунды и будет стоит дешевле одной ночной пицца-парти?

🔧 Три слоя, которые делают магию

1️⃣ Инструкции — «толстый мануал на одной руке»

Мы хотим справиться с этой задачей в режиме Zero-shot ➜ значит все правила должны жить в system-prompt. Давайте разберем структуру:

ROLE: Полевой биолог-инспектор.
ЗАДАЧА: классифицировать кадр как "none"
или определить животное
ФОРМАТ:


JSON { “reasoning”: str, "label": str }


ПРАВИЛА:
1. Human.
Вертикальный силуэт + двуногая походка или «неприродные» формы/цвета → метка human.
2. Elk vs Boar.
• Есть лопатообразные рога, «борода»-bell или характерный «горб» холке → elk.
• Узкая клинообразная морда, коренастое тёмное тело, поросячьи полосы → boar.
3. Unknown-фильтр.
Если объект < 30 % кадра, детали размыты/в тени → unknown.


2️⃣ Контекст — актуальная микро-порция данных

Для каждого кадра в prompt попадают:
• EXIF-метки (дата, время, температура).
• Три последних события на этой камере.
• Сезонный список активных видов для региона.

3️⃣ Предсказание + проверка
1. LLM выдаёт JSON.
2. Скрипт-валидатор: формат? сумма правил?
3. Если что-то не так ➜ второй прогон.

Если все сделали правильно получаем precision 0.95, recall 0.89.

✏️ Чек-лист

– Мануал покрывает все edge-кейсы?
– В prompt попадают ровно нужные фичи?
– Есть автоматический ретрай с лимитом ≤3?
– Precision / recall считаются в проде, а не в «потом посмотрим»?

Это пример игрушечный, но вполне применим для почти любой бизнес задачи. А какую задачу в вашем проекте вы бы доверили LLM-микросервису первой?
👍17🔥75



tgoop.com/nn_for_science/2482
Create:
Last Update:

🚀 Как построить LLM-микросервис

🗺️ Ситуация — короткий пролог

Нац-парк расставил 600 камер. Каждую ночь сыпятся сотни тысяч кадров.
Люди: 3 стажёра, 400 снимков в час, precision 0.90, recall 0.55. Устают, ошибаются.
Цель: автоматизировать так, чтобы, при сравнимом precision (когда мы сказали что зверь на фото есть, он там правда был) обнаруживать больше зверей на снимках (увеличить recall).

Как построить LLM-микросервис, который справится с этой задачей за секунды и будет стоит дешевле одной ночной пицца-парти?

🔧 Три слоя, которые делают магию

1️⃣ Инструкции — «толстый мануал на одной руке»

Мы хотим справиться с этой задачей в режиме Zero-shot ➜ значит все правила должны жить в system-prompt. Давайте разберем структуру:

ROLE: Полевой биолог-инспектор.
ЗАДАЧА: классифицировать кадр как "none"
или определить животное
ФОРМАТ:


JSON { “reasoning”: str, "label": str }


ПРАВИЛА:
1. Human.
Вертикальный силуэт + двуногая походка или «неприродные» формы/цвета → метка human.
2. Elk vs Boar.
• Есть лопатообразные рога, «борода»-bell или характерный «горб» холке → elk.
• Узкая клинообразная морда, коренастое тёмное тело, поросячьи полосы → boar.
3. Unknown-фильтр.
Если объект < 30 % кадра, детали размыты/в тени → unknown.


2️⃣ Контекст — актуальная микро-порция данных

Для каждого кадра в prompt попадают:
• EXIF-метки (дата, время, температура).
• Три последних события на этой камере.
• Сезонный список активных видов для региона.

3️⃣ Предсказание + проверка
1. LLM выдаёт JSON.
2. Скрипт-валидатор: формат? сумма правил?
3. Если что-то не так ➜ второй прогон.

Если все сделали правильно получаем precision 0.95, recall 0.89.

✏️ Чек-лист

– Мануал покрывает все edge-кейсы?
– В prompt попадают ровно нужные фичи?
– Есть автоматический ретрай с лимитом ≤3?
– Precision / recall считаются в проде, а не в «потом посмотрим»?

Это пример игрушечный, но вполне применим для почти любой бизнес задачи. А какую задачу в вашем проекте вы бы доверили LLM-микросервису первой?

BY AI для Всех




Share with your friend now:
tgoop.com/nn_for_science/2482

View MORE
Open in Telegram


Telegram News

Date: |

As the broader market downturn continues, yelling online has become the crypto trader’s latest coping mechanism after the rise of Goblintown Ethereum NFTs at the end of May and beginning of June, where holders made incoherent groaning sounds and role-played as urine-loving goblin creatures in late-night Twitter Spaces. The group also hosted discussions on committing arson, Judge Hui said, including setting roadblocks on fire, hurling petrol bombs at police stations and teaching people to make such weapons. The conversation linked to arson went on for two to three months, Hui said. bank east asia october 20 kowloon Image: Telegram. Avoid compound hashtags that consist of several words. If you have a hashtag like #marketingnewsinusa, split it into smaller hashtags: “#marketing, #news, #usa.
from us


Telegram AI для Всех
FROM American