Warning: Undefined array key 0 in /var/www/tgoop/function.php on line 65

Warning: Trying to access array offset on null in /var/www/tgoop/function.php on line 65
54 - Telegram Web
Telegram Web
Во вторник был концерт Пилотов. И он был восхитительный! 🥹
2 часа полного восторга. Исполнение, шоу, видеоряд и эффекты - все вышка!
У меня долгая история с этим мероприятием. Еще в далеком 2020-ом я должен был попасть на концерт в Москве. Тогда еще был только Trench. Но напал ковид. Концерт переносили 2 раза на год, но после начала войны совсем отменили. И вот спустя 2 альбома и 5 лет давняя мечта закрыта🙂

Еще понравилась площадка Palau Sant Jordi. Зашел в дверь - и сразу места. Никаких сотен коридоров и миллиона металлоискателей)
5
*делаю документацию для пайплайна с описанием работы*

Я:
- чат гпт сейчас все формально оформит
Чат гпт:
😁4
Screenshot 2025-05-07 at 18.27.06.png
19.6 KB
Я один супер кайфую от зеленой надписи, что все тесты пройдены?
Прям хочется тесты ради этого написать 😅
🔥3🤓1
Очень интересная статья. Авторы показали, что можно сделать классную ризонинг-модель, которая будет превосходить o1-preview от OpenAI на математике, всего лишь с помощью простого супервайзного файнтюнинга (SFT) на 1000 отобранных семплах. В статье продемонстрировали test-time scaling (линейная зависимость между метрикой качества и логарифмом числа токенов). Чем дольше модель думает, тем лучше результат: 50% → 56.7% accuracy.

Что сделали:

1. Качественный датасет: семплы в формате *вопрос - размышление - ответ*. Для генерации размышлений и ответов использовали разные модели. Например, Gemini 2.0 Flash Thinking.
2. Дообучили Qwen-2.5-32B-Instruct, чтобы научить «думать». Для этого ввели новую роль think в шаблон промпта. Внутри размышления использовали разделитель “Wait”. Обучение заняло всего 26 минут на H100!
3. На инференсе модель работает так:
1. Сначала генерируем стандартный ответ ассистента:


<|im_start|>system
You are Qwen, created by Alibaba Cloud. You are a helpful assistant.
<|im_end|>
<|im_start|>user
How many r in raspberry
<|im_end|>
<|im_start|>assistant


2. Затем открываем блок размышления: <|im_start|>think
3. Каждый раз, когда модель пытается закрыть блок (`<|im_end|>`), мы добавляем в промпт слово "Wait". Это заставляет её продолжать размышлять. Повторяем столько раз, сколько ресурсов есть на генерацию токенов.
4. В конце закрываем блок размышления (`<|im_end|>`) и просим модель сгенерировать финальный ответ:


<|im_start|>assistant
(final answer here)
<|im_end|


Впечатлило то, что можно очень просто сделать под свою задачу классную ризонинг модель, не обладая всеми кластерами мира) Как будто, можно даже на колабе справиться, если взять Qwen поменше. Но это будет больно, конечно))
🔥3
Традиционный (не очень) пятничный душный обзор

На этой неделе экспериментировал с новой моделькой OpenAI gpt-image-1. Мне нужно перекрашивать фасады домов в заданный цвет. Следующие наблюдения:
По большей части перекрашивает классно. Даже в отражении в окне машины меняет цвет дома!
Убирает пятна на стенах, мох на крыше и сохраняет тени — что топчик.
Не нужен мудрёный промпт, и цвета можно передавать в формате RGB. Точно 1 в 1 цвет не сделает, но будет похоже.
Есть наблюдение, что имеет смысл те элементы, которые красятся и детектятся хуже, перемещать выше в списке. Мне нужно было, чтобы не менялся соффит (это такой белый «подбородок» под крышей) и лучше находились кирпичные элементы — перенёс в начало списка, и заработало лучше.
Без небольших галлюцинаций и искажений не обойтись. Как ни промпть, нет-нет да что-нибудь перерисует. Особенно проблемы с лицами людей — там вообще трэш бывает.
В API есть функционал применения масок. Утверждается, что изменения будут проводиться только в прозрачной области маски. На моей задаче выделения части дома (если твой дом — это левая часть semi-detached house) не сработало. Учили перерисовывать и генерить объекты. Так и происходит: то стена становится кирпичной, то дом меняется до неузнаваемости (вторая картинка).
4😍1
2025/10/28 10:04:06
Back to Top
HTML Embed Code: