MACHINELEARNING_RU Telegram 3005
📈 LLM для трейдинга

Вышла специализированная модель - Trading-R1 (4B параметров), обученная на финансовом домене.
Она умеет писать чёткие аналитические тезисы и превращать их в торговые решения.

🔍 Задача
- Квант-модели дают хорошие сигналы, но их сложно читать.
- Общие LLM красиво пишут тексты, но они не конвертируются в дисциплинированные сделки.

💡 Решение
- Жёсткий формат тезиса: отдельные секции для рыночных данных, фундаментала и сентимента.
- Каждое утверждение подкрепляется ссылкой на данные из контекста.
- Прогнозы приводятся к 5 меткам: Strong Buy, Buy, Hold, Sell, Strong Sell, с учётом доходности, нормализованной по волатильности.

🛠️ Обучение
1. На старте - supervised fine-tuning: дистилляция качественного reasoning от сильных black-box моделей.
2. Далее - улучшение через Group Relative Policy Optimization (GRPO).

📊 Результаты
- Датасет: 100K кейсов за 18 месяцев, 14 тикеров.
- На отложенных тестах (NVDA, AAPL, AMZN, META, MSFT, SPY) модель показывает:
- Более высокие Sharpe ratio
- Меньшие просадки
- Авторы позиционируют её как инструмент для ресёрча и поддержки решений, а не для высокочастотной торговли.

🔗 Trading-R1 — пример того, как LLM могут объединять объяснимый анализ и формализм квант-моделей.

https://arxiv.org/abs/2509.11420
🤔42



tgoop.com/machinelearning_ru/3005
Create:
Last Update:

📈 LLM для трейдинга

Вышла специализированная модель - Trading-R1 (4B параметров), обученная на финансовом домене.
Она умеет писать чёткие аналитические тезисы и превращать их в торговые решения.

🔍 Задача
- Квант-модели дают хорошие сигналы, но их сложно читать.
- Общие LLM красиво пишут тексты, но они не конвертируются в дисциплинированные сделки.

💡 Решение
- Жёсткий формат тезиса: отдельные секции для рыночных данных, фундаментала и сентимента.
- Каждое утверждение подкрепляется ссылкой на данные из контекста.
- Прогнозы приводятся к 5 меткам: Strong Buy, Buy, Hold, Sell, Strong Sell, с учётом доходности, нормализованной по волатильности.

🛠️ Обучение
1. На старте - supervised fine-tuning: дистилляция качественного reasoning от сильных black-box моделей.
2. Далее - улучшение через Group Relative Policy Optimization (GRPO).

📊 Результаты
- Датасет: 100K кейсов за 18 месяцев, 14 тикеров.
- На отложенных тестах (NVDA, AAPL, AMZN, META, MSFT, SPY) модель показывает:
- Более высокие Sharpe ratio
- Меньшие просадки
- Авторы позиционируют её как инструмент для ресёрча и поддержки решений, а не для высокочастотной торговли.

🔗 Trading-R1 — пример того, как LLM могут объединять объяснимый анализ и формализм квант-моделей.

https://arxiv.org/abs/2509.11420

BY Машинное обучение RU




Share with your friend now:
tgoop.com/machinelearning_ru/3005

View MORE
Open in Telegram


Telegram News

Date: |

Telegram message that reads: "Bear Market Screaming Therapy Group. You are only allowed to send screaming voice notes. Everything else = BAN. Text pics, videos, stickers, gif = BAN. Anything other than screaming = BAN. You think you are smart = BAN. Channel login must contain 5-32 characters As the broader market downturn continues, yelling online has become the crypto trader’s latest coping mechanism after the rise of Goblintown Ethereum NFTs at the end of May and beginning of June, where holders made incoherent groaning sounds and role-played as urine-loving goblin creatures in late-night Twitter Spaces. Click “Save” ; Write your hashtags in the language of your target audience.
from us


Telegram Машинное обучение RU
FROM American