MACHINELEARNING_INTERVIEW Telegram 2213
🧠 Thinking Machines предложила новый способ обучения нейросетей — manifold Muon, который делает веса более стабильными и предсказуемыми.

🔑 Суть метода:

- Веса ограничиваются на специальной математической поверхности (многообразии Стифеля), где они не могут «разъехаться».

- Размер обновлений контролируется через спектральную норму, чтобы шаги обучения не искажали сеть слишком сильно.

- Обновления считаются в касательном пространстве и возвращаются обратно на многообразие.

📊 На тестах CIFAR-10 метод оказался точнее AdamW и удерживал веса в стабильном диапазоне, хотя шаги обучения занимали больше времени.

🎯 Главная идея — ИИ может давать последовательные и надёжные ответы. То, что сейчас считается «рандомностью» моделей, авторы называют исправимым багом.

Это может стать основой для создания безопасных AGI-систем, где нельзя допускать хаотичное поведение модели.

https://thinkingmachines.ai/blog/modular-manifolds/
25🔥9👍7💅1



tgoop.com/machinelearning_interview/2213
Create:
Last Update:

🧠 Thinking Machines предложила новый способ обучения нейросетей — manifold Muon, который делает веса более стабильными и предсказуемыми.

🔑 Суть метода:

- Веса ограничиваются на специальной математической поверхности (многообразии Стифеля), где они не могут «разъехаться».

- Размер обновлений контролируется через спектральную норму, чтобы шаги обучения не искажали сеть слишком сильно.

- Обновления считаются в касательном пространстве и возвращаются обратно на многообразие.

📊 На тестах CIFAR-10 метод оказался точнее AdamW и удерживал веса в стабильном диапазоне, хотя шаги обучения занимали больше времени.

🎯 Главная идея — ИИ может давать последовательные и надёжные ответы. То, что сейчас считается «рандомностью» моделей, авторы называют исправимым багом.

Это может стать основой для создания безопасных AGI-систем, где нельзя допускать хаотичное поведение модели.

https://thinkingmachines.ai/blog/modular-manifolds/

BY Machine learning Interview







Share with your friend now:
tgoop.com/machinelearning_interview/2213

View MORE
Open in Telegram


Telegram News

Date: |

As the broader market downturn continues, yelling online has become the crypto trader’s latest coping mechanism after the rise of Goblintown Ethereum NFTs at the end of May and beginning of June, where holders made incoherent groaning sounds and role-played as urine-loving goblin creatures in late-night Twitter Spaces. You can invite up to 200 people from your contacts to join your channel as the next step. Select the users you want to add and click “Invite.” You can skip this step altogether. How to build a private or public channel on Telegram? The group also hosted discussions on committing arson, Judge Hui said, including setting roadblocks on fire, hurling petrol bombs at police stations and teaching people to make such weapons. The conversation linked to arson went on for two to three months, Hui said. The imprisonment came as Telegram said it was "surprised" by claims that privacy commissioner Ada Chung Lai-ling is seeking to block the messaging app due to doxxing content targeting police and politicians.
from us


Telegram Machine learning Interview
FROM American