MACHINELEARNING_INTERVIEW Telegram 2211
🧠 Thinking Machines предложила новый способ обучения нейросетей — manifold Muon, который делает веса более стабильными и предсказуемыми.

🔑 Суть метода:

- Веса ограничиваются на специальной математической поверхности (многообразии Стифеля), где они не могут «разъехаться».

- Размер обновлений контролируется через спектральную норму, чтобы шаги обучения не искажали сеть слишком сильно.

- Обновления считаются в касательном пространстве и возвращаются обратно на многообразие.

📊 На тестах CIFAR-10 метод оказался точнее AdamW и удерживал веса в стабильном диапазоне, хотя шаги обучения занимали больше времени.

🎯 Главная идея — ИИ может давать последовательные и надёжные ответы. То, что сейчас считается «рандомностью» моделей, авторы называют исправимым багом.

Это может стать основой для создания безопасных AGI-систем, где нельзя допускать хаотичное поведение модели.

https://thinkingmachines.ai/blog/modular-manifolds/
25🔥9👍7💅1



tgoop.com/machinelearning_interview/2211
Create:
Last Update:

🧠 Thinking Machines предложила новый способ обучения нейросетей — manifold Muon, который делает веса более стабильными и предсказуемыми.

🔑 Суть метода:

- Веса ограничиваются на специальной математической поверхности (многообразии Стифеля), где они не могут «разъехаться».

- Размер обновлений контролируется через спектральную норму, чтобы шаги обучения не искажали сеть слишком сильно.

- Обновления считаются в касательном пространстве и возвращаются обратно на многообразие.

📊 На тестах CIFAR-10 метод оказался точнее AdamW и удерживал веса в стабильном диапазоне, хотя шаги обучения занимали больше времени.

🎯 Главная идея — ИИ может давать последовательные и надёжные ответы. То, что сейчас считается «рандомностью» моделей, авторы называют исправимым багом.

Это может стать основой для создания безопасных AGI-систем, где нельзя допускать хаотичное поведение модели.

https://thinkingmachines.ai/blog/modular-manifolds/

BY Machine learning Interview







Share with your friend now:
tgoop.com/machinelearning_interview/2211

View MORE
Open in Telegram


Telegram News

Date: |

Polls Judge Hui described Ng as inciting others to “commit a massacre” with three posts teaching people to make “toxic chlorine gas bombs,” target police stations, police quarters and the city’s metro stations. This offence was “rather serious,” the court said. Clear A few years ago, you had to use a special bot to run a poll on Telegram. Now you can easily do that yourself in two clicks. Hit the Menu icon and select “Create Poll.” Write your question and add up to 10 options. Running polls is a powerful strategy for getting feedback from your audience. If you’re considering the possibility of modifying your channel in any way, be sure to ask your subscribers’ opinions first. Telegram channels enable users to broadcast messages to multiple users simultaneously. Like on social media, users need to subscribe to your channel to get access to your content published by one or more administrators.
from us


Telegram Machine learning Interview
FROM American