Машинное обучение digest@machinelearnindigest P.1317

Машинное обучение digest

✔️ Илон Маск стал первым человеком в истории, чьё состояние превысило $500 млрд

Для сравнения: это больше, чем суммарное богатство Джеффа Безоса ($233,5 млрд) и Марка Цукерберга ($245,7 млрд).

Только за последний год Маск увеличил своё состояние на $245 млрд.

✔️ Стартап Миры Мурати Thinking Machines представил свой первый продукт - Tinker.
Но это не новая модель, а гораздо более практичный инструмент: API для файнтюнинга.

Идея проста: вы пишете код для дообучения, а все заботы о железе берут на себя Thinking Machines - от распределения ресурсов до восстановления после сбоев.

Tinker поддерживает широкий спектр моделей - от небольших до очень крупных. В API доступны базовые примитивы (forward_backward, optim_step, sample), из которых можно собрать кастомные пайплайны. А для тех, кто хочет сразу сложные сценарии, есть Tinker Cookbook - библиотека с готовыми реализациями популярных алгоритмов: RLHF, Multi-Agent, Tool Use, Math Reasoning и других.

Пока продукт доступен только в приватной бете, но уже можно записаться в вейтлист.

✔️ Nvidia представила Reinforcement Learning Pretraining (RLP) - новый способ обучения ИИ, при котором модель учится рассуждать ещё на этапе претренинга.

В эксперименте на 12B модели RLP повысил точность на 35%, используя всего 0,125% данных.

Главное отличие: вместо обычного предсказания следующего токена модель сначала генерирует «мысль», а затем проверяет, улучшает ли она прогноз. За полезные мысли модель получает вознаграждение, что формирует навык пошагового мышления с самого начала обучения.

На математических и бенчмарках тестах RLP превзошёл стандартные подходы и сохранил преимущество даже после классического дообучения.
nvidia

✔️ Вышла версия Cursor 1.7. Теперь пользоваться инструментом стало удобнее за счёт ряда новых функций.

Подсказки появляются прямо во время ввода промпта и принимаются нажатием Tab. Появились кастомные hooks, которые позволяют управлять жизненным циклом агентов, а также deeplinks для быстрого обмена промптами.

Правила можно назначать сразу для всей команды, включая Bugbot для автоматического кодревью. Кроме того, теперь статус агентов доступен прямо из панели, без необходимости открывать само приложение.
cursor

✔️ Мира Мурати привлекла рекордные $2 млрд при оценке $10–12 млрд - крупнейший посевной раунд в истории США.

Она сохранила полный контроль над стартапом, а среди инвесторов - a16z, Accel, Nvidia, AMD и Cisco. В команду вошёл сооснователь OpenAI Джон Шульман и группа экс-исследователей.

Компания зарегистрирована как public benefit corporation, обещает open-source и первый продукт в ближайшие месяцы.
Information

✔️ OpenAI стала самой дорогой частной компанией в мире - её оценка достигла $500 млрд, обогнав SpaceX и ByteDance.

За последние полгода стоимость выросла на $200 млрд. При этом стартап продолжает наращивать убытки, но инвесторы пока закрывают на это глаза.

Сэм Альтман фактически переигрывает весь рынок, превращая OpenAI в главного игрока индустрии.
Bloomberg

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

www.tgoop.com/machinelearnindigest/1317

14 viewsOct 2 at 10:35

tgoop.com/machinelearnindigest/1317

Create: 2025-10-02
Last Update: 2025-11-08 18:26:07

Telegram News

✔️ Илон Маск стал первым человеком в истории