tgoop.com/dsproglib/6892
Last Update:
🔹 AI и мульти-модальные модели
— Qwen3-Omni — первый нативный end-to-end омни-модальный AI, объединяющий текст, изображения, аудио и видео без компромиссов между модальностями.
— Google Gemini 2.5 Flash и Flash-Lite — обновлённые модели DeepMind для Vertex AI и Google AI Studio с улучшенной скоростью и качеством. Flash-Lite экономит до 50% токенов при инференсе.
— Нативная аудио-модель Google — новая модель в Gemini Live API делает голосовых агентов более надёжными и способными корректно работать с пользователем.
🔹 Исследования и новые методы
— RLPT: Reinforcement Learning on Pretraining Data — новый подход, где LLM обучаются с использованием RL напрямую на данных претрейнинга, без ручной аннотации наград.
— GPT-oss и утечки данных — анализ весов GPT-oss показал возможное использование контента с adult-сайтов и частично данных с GitHub в обучении моделей семейства GPT-5.
🔹 Практика и инструменты ML
— Как работать с нейросетями эффективно — теоретические и практические рекомендации.
— Ускорение инференса ML-моделей — советы по оптимизации без лишних затрат.
— In-context learning без тренировки — статья про имплицитную динамику обучения в контексте.
— Алгоритм Isolation Forest — метод поиска аномалий в данных.
— Опрос для data-специалистов — про стек, зарплаты и трудности работы.
— Лучшие ML-фреймворки 2025 года — обзор актуальных инструментов для разработки моделей.
— Финетюнинг без греха — как безопасно кастомизировать AI и не сломать его.
#свежак