Forwarded from Valuable AI / Валентин Малых
тут вышел ClockBench, бенчмарк, который проверяет умение моделей определять время по часам со стрелками; современные модели с ним справляются плохо (лучший результат - 13% у Gemini), что собственно неудивительно - большая часть изображений в интернете, на которых и тренируются модели, появились вместе со смартфонами, которые по совместительству наручные часы со стрелками и заменили
из забавного - человеческий результат на бенчмарке составляет 89%, хотя 6 лет назад было исследование, которое показало, что старшее поколение может распознавать время в 96% случаев; а зумеры (на тот момент люди в возрасте 18-24 лет) - только в 50%, такие дела
@valuableai
из забавного - человеческий результат на бенчмарке составляет 89%, хотя 6 лет назад было исследование, которое показало, что старшее поколение может распознавать время в 96% случаев; а зумеры (на тот момент люди в возрасте 18-24 лет) - только в 50%, такие дела
@valuableai
😁5🤷2
Forwarded from Russian OSINT
Компания Anthropic вводит запрет на доступ к своим технологиям для компаний из Китая и других стран. Ранее компании могли обходить запреты, используя свои дочерние фирмы, зарегистрированные в разрешенных регионах, например в США или Европе, но теперь этот обходной путь закрыт. Если более 50% акций компании прямо или косвенно принадлежит структуре из запрещенной юрисдикции, то доступ к ИИ-решениям Anthropic для неё будет заблокирован вне зависимости от ее местоположения.
Например, немецкая компания "Germany GmbH" подает заявку на коммерческий доступ к API Claude от Anthropic, чтобы создать продвинутого чат-бота для своих европейских клиентов. При проверке заявки Anthropic не просто посмотрит, что "Germany GmbH" — это немецкая компания, но также изучит её структуру собственности. Если увидят, что 80% компании (то есть контрольный пакет акций) принадлежит "Сhina Technology" из Шанхая, а материнская компания находится в запрещенной юрисдикции (Китай), то Anthropic заблокирует доступ для "Germany GmbH".
По заявлению Anthropic, такие меры продиктованы рисками для национальной безопасности, поскольку подконтрольные "авторитарным режимам" компании могут использовать ИИ в
В статье Китай прямо назван в качестве примера неподдерживаемого региона. На странице «Поддерживаемые страны и регионы» перечислены все места, где доступны API Anthropic и Claude. ai.
Хотя Anthropic не публикует официальный список запрещенных стран, на основании отсутствия в перечне поддерживаемых регионов можно заключить, что следующие страны (и другие, не входящие в список) не обслуживаются:
🇨🇳 Китай
🇷🇺 Россия
🇮🇷 Иран
🇰🇵 Северная Корея
🇧🇾 Беларусь
🇸🇾 Сирия
🇨🇺 Куба
🇻🇪 Венесуэла
🇲🇲 Мьянма
🇦🇫 Афганистан
🇨🇩 Демократическая Республика Конго
🇪🇹 Эфиопия
🇱🇾 Ливия
🇸🇴 Сомали
🇸🇸 Южный Судан
🇸🇩 Судан
🇾🇪 Йемен
и другие...
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤4
Forwarded from Machinelearning
Это один из крупнейших договоров на облачные вычисления в истории.
Расходы на инфраструктуру для ИИ продолжают расти рекордными темпами, несмотря на опасения «перегрева» рынка.
⚡ Масштаб сделки:
- OpenAI потребуется 4,5 гигаватта мощности - это больше, чем две плотины Гувера, или электричество для 4 миллионов домов.
- Oracle уже демонстрирует рост: акции компании подскочили, а Ларри Эллисон (глава Oracle) за сутки заработал $101 млрд и стал самым богатым человеком на планете, обогнав Илона Маска.
Рынок ИИ-вычислений превращается в арену сделок планетарного масштаба — где стоимость инфраструктуры измеряется сотнями миллиардов долларов и требует энергопотребления на уровне целых стран.
@ai_machinelearning_big_data
#AI #Cloud #OpenAI #Oracle #DataCenters
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4🔥4👍2
Forwarded from Machinelearning
🚀 Релиз: Qwen3-Next-80B-A3B - эффективная модель заточенная на работа работу с очень длинным контекстом!
🔹 80B параметров, но активируется только 3B на токен → тренировка и инференс 10x дешевле и быстрее, чем у Qwen3-32B (особенно при 32K+ контексте).
🔹 Гибридная архитектура: Gated DeltaNet + Gated Attention → сочетает скорость и точность.
🔹 Ultra-sparse MoE: 512 экспертов, маршрутизируется 10 + 1 общий.
🔹 Multi-Token Prediction → ускоренное speculative decoding.
🔹 По производительности обходит Qwen3-32B и приближается к Qwen3-235B в рассуждениях и long-context задачах.
🟢 Qwen3-Next-80B-A3B-Instruct показатели почти на уровне 235B flagship.
🟢 Qwen3-Next-80B-A3B-Thinking превосходит Gemini-2.5-Flash-Thinking.
▪ Попробовать: https://chat.qwen.ai
▪ Анонс: https://qwen.ai/blog?id=4074cca80393150c248e508aa62983f9cb7d27cd&from=research.latest-advancements-list
▪ HuggingFace: https://huggingface.co/collections/Qwen/qwen3-next-68c25fd6838e585db8eeea9d
▪ ModelScope: https://modelscope.cn/collections/Qwen3-Next-c314f23bd0264a
▪ Kaggle: https://kaggle.com/models/qwen-lm/qwen3-next-80b
▪ Alibaba Cloud API: https://alibabacloud.com/help/en/model-studio/models#c5414da58bjgj
@ai_machinelearning_big_data
#AI #LLM #Qwen #DeepLearning #MoE #EfficientModels #LongContext #Reasonin
▪ Попробовать: https://chat.qwen.ai
▪ Анонс: https://qwen.ai/blog?id=4074cca80393150c248e508aa62983f9cb7d27cd&from=research.latest-advancements-list
▪ HuggingFace: https://huggingface.co/collections/Qwen/qwen3-next-68c25fd6838e585db8eeea9d
▪ ModelScope: https://modelscope.cn/collections/Qwen3-Next-c314f23bd0264a
▪ Kaggle: https://kaggle.com/models/qwen-lm/qwen3-next-80b
▪ Alibaba Cloud API: https://alibabacloud.com/help/en/model-studio/models#c5414da58bjgj
@ai_machinelearning_big_data
#AI #LLM #Qwen #DeepLearning #MoE #EfficientModels #LongContext #Reasonin
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4❤2👍2
Forwarded from НеКасперский
Открыл папку
Исследователи обнаружили в AI-редакторе Cursor уязвимость, позволяющую выполнять произвольный код сразу после открытия репозитория.
Всему виной функция Workspace Trust, которую излюбленный вайбкодерами форк VS Code по умолчанию отключает. Злоумышленник может подготовить файл
В отличие от VS Code, где Workspace Trust включён по умолчанию и блокирует подозрительные задачи до явного подтверждения пользователем, Cursor выполняет такие команды молча. Атакующий может украсть переменные окружения, токены доступа, API-ключи или выполнить любые команды от имени жертвы.
Особенно опасно это для разработчиков, чьи машины имеют доступ к облачным сервисам и CI/CD системам. Один заражённый репозиторий способен скомпрометировать всю инфраструктуру компании.
Cursor заявляет, что пользователи могут включить функцию самостоятельно, установив
Пока что лучший способ защиты — перестать вайбкодить 😱
НеКасперский
Исследователи обнаружили в AI-редакторе Cursor уязвимость, позволяющую выполнять произвольный код сразу после открытия репозитория.
Всему виной функция Workspace Trust, которую излюбленный вайбкодерами форк VS Code по умолчанию отключает. Злоумышленник может подготовить файл
.vscode/tasks.json
с параметром runOptions.runOn: "folderOpen"
, который автоматически запустит вредоносную команду при открытии папки проекта. Никаких предупреждений или запросов разрешений пользователь не увидит.В отличие от VS Code, где Workspace Trust включён по умолчанию и блокирует подозрительные задачи до явного подтверждения пользователем, Cursor выполняет такие команды молча. Атакующий может украсть переменные окружения, токены доступа, API-ключи или выполнить любые команды от имени жертвы.
Особенно опасно это для разработчиков, чьи машины имеют доступ к облачным сервисам и CI/CD системам. Один заражённый репозиторий способен скомпрометировать всю инфраструктуру компании.
Cursor заявляет, что пользователи могут включить функцию самостоятельно, установив
security.workspace.trust.enabled: true
в настройках и обещает обновить рекомендации по безопасности в ближайшее время.Пока что лучший способ защиты — перестать вайбкодить 😱
НеКасперский
😁7🤔2❤1
Всем привет! 16 сентября на ODS начнется онлайн-курс по обработке естественного языка (Natural Language Processing). Регистрация уже открыта.
Для кого:
Для всех, кому интересна тема обработки естественного языка и хочется, чтобы этот интерес перерос в знания, полезные для карьеры.
Что мы будем проходить:
начнем, как всегда с классики - закон Ципфа, TF-IDF, потом перейдем к более близким вещам - RNN, CNN, Transformer - и закончим LLM, куда же без них (вообще будет довольно много про языковые модели и их применение);
познакомимся с основными задачами NLP: классификацией текста, тегированием и генерацией;
погрузимся в более специфичные области, вроде диалоговых систем или NLP для кода.
В этот раз будет задание на агентов!
Время проведения и сроки:
Встречаемся по вторникам в 18:35 (МСК) - онлайн.
Первое занятие уже 16 сентября. Присоединяйтесь!
Если есть вопросы, то приходите с ними в ODS Mattermost – там будут все ответы, время семинаров и ссылки.
Для кого:
Для всех, кому интересна тема обработки естественного языка и хочется, чтобы этот интерес перерос в знания, полезные для карьеры.
Что мы будем проходить:
начнем, как всегда с классики - закон Ципфа, TF-IDF, потом перейдем к более близким вещам - RNN, CNN, Transformer - и закончим LLM, куда же без них (вообще будет довольно много про языковые модели и их применение);
познакомимся с основными задачами NLP: классификацией текста, тегированием и генерацией;
погрузимся в более специфичные области, вроде диалоговых систем или NLP для кода.
В этот раз будет задание на агентов!
Время проведения и сроки:
Встречаемся по вторникам в 18:35 (МСК) - онлайн.
Первое занятие уже 16 сентября. Присоединяйтесь!
Если есть вопросы, то приходите с ними в ODS Mattermost – там будут все ответы, время семинаров и ссылки.
🔥5❤2👍1
Всем привет!
Встречайте десятый выпуск еженедельного подкаста "Капитанский мостик", в котором обсуждаем новости из мира ИИ за прошедшую неделю и не только. Ведущие выпуска - Дмитрий Колодезев и Валентин Малых.
Смотрите видео на каналах ⤵️
ODS VK Video
ODS YouTube
📩 Присылайте новости для обсуждения в канал "Дата-капитаны" в ODS Mattermost
Встречайте десятый выпуск еженедельного подкаста "Капитанский мостик", в котором обсуждаем новости из мира ИИ за прошедшую неделю и не только. Ведущие выпуска - Дмитрий Колодезев и Валентин Малых.
Смотрите видео на каналах ⤵️
ODS VK Video
ODS YouTube
📩 Присылайте новости для обсуждения в канал "Дата-капитаны" в ODS Mattermost
👍3
Forwarded from Анализ данных (Data analysis)
Эра 1-битных LLM наступила 🫥
🔹 DeepSeek-V3.1, квантованный всего до 1-бита или 3-бит, обошёл Claude Opus 4 и GPT-4.5.
🔹 Unsloth GGUF смог сжать DeepSeek-V3.1 на 75%, при этом модель превзошла топовых конкурентов в бенчмарке Aider Polyglot.
🟠 Подробности: https://docs.unsloth.ai/new/unsloth-dynamic-ggufs-on-aider-polyglot
@data_analysis_ml
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍4❤2
Forwarded from DevSecOps Talks
Secure Vibe Coding Guide
Всем привет!
Vibe Coding стал уже чем-то обыденным и все больше и больше людей его используют и создают ПО «совместно» с LLM.
И где-где, а вот тут безопасность точно нужна. В соответствии с исследованием, около 40% генерируемого кода не является безопасным.
В статье Автор рассматривает check list, который, по его мнению, может быть полезен при обеспечении ИБ для Vibe Coding.
Например:
🍭 Vibe Coding Security Fundamentals
🍭 Application Security и API Security-практики
🍭 AI Specific Risks
🍭 Secure Vibe Coding Prompts и не только
Для каждого раздела приводятся общие рекомендации и небольшие уточнения по ним.
Чего-то сверх детального вы не найдете, но «общий взгляд» на вопрос получился достаточно интересный.
Всем привет!
Vibe Coding стал уже чем-то обыденным и все больше и больше людей его используют и создают ПО «совместно» с LLM.
И где-где, а вот тут безопасность точно нужна. В соответствии с исследованием, около 40% генерируемого кода не является безопасным.
В статье Автор рассматривает check list, который, по его мнению, может быть полезен при обеспечении ИБ для Vibe Coding.
Например:
🍭 Vibe Coding Security Fundamentals
🍭 Application Security и API Security-практики
🍭 AI Specific Risks
🍭 Secure Vibe Coding Prompts и не только
Для каждого раздела приводятся общие рекомендации и небольшие уточнения по ним.
Чего-то сверх детального вы не найдете, но «общий взгляд» на вопрос получился достаточно интересный.
Substack
Secure Vibe Coding Guide
1: Introduction
❤1👍1
Forwarded from Евгений Касперский
www.kaspersky.ru
Кибербезопасность и приватность ИИ-браузеров с LLM
Разбираем достоинства, недостатки и риски браузеров со встроенным ИИ-агентом
Подводные камни ИИ-браузеров.
Как говорили в одном старом кинофильме, скоро ничего не будет. Ни кино, не театра, ни книг, ни газет, одно сплошноетелевидение ИИ.
Вот и внутри браузеров сегодня активно растут и норовят вылупиться ИИ-модели, приблизительно как в другом кинофильме под названием «Чужой».
Замечу, что перерождение браузера в “продвинутого попугая” создаёт целый пласт, скажем так, сложностей в плане приватности и безопасности.
Особенно если этот браузер научили что-то делать из практического типа покупки картошки и новых носков (то есть если ему добавили “агентских функций”).
Можно смело ожидать, что влияние такой интеграции на онлайн-жизнь, а также неприкосновенность и безопасность личной информации будет многообразным и сложным.
Собрали большой обзор темы. Во-первых, почему ИИ-браузеры становятся реальностью. Если совсем коротко: они упрощают работу, автоматизируют рутинные задачи, от покупок до анализа контента.
А также – какова изнанка этого процесса с точки зрения безопасности, а там: серьёзные риски, так как у браузера полный доступ ко всему вашему веб-трафику, истории, файлам и платежным данным, и при этом в них случаются и уязвимости, а ИИ еще и подвержен социнженерным манипуляциям.
Работы в отрасли ИБ обещает быть много, и на долгие годы.
Как говорили в одном старом кинофильме, скоро ничего не будет. Ни кино, не театра, ни книг, ни газет, одно сплошное
Вот и внутри браузеров сегодня активно растут и норовят вылупиться ИИ-модели, приблизительно как в другом кинофильме под названием «Чужой».
Замечу, что перерождение браузера в “продвинутого попугая” создаёт целый пласт, скажем так, сложностей в плане приватности и безопасности.
Особенно если этот браузер научили что-то делать из практического типа покупки картошки и новых носков (то есть если ему добавили “агентских функций”).
Можно смело ожидать, что влияние такой интеграции на онлайн-жизнь, а также неприкосновенность и безопасность личной информации будет многообразным и сложным.
Собрали большой обзор темы. Во-первых, почему ИИ-браузеры становятся реальностью. Если совсем коротко: они упрощают работу, автоматизируют рутинные задачи, от покупок до анализа контента.
А также – какова изнанка этого процесса с точки зрения безопасности, а там: серьёзные риски, так как у браузера полный доступ ко всему вашему веб-трафику, истории, файлам и платежным данным, и при этом в них случаются и уязвимости, а ИИ еще и подвержен социнженерным манипуляциям.
Работы в отрасли ИБ обещает быть много, и на долгие годы.
👍2
Друзья, на связи вновь Петр Ермаков.
27 сентября пройдет Practical ML Conf - лучшая практическая конференция по ML в России. За качество отвечаю лично.
Скоро мы закроем регистрацию на офлайн.
Регистрируйтесь на офлайн сейчас. А если не сможете быть в Москве, регистрируйтесь на онлайн (в этом году для онлайна делаем дополнительный трек).
Обещаю интересные доклады, мастер-классы и дискуссии, крутую экспозону и качественный нетворк.
Репосты приветствуются.
27 сентября пройдет Practical ML Conf - лучшая практическая конференция по ML в России. За качество отвечаю лично.
Скоро мы закроем регистрацию на офлайн.
Регистрируйтесь на офлайн сейчас. А если не сможете быть в Москве, регистрируйтесь на онлайн (в этом году для онлайна делаем дополнительный трек).
Обещаю интересные доклады, мастер-классы и дискуссии, крутую экспозону и качественный нетворк.
Репосты приветствуются.
Practical ML Conf 2025
Конференция про практический ML от Яндекса
❤2👍1🔥1👏1🤔1🤣1
Forwarded from ИСП РАН
Само мероприятие станет частью серии Международных форсайтов по развитию ИИ. Ранее они были успешно проведены в Марокко (GITEX Africa 2025) 16 апреля, Дубае (Machines Can See 2025) 24 апреля, Шэньчжэне (Global AI Expo) 22 мая, Сербии 25 мая и Санкт-Петербурге 16 июня. Ереванская сессия сосредоточит внимание на внедрении и использовании доверенного ИИ.
Please open Telegram to view this post
VIEW IN TELEGRAM
группа энтузиастов, которая включает людей из ODS, в частности Валентина Малых и Дмитрия Бабаева, сделала бенчмарк для агентного написания кода SWE-MERA
подробности про бенчмарк можно прочитать в статье на Habr; также бенчмарк будет представлен на конференции EMNLP в Китае в ноябре, научная статья тут
если вы интересуетесь ИИ-генерацией кода, присоединяйтесь к тестированию моделей, инструкция есть на сайте, будем рады вашему фидбеку!
подробности про бенчмарк можно прочитать в статье на Habr; также бенчмарк будет представлен на конференции EMNLP в Китае в ноябре, научная статья тут
если вы интересуетесь ИИ-генерацией кода, присоединяйтесь к тестированию моделей, инструкция есть на сайте, будем рады вашему фидбеку!
🔥6
Forwarded from RUVDS | Community
👨🔬 В России зафиксирован мировой рекорд в квантовых вычислениях на ионах иттербия
Учёные в рамках национального «Квантового проекта» (ФИАН и Российский квантовый центр) установили новый мировой рекорд. Им удалось реализовать крупнейший в мире алгоритм на кудитах — многокубитную операцию на десяти ионах иттербия.
Почему это важно?
— Рекордная операция — «обобщенный гейт Тоффоли».
— Это прорыв в точности вычислений для решения практических задач: от логистики до создания новых материалов.
— Разработанный метод универсален и может быть применен к другим платформам (сверхпроводники, атомы, фотоны).
Как отметил директор ФИАН Николай Колачевский, этот результат является важным шагом на пути к созданию 50-кубитного квантового компьютера к 2030 году.
Учёные в рамках национального «Квантового проекта» (ФИАН и Российский квантовый центр) установили новый мировой рекорд. Им удалось реализовать крупнейший в мире алгоритм на кудитах — многокубитную операцию на десяти ионах иттербия.
Почему это важно?
— Рекордная операция — «обобщенный гейт Тоффоли».
— Это прорыв в точности вычислений для решения практических задач: от логистики до создания новых материалов.
— Разработанный метод универсален и может быть применен к другим платформам (сверхпроводники, атомы, фотоны).
Как отметил директор ФИАН Николай Колачевский, этот результат является важным шагом на пути к созданию 50-кубитного квантового компьютера к 2030 году.
❤8