Telegram Web
тут вышел ClockBench, бенчмарк, который проверяет умение моделей определять время по часам со стрелками; современные модели с ним справляются плохо (лучший результат - 13% у Gemini), что собственно неудивительно - большая часть изображений в интернете, на которых и тренируются модели, появились вместе со смартфонами, которые по совместительству наручные часы со стрелками и заменили

из забавного - человеческий результат на бенчмарке составляет 89%, хотя 6 лет назад было исследование, которое показало, что старшее поколение может распознавать время в 96% случаев; а зумеры (на тот момент люди в возрасте 18-24 лет) - только в 50%, такие дела

@valuableai
😁5🤷2
Forwarded from Russian OSINT
🈁 Anthropic блокирует доступ к ИИ-сервисам для компаний из "враждебного"🇨🇳Китая

Компания Anthropic вводит запрет на доступ к своим технологиям для компаний из Китая и других стран. Ранее компании могли обходить запреты, используя свои дочерние фирмы, зарегистрированные в разрешенных регионах, например в США или Европе, но теперь этот обходной путь закрыт. Если более 50% акций компании прямо или косвенно принадлежит структуре из запрещенной юрисдикции, то доступ к ИИ-решениям Anthropic для неё будет заблокирован вне зависимости от ее местоположения.

Например, немецкая компания "Germany GmbH" подает заявку на коммерческий доступ к API Claude от Anthropic, чтобы создать продвинутого чат-бота для своих европейских клиентов. При проверке заявки Anthropic не просто посмотрит, что "Germany GmbH" — это немецкая компания, но также изучит её структуру собственности. Если увидят, что 80% компании (то есть контрольный пакет акций) принадлежит "Сhina Technology" из Шанхая, а материнская компания находится в запрещенной юрисдикции (Китай), то Anthropic заблокирует доступ для "Germany GmbH".

По заявлению Anthropic, такие меры продиктованы рисками для национальной безопасности, поскольку подконтрольные "авторитарным режимам" компании могут использовать ИИ в 👮военных и 🖥разведывательных целях. Политика направлена на то, чтобы помешать враждебным странам использовать ИИ от Anthropic для своих военных и разведывательных задач, а также для улучшения собственных разработок в области ИИ с помощью таких методов, как дистилляция.

В статье Китай прямо назван в качестве примера неподдерживаемого региона. На странице «Поддерживаемые страны и регионы» перечислены все места, где доступны API Anthropic и Claude. ai.

Хотя Anthropic не публикует официальный список запрещенных стран, на основании отсутствия в перечне поддерживаемых регионов можно заключить, что следующие страны (и другие, не входящие в список) не обслуживаются:

🇨🇳 Китай
🇷🇺 Россия
🇮🇷 Иран
🇰🇵 Северная Корея
🇧🇾 Беларусь
🇸🇾 Сирия
🇨🇺 Куба
🇻🇪 Венесуэла
🇲🇲 Мьянма
🇦🇫 Афганистан
🇨🇩 Демократическая Республика Конго
🇪🇹 Эфиопия
🇱🇾 Ливия
🇸🇴 Сомали
🇸🇸 Южный Судан
🇸🇩 Судан
🇾🇪 Йемен
и другие...

@Russian_OSINT
Please open Telegram to view this post
VIEW IN TELEGRAM
👍54
Forwarded from Machinelearning
💰 OpenAI заключила гигантский контракт с Oracle на $300 млрд на облачные вычисления сроком примерно на 5 лет - сообщает Wall Street Journal.

Это один из крупнейших договоров на облачные вычисления в истории.

Расходы на инфраструктуру для ИИ продолжают расти рекордными темпами, несмотря на опасения «перегрева» рынка.

Масштаб сделки:
- OpenAI потребуется 4,5 гигаватта мощности - это больше, чем две плотины Гувера, или электричество для 4 миллионов домов.
- Oracle уже демонстрирует рост: акции компании подскочили, а Ларри Эллисон (глава Oracle) за сутки заработал $101 млрд и стал самым богатым человеком на планете, обогнав Илона Маска.

Рынок ИИ-вычислений превращается в арену сделок планетарного масштаба — где стоимость инфраструктуры измеряется сотнями миллиардов долларов и требует энергопотребления на уровне целых стран.

🟢 Подробнее: wsj .com/business/openai-oracle-sign-300-billion-computing-deal-among-biggest-in-history-ff27c8fe

@ai_machinelearning_big_data

#AI #Cloud #OpenAI #Oracle #DataCenters
Please open Telegram to view this post
VIEW IN TELEGRAM
4🔥4👍2
Forwarded from Machinelearning
🚀 Релиз: Qwen3-Next-80B-A3B - эффективная модель заточенная на работа работу с очень длинным контекстом!

🔹 80B параметров, но активируется только 3B на токен → тренировка и инференс 10x дешевле и быстрее, чем у Qwen3-32B (особенно при 32K+ контексте).
🔹 Гибридная архитектура: Gated DeltaNet + Gated Attention → сочетает скорость и точность.
🔹 Ultra-sparse MoE: 512 экспертов, маршрутизируется 10 + 1 общий.
🔹 Multi-Token Prediction → ускоренное speculative decoding.
🔹 По производительности обходит Qwen3-32B и приближается к Qwen3-235B в рассуждениях и long-context задачах.

🟢Qwen3-Next-80B-A3B-Instruct показатели почти на уровне 235B flagship.
🟢 Qwen3-Next-80B-A3B-Thinking превосходит Gemini-2.5-Flash-Thinking.

Попробовать: https://chat.qwen.ai
Анонс: https://qwen.ai/blog?id=4074cca80393150c248e508aa62983f9cb7d27cd&from=research.latest-advancements-list
HuggingFace: https://huggingface.co/collections/Qwen/qwen3-next-68c25fd6838e585db8eeea9d
ModelScope: https://modelscope.cn/collections/Qwen3-Next-c314f23bd0264a
Kaggle: https://kaggle.com/models/qwen-lm/qwen3-next-80b
Alibaba Cloud API: https://alibabacloud.com/help/en/model-studio/models#c5414da58bjgj

@ai_machinelearning_big_data

#AI #LLM #Qwen #DeepLearning #MoE #EfficientModels #LongContext #Reasonin
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥42👍2
Forwarded from НеКасперский
Открыл папку

Исследователи обнаружили в AI-редакторе Cursor уязвимость, позволяющую выполнять произвольный код сразу после открытия репозитория.

Всему виной функция Workspace Trust, которую излюбленный вайбкодерами форк VS Code по умолчанию отключает. Злоумышленник может подготовить файл .vscode/tasks.json с параметром runOptions.runOn: "folderOpen", который автоматически запустит вредоносную команду при открытии папки проекта. Никаких предупреждений или запросов разрешений пользователь не увидит.

В отличие от VS Code, где Workspace Trust включён по умолчанию и блокирует подозрительные задачи до явного подтверждения пользователем, Cursor выполняет такие команды молча. Атакующий может украсть переменные окружения, токены доступа, API-ключи или выполнить любые команды от имени жертвы.

Особенно опасно это для разработчиков, чьи машины имеют доступ к облачным сервисам и CI/CD системам. Один заражённый репозиторий способен скомпрометировать всю инфраструктуру компании.

Cursor заявляет, что пользователи могут включить функцию самостоятельно, установив security.workspace.trust.enabled: true в настройках и обещает обновить рекомендации по безопасности в ближайшее время.

Пока что лучший способ защиты — перестать вайбкодить 😱

НеКасперский
😁7🤔21
Всем привет! 16 сентября на ODS начнется онлайн-курс по обработке естественного языка (Natural Language Processing). Регистрация уже открыта.

Для кого:

Для всех, кому интересна тема обработки естественного языка и хочется, чтобы этот интерес перерос в знания, полезные для карьеры.

Что мы будем проходить:

начнем, как всегда с классики - закон Ципфа, TF-IDF, потом перейдем к более близким вещам - RNN, CNN, Transformer - и закончим LLM, куда же без них (вообще будет довольно много про языковые модели и их применение);

познакомимся с основными задачами NLP: классификацией текста, тегированием и генерацией;

погрузимся в более специфичные области, вроде диалоговых систем или NLP для кода.

В этот раз будет задание на агентов!

Время проведения и сроки:

Встречаемся по вторникам в 18:35 (МСК) - онлайн.


Первое занятие уже 16 сентября. Присоединяйтесь!

Если есть вопросы, то приходите с ними в ODS Mattermost – там будут все ответы, время семинаров и ссылки.
🔥52👍1
Всем привет!

Встречайте десятый выпуск еженедельного подкаста "Капитанский мостик", в котором обсуждаем новости из мира ИИ за прошедшую неделю и не только. Ведущие выпуска - Дмитрий Колодезев и Валентин Малых.
Смотрите видео на каналах ⤵️

ODS VK Video

ODS YouTube

📩 Присылайте новости для обсуждения в канал "Дата-капитаны" в ODS Mattermost
👍3
Эра 1-битных LLM наступила 🫥

🔹 DeepSeek-V3.1, квантованный всего до 1-бита или 3-бит, обошёл Claude Opus 4 и GPT-4.5.

🔹 Unsloth GGUF смог сжать DeepSeek-V3.1 на 75%, при этом модель превзошла топовых конкурентов в бенчмарке Aider Polyglot.


🟠Подробности: https://docs.unsloth.ai/new/unsloth-dynamic-ggufs-on-aider-polyglot

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍42
Forwarded from DevSecOps Talks
Secure Vibe Coding Guide

Всем привет!

Vibe Coding стал уже чем-то обыденным и все больше и больше людей его используют и создают ПО «совместно» с LLM.

И где-где, а вот тут безопасность точно нужна. В соответствии с исследованием, около 40% генерируемого кода не является безопасным.

В статье Автор рассматривает check list, который, по его мнению, может быть полезен при обеспечении ИБ для Vibe Coding.

Например:
🍭 Vibe Coding Security Fundamentals
🍭 Application Security и API Security-практики
🍭 AI Specific Risks
🍭 Secure Vibe Coding Prompts и не только

Для каждого раздела приводятся общие рекомендации и небольшие уточнения по ним.

Чего-то сверх детального вы не найдете, но «общий взгляд» на вопрос получился достаточно интересный.
1👍1
Подводные камни ИИ-браузеров.

Как говорили в одном старом кинофильме, скоро ничего не будет. Ни кино, не театра, ни книг, ни газет, одно сплошное телевидение ИИ.

Вот и внутри браузеров сегодня активно растут и норовят вылупиться ИИ-модели, приблизительно как в другом кинофильме под названием «Чужой».

Замечу, что перерождение браузера в “продвинутого попугая” создаёт целый пласт, скажем так, сложностей в плане приватности и безопасности.

Особенно если этот браузер научили что-то делать из практического типа покупки картошки и новых носков (то есть если ему добавили “агентских функций”).

Можно смело ожидать, что влияние такой интеграции на онлайн-жизнь, а также неприкосновенность и безопасность личной информации будет многообразным и сложным.

Собрали большой обзор темы. Во-первых, почему ИИ-браузеры становятся реальностью. Если совсем коротко: они упрощают работу, автоматизируют рутинные задачи, от покупок до анализа контента.

А также – какова изнанка этого процесса с точки зрения безопасности, а там: серьёзные риски, так как у браузера полный доступ ко всему вашему веб-трафику, истории, файлам и платежным данным, и при этом в них случаются и уязвимости, а ИИ еще и подвержен социнженерным манипуляциям.

Работы в отрасли ИБ обещает быть много, и на долгие годы.
👍2
Друзья, на связи вновь Петр Ермаков.

27 сентября пройдет Practical ML Conf - лучшая практическая конференция по ML в России. За качество отвечаю лично.
Скоро мы закроем регистрацию на офлайн.

Регистрируйтесь на офлайн сейчас. А если не сможете быть в Москве, регистрируйтесь на онлайн (в этом году для онлайна делаем дополнительный трек).

Обещаю интересные доклады, мастер-классы и дискуссии, крутую экспозону и качественный нетворк.

Репосты приветствуются.
2👍1🔥1👏1🤔1🤣1
Forwarded from ИСП РАН
👨‍💻 22-26 сентября в Ереване (Армения) состоится XV Международная конференция по компьютерным наукам и информационным технологиям CSIT 2025.

👍В рамках CSIT 2025 Институт системного программирования РАН имени В.П. Иванникова (ИСП РАН) организует Форсайт-сессию, посвященную доверенному ИИ.

➡️Ключевая задача Форсайта — объединение экспертов, ученых, представителей бизнеса и заинтересованных ведомств для обсуждения ключевых проблем в разработке доверенного искусственного интеллекта и определения перспективных областей его развития и внедрения.

🔵Модераторами дискуссии выступят Денис Турдаков, заведующий Исследовательским центром доверенного ИИ ИСП РАН, и Александр Соколов, заместитель директора Института статистических исследований и экономики знаний НИУ ВШЭ

Со стратегическими докладами выступят участники из Южной Азии, Европы, Ближнего Востока, стран СНГ и России.

Само мероприятие станет частью серии Международных форсайтов по развитию ИИ. Ранее они были успешно проведены в Марокко (GITEX Africa 2025) 16 апреля, Дубае (Machines Can See 2025) 24 апреля, Шэньчжэне (Global AI Expo) 22 мая, Сербии 25 мая и Санкт-Петербурге 16 июня. Ереванская сессия сосредоточит внимание на внедрении и использовании доверенного ИИ.

➡️ Ожидается, что по итогам Форсайт-сессии будет сформирован перечень стратегических приоритетов и перспективных направлений развития технологий искусственного интеллекта.

📍Событие пройдет на площадке Российско-Армянского университета

🟠 Подписаться на ИСП РАН
Please open Telegram to view this post
VIEW IN TELEGRAM
группа энтузиастов, которая включает людей из ODS, в частности Валентина Малых и Дмитрия Бабаева, сделала бенчмарк для агентного написания кода SWE-MERA

подробности про бенчмарк можно прочитать в статье на Habr; также бенчмарк будет представлен на конференции EMNLP в Китае в ноябре, научная статья тут

если вы интересуетесь ИИ-генерацией кода, присоединяйтесь к тестированию моделей, инструкция есть на сайте, будем рады вашему фидбеку!
🔥6
Forwarded from RUVDS | Community
👨‍🔬 В России зафиксирован мировой рекорд в квантовых вычислениях на ионах иттербия

Учёные в рамках национального «Квантового проекта» (ФИАН и Российский квантовый центр) установили новый мировой рекорд. Им удалось реализовать крупнейший в мире алгоритм на кудитах — многокубитную операцию на десяти ионах иттербия.

Почему это важно?

— Рекордная операция — «обобщенный гейт Тоффоли».

— Это прорыв в точности вычислений для решения практических задач: от логистики до создания новых материалов.
— Разработанный метод универсален и может быть применен к другим платформам (сверхпроводники, атомы, фотоны).

Как отметил директор ФИАН Николай Колачевский, этот результат является важным шагом на пути к созданию 50-кубитного квантового компьютера к 2030 году.
8
2025/10/19 18:37:56
Back to Top
HTML Embed Code: