63 - Telegram Web

Warning: Undefined array key 0 in /var/www/tgoop/function.php on line 65

Warning: Trying to access array offset on value of type null in /var/www/tgoop/function.php on line 65
63 - Telegram Web

Открытый код ФКН ВШЭ

TabM

Репозиторий, содержащий имплементацию TabM — модели, эффективно имитирующей ансамбль многослойных перцептронов для решения задач на табличных данных. Для этого вводятся специальные адаптеры - матрицы, чьи элементы равны ± 1. Эти адаптеры эффективно создают уникальные версии матрицы весов, за счет чего и имитируется ансамбль. В итоговой архитектуре такой адаптер применяется только ко всем копиям одного входа, которые затем подаются в линейные слои. В серии экспериментов авторы показывают существенное превосходство метода для задач на табличных данных по сравнению с другими классическими и нейросетевыми подходами, в том числе использующие механизм внимания. Модель также демонстрирует лучшую скорость обучения и инференса, уступая лишь стандартному MLP и XGBoost. Работа может быть полезна аналитикам, DS-специалистам и DL-исследователям.

статья | код

GitHub - yandex-research/tabm: (ICLR 2025) TabM: Advancing Tabular Deep Learning With Parameter-Efficient Ensembling

(ICLR 2025) TabM: Advancing Tabular Deep Learning With Parameter-Efficient Ensembling - yandex-research/tabm

🔥6

982 views09:51

Открытый код ФКН ВШЭ

Поздравляем с 2025 годом! 🎄

🎆

Удачи и успеха вам в новом году, друзья! 🎁

Спасибо, что остаётесь с нами!

Please open Telegram to view this post

VIEW IN TELEGRAM

🎉13❤‍🔥2❤1👍1

800 views00:14

Открытый код ФКН ВШЭ

rtdl-num-embeddings

Библиотека на python, позволяющая получать эмбеддинги для непрерывных признаков в задачах для табличных данных. Используемые вместо скалярных признаков эмбеддинги улучшают итоговое качество моделей на специфических задачах, при этом не увеличивая вычислительную сложность. В своей работе авторы представляют несколько алгоритмов получения эбмеддингов, а в экспериментальной части показывают состоятельность метода. В частности, сравнивая DL-алгоритмы с классическими подходами, такими как GBDT, на задачах, заточенных под последние. В таком режиме DL методы без использования эмебеддингов уступают классическим, а при использовании обходят их. Библиотека может быть полезна DS-специалистам, дата аналитикам и ML-инженерам.

статья | код

GitHub - yandex-research/rtdl-num-embeddings: (NeurIPS 2022) On Embeddings for Numerical Features in Tabular Deep Learning

(NeurIPS 2022) On Embeddings for Numerical Features in Tabular Deep Learning - yandex-research/rtdl-num-embeddings

🔥12

922 views11:16

Открытый код ФКН ВШЭ

RATANSunPy

Библиотека на python, разработанный для доступа, визуализации и анализа многополосных радионаблюдений Солнца с комплекса РАТАН-600. Эти данные представляют ценность для диагностики состояния солнечной плазмы и прогнозирования солнечной активности. Пакет предлагает комплексные функции обработки данных, включая прямой доступ к необработанным данным, основные этапы обработки, такие как калибровка и нормализация тихого Солнца, а также инструменты для анализа солнечной активности. Сюда входит автоматическое обнаружение локальных источников, идентификация их с активными областями NOAA и дальнейшее определение параметров для локальных источников и активных областей. Работа может быть полезна физикам, астрономам, и DS-специалистам.

статья | код

GitHub - SpbfSAO/RATANSunPy: RATAN-600 radioastronomical solar data and methods Python library

RATAN-600 radioastronomical solar data and methods Python library - SpbfSAO/RATANSunPy

❤3👍1🔥1

827 views09:04

Открытый код ФКН ВШЭ

structural-graph-shifts

В работе рассматривается проблема оценки робастности моделей графовых нейронных сетей. Для оценки неопределенности прогноза в таких моделях используются различные подходы: общие, например, ансамблирование, и специфические, использующие свойства графовой структуры. Вне зависимости от метода оценки устойчивости модели, для его обучения необходимы данные, содержащие в себе различные источники неопределенностей, например, сдвиги распределений. Типичные датасеты для оценки робастности графовых нейронных сетей используют сдвиги на уровне признаков. Авторы предлагают более универсальный способ создания неопределенности в данных, основанный на особенностях графовых данных. В репозитории проекта содержится код, позволяющий получить подобные данные с различными видами неопределенности, а также имплементацию различных методов оценки неопределенности и улучшения робастности. В серии экспериментов авторы демонстрируют сложность, с которой сталкиваются модели в таком режиме обучения. При этом более простые модели часто превосходят в качестве прогноза продвинутые алгоритмы. Работа может быть полезна DL-исследователям, специалистам по графовым нейронным сетям, DS-специалистам и дата аналитикам.

статья | код

GitHub - yandex-research/structural-graph-shifts: New structural distributional shifts for evaluating graph models

New structural distributional shifts for evaluating graph models - yandex-research/structural-graph-shifts

❤6👍2

775 views09:00

Открытый код ФКН ВШЭ

Первое исследование open source от СберТеха

Исследователи из СберТеха проанализировали тысячи профилей на GitHub и получили интересные результаты об open source в мире и в России.

Некоторые выводы исследования:
🟢 основные языки разработки — Python и JavaScript, в тренде —TypeScript, Rust и Lua;
🟢 самый популярный российский проект на GitHub — JavaScript-фреймворк core-js;
🟢 самая популярная у нас отечественная большая языковая модель — ruGPT3 (Сбер), а СУБД — YDB (Яндекс);
🟢 самые популярные категории open source проектов — JavaScript-, web- и css-фреймворки;
🟢 локальное китайское open source сообщество Gitee растет быстрее, чем на GitHub, и уже опережает его более чем в 1,5 раза по числу репозиториев.

Полный отчет можно посмотреть здесь.

🔥5❤1👍1

789 views13:18

Открытый код ФКН ВШЭ

DeepZ

Репозиторий содержит код и данные для обучения нейросетей для поиска и выявления паттернов в Z-ДНК генома человека и мышей. Вопрос о роли Z-ДНК в процессе транскрипции актуален для вычислительной биологии и медицины. Исследования роли Z-флипонов в процессе создания РНК-копий генов может помочь в разработке новых лекарств. При обучении учитывалась не только информация из линейной последовательности ДНК, но и данные из десятков тысяч омиксных экспериментов. Обученные модели - для человека и мыши - выявляют в последовательности ДНК участки, которые с наибольшей вероятностью являются Z-ДНК. Работа может быть полезна медикам, биологам, биоинженерам и фармакологам.

статья | код

GitHub - Nazar1997/DeepZ_MM: DeepZ approach interpolated on mouse genome

DeepZ approach interpolated on mouse genome. Contribute to Nazar1997/DeepZ_MM development by creating an account on GitHub.

🔥12🤨4❤3🤔1

1.01K views09:21

Открытый код ФКН ВШЭ

Mr.Handy

Handy — проект с открытым исходным кодом на С++ и python, поддерживаемый HSE Robotics Group. Цель проекта — спроектировать и разработать роботизированный манипулятор, который сможет играть в настольный теннис. В репозитории есть код для считывания данных с камер, обучения и инференса модели для детекции шарика для тенниса, а так же для управления рукой-манипулятором. Весь код, наборы данных, модели и инструкции по разработке доступны и, как обещают авторы, всегда будут доступны онлайн. Следить за проектом можно в канале группы робототехники. Проект может быть полезен начинающим специалистам в области робототехники, машинного обучения и программирования микроконтроллеров.

код | канал

GitHub - robotics-laboratory/handy: Robotics manipulator Mr. Handy

Robotics manipulator Mr. Handy. Contribute to robotics-laboratory/handy development by creating an account on GitHub.

🔥5❤1🐳1

981 views10:53

Открытый код ФКН ВШЭ

delPezzo

Модуль для Sagemath для изучения гибкости аффинных конусов над поверхностями дель Пеццо. Код призван облегчать большинство операций для проверки общей гибкости аффинных конусов над поверхностями дель Пеццо и слабыми поверхностями дель Пеццо произвольной степени в зависимости от поляризации. Используя его, авторы проверили общую гибкость аффинных конусов над поляризациями поверхностей степени 1 при определенных условиях и над произвольными очень обильными поляризациями слабых поверхностей дель Пеццо степени 6. Репозиторий может быть полезен математикам.

статья | код

GitHub - hse-cs/delPezzo

Contribute to hse-cs/delPezzo development by creating an account on GitHub.

🔥8👍1

979 views09:04

Открытый код ФКН ВШЭ

Про открытый код на Хабре

Мы нашли для вас интересный блог на Хабре, автором которого является Дмитрий Кабанов. В своих статьях Дмитрий делится полезной информацией об открытом коде в России, а также публикует интервью с представителями различных компаний и университетов.

🔥Вот несколько свежих публикаций:

1. «Перебросить код через стену из юристов — еще не значит сделать его открытым», — Константин Осипов, основатель Picodata

2. Николай Никитин, лидер «Научного опенсорса» Университета ИТМО: чем open source может помочь ученым

3. Александр Нозик, директор Scientific Programming Centre, о научном программировании, open source в России и не только

4. Этот год в open source

Подписывайтесь на блог Дмитрия Кабанова, чтобы узнать больше об открытом коде 🚀

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥10❤2

774 views10:37

Открытый код ФКН ВШЭ

Forwarded from Yandex for ML

🛎

Продлили приём заявок на гранты для независимых разработчиков

Расскажите нам про свои опенсорс-проекты! Мы выберем среди участников 12 победителей, которые получат по 600 тысяч рублей на сервисы Yandex Cloud.

Принимаем заявки в трёх треках:

⚪️ Машинное обучение: ML-модели и датасеты

⚪️ Обработка и хранение данных: реляционные СУБД, NoSQL-БД, NewSQL-системы, S3, брокеры сообщений и инструменты для работы с ними

⚪️ Разработка: фреймворки, библиотеки и тулзы для фронтенда, бэкенда и мобилки

🔳 Подавайте заявки. Дедлайн уже 15 марта. Мы очень ждём ваши проекты!

Подписывайтесь:

💬

📹

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥4

791 views13:11

Открытый код ФКН ВШЭ

vaidya-with-certificates

В репозитории представлен код для построения сертификатов точности — специальных вычислимых критериев останова в задачах выпуклой оптимизации — подходящих для методов отсечения плоскости, использующих многоугольники в качестве локализаторов. В качестве примера авторы приводят метод Вайдьи, являющийся асимптотически оптимальным с точки зрения вызова оракула. Численные эксперименты показывают превосходство представленного метода построения сертификатов по сравнению с бейзлайн подходом. В качестве причины такого феномена исследователи называют отличие в методах: описываемый алгоритм ищет сертификаты, напрямую максимизирующие функцию, используемую для ограничения остатка. Работа может быть полезна исследователям в области оптимизации, DL-исследователям и математикам.

статья | код

GitHub - egorgladin/vaidya-with-certificates

Contribute to egorgladin/vaidya-with-certificates development by creating an account on GitHub.

🔥7❤1

851 views09:01

Открытый код ФКН ВШЭ

LightAutoML – история создания и победы

Александр Рыжков
Руководитель проекта LightAutoML
Победитель Kaggle AutoML Grand Prix 2024
Единственный в России 4х Kaggle Grand Master

Александр поделится историей создания фреймворка LightAutoML для автоматического построения моделей машинного обучения. Вы узнаете, как зародилась идея этого проекта и каким образом он превратился в мощный инструмент, сумевший превзойти решения Кремниевой долины и привести команду к победе на Kaggle AutoML Grand Prix 2024.

🕔 27 февраля в 18:30
📍Покровский бульвар 11, ауд. N508

Открытый доклад для всех 🚀

Please open Telegram to view this post

VIEW IN TELEGRAM

❤10🔥4

8.04K views12:08

Открытый код ФКН ВШЭ

heterophilous-graphs

В репозитории содержится код для воспроизведения результатов работы по критическому анализу оценки графовых нейронных сетей (GNN) на гетерофильных графах. Авторы выявили серьёзные недостатки популярных датасетов (squirrel, chameleon), включая дублирование узлов, что приводит к утечке данных между обучающей и тестовой выборками. Устранение дубликатов значительно снижает производительность моделей, меняя их ранжирование. Исследователи предлагают новые гетерофильные датасеты (roman-empire, amazon-ratings и др.), охватывающие различные домены и структурные свойства. Эксперименты показали, что стандартные GNN (например, GCN, GraphSAGE), особенно с модификацией разделения эго- и соседних эмбеддингов, часто превосходят специализированные модели для гетерофилии. Работа может быть полезна аналитикам данных, DL-исследователям и специалистам по графам.

статья | код

GitHub - yandex-research/heterophilous-graphs: A Critical Look at the Evaluation of GNNs under Heterophily: Are We Really Making…

A Critical Look at the Evaluation of GNNs under Heterophily: Are We Really Making Progress? - yandex-research/heterophilous-graphs

🔥11❤3

1.09K views09:04

Открытый код ФКН ВШЭ

Открытый код ФКН ВШЭ

LightAutoML – история создания и победы Александр Рыжков Руководитель проекта LightAutoML Победитель Kaggle AutoML Grand Prix 2024 Единственный в России 4х Kaggle Grand Master Александр поделится историей создания фреймворка LightAutoML для автоматического…

Привет!

Напоминаем, что сегодня в 18:30 в аудитории N508 Александр Рыжков расскажет про LightAutoML и про себя 😎

Приходите послушать и задать свои вопросы Александру

🔥13

756 views13:23

Открытый код ФКН ВШЭ

btard

В репозитории представлен код для проведения безопасного распределённого обучения нейронных сетей с учетом атак Byzantine. Авторы предлагают новый протокол BTARD-SGD, который сочетает эффективность современных алгоритмов All‑Reduce с криптографическими методами проверки целостности данных.В работе проведён строгий теоретический анализ сходимости как для выпуклых, так и для невыпуклых задач, а также для случаев с тяжелыми хвостами распределения градиентов. Дополнительно предложена эвристика для защиты от Sybil‑атак, позволяющая новым участникам присоединяться к обучению только после демонстрации надёжности своих вычислений. Экспериментальная оценка включает обучение ResNet‑18 на CIFAR‑10 и предобучение ALBERT‑large, где предложенный протокол успешно противостоит различным типам атак (обратное знаковое, атаки случайным направлением, флиппинг меток, задержка градиентов и др.), позволяя быстро восстановить качество модели после атак. Работа может быть полезна исследователям в области распределённого обучения, специалистов по безопасности ИИ и разработчикам систем коллективного обучения, где важно объединять вычислительные ресурсы без риска компрометации результатов из-за недобросовестных участников.

статья | код

GitHub - yandex-research/btard: Code for the paper "Secure Distributed Training at Scale" (ICML 2022)

Code for the paper "Secure Distributed Training at Scale" (ICML 2022) - yandex-research/btard

👍7

849 views09:00

Открытый код ФКН ВШЭ

Scientific Open Source Meetup прошел 26 феравля в Санкт-Петербурге

Митап организовали наши друзья из ИТМО. Была отличная атмосфера и интересные доклады на разные open source темы. Митапы проходят регулярно. Рекомендуем к посещению и просмотру 🚀

Доклады:
🔘 Знакомство с open-source AI экосистемой Китая, Олег Сиротюк, OpenScaler

🔘 OSA — ИИ-помощник для разработки научного открытого кода, Андрей Гетманов, исследователь и опенсорс энтузиаст, ИТМО

🔘 От Платона до Саурона. Путеводитель по разработке открытого кода, Илья Ревин, руководитель команды в области ИИ для промышленности, ИТМО

🔘 AI для ОС и ОС для AI — кейс openEuler, Владимир Павлов, представитель технического комитета OpenScaler

🔘 Open Hardware: как его применять для разработок в сфере ИИ, Иван Лобанов, разработчик open-source решений, ИТМО

🔘 Как выиграть на хакатонах больше 20 миллионов рублей. Лучшие и худшие практики, команда RASCAR, ИТМО, МФТИ.

🔘 Открытый код НИУ ВШЭ, Михаил Гущин, старший научный сотрудник ФКН ВШЭ

🔘 GitVerse AI-first платформа для работы с кодом, Анатолий Шипов, управляющий директор СберТеха, лидер продукта GitVerse.

🔘 Дискуссия «Новые возможности развития научного опенсорса в России»

Материалы и запись докладов есть в открытом доступе.

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥8❤3👍1

864 views09:09

Открытый код ФКН ВШЭ

Яндекс продлил приём заявок на программу грантов Yandex Open Source до 15 марта 2025

Это напоминалка для тех, кто пропустил конкурс, но хочет податься. Рассматриваются проекты по трекам:

🟥 Обработка и хранение данных: реляционные СУБД, NoSQL-БД, NewSQL-системы, S3, брокеры сообщений и инструменты для работы с ними.

🟥 Разработка: фреймворки, библиотеки и тулзы для фронтенда, бэкенда и мобилки.

🟥 Машинное обучение: ML-модели и датасеты.

12 победителей получат по 600 тысяч рублей на сервисы Yandex Cloud.

Проекты победителей 2024 года можно посмотреть тут

🏆

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4👍1🔥1

1.87K views09:16

Открытый код ФКН ВШЭ

CodeBuddy

В репозитории содержится код для реализации сервиса генерации кода мобильных приложений (iOS/Android) на основе больших языковых моделей. Авторы адаптируют существующую модель (CodeQwen) с помощью тонкой настройки (PEFT, QLoRA), а также проводят собственное бенчмаркинговое тестирование, ориентированное на задачи мобильной разработки (Swift). Предложенная микросервисная архитектура включает несколько модулей (API Gateway, чат, авторизация, ИИ-модуль), что повышает масштабируемость и удобство интеграции. Авторы показывают, что такой сервис способен автоматически генерировать компоненты пользовательского интерфейса, бизнес-логику, а также код тестов, упрощая рутинные задачи разработчика. Работа может быть полезна разработчикам мобильных приложений, специалистам по генерации кода и исследователям, занимающимся применением больших языковых моделей в узкоспециализированных областях.

статья | код

GitHub - LucyRez/CodeBuddy: CodeBuddy – service for code generation of mobile applications

CodeBuddy – service for code generation of mobile applications - LucyRez/CodeBuddy

👍7🔥4🐳2

1.01K views09:02

Открытый код ФКН ВШЭ

Открытый код ФКН ВШЭ pinned a photo

06:00

2025/07/09 18:00:39
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.tgoop.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>