TabM
Репозиторий, содержащий имплементацию TabM — модели, эффективно имитирующей ансамбль многослойных перцептронов для решения задач на табличных данных. Для этого вводятся специальные адаптеры - матрицы, чьи элементы равны ± 1. Эти адаптеры эффективно создают уникальные версии матрицы весов, за счет чего и имитируется ансамбль. В итоговой архитектуре такой адаптер применяется только ко всем копиям одного входа, которые затем подаются в линейные слои. В серии экспериментов авторы показывают существенное превосходство метода для задач на табличных данных по сравнению с другими классическими и нейросетевыми подходами, в том числе использующие механизм внимания. Модель также демонстрирует лучшую скорость обучения и инференса, уступая лишь стандартному MLP и XGBoost. Работа может быть полезна аналитикам, DS-специалистам и DL-исследователям.
статья | код
Репозиторий, содержащий имплементацию TabM — модели, эффективно имитирующей ансамбль многослойных перцептронов для решения задач на табличных данных. Для этого вводятся специальные адаптеры - матрицы, чьи элементы равны ± 1. Эти адаптеры эффективно создают уникальные версии матрицы весов, за счет чего и имитируется ансамбль. В итоговой архитектуре такой адаптер применяется только ко всем копиям одного входа, которые затем подаются в линейные слои. В серии экспериментов авторы показывают существенное превосходство метода для задач на табличных данных по сравнению с другими классическими и нейросетевыми подходами, в том числе использующие механизм внимания. Модель также демонстрирует лучшую скорость обучения и инференса, уступая лишь стандартному MLP и XGBoost. Работа может быть полезна аналитикам, DS-специалистам и DL-исследователям.
статья | код
GitHub
GitHub - yandex-research/tabm: (ICLR 2025) TabM: Advancing Tabular Deep Learning With Parameter-Efficient Ensembling
(ICLR 2025) TabM: Advancing Tabular Deep Learning With Parameter-Efficient Ensembling - yandex-research/tabm
🔥6
Поздравляем с 2025 годом! 🎄🎆
Удачи и успеха вам в новом году, друзья!🎁
Спасибо, что остаётесь с нами!
Удачи и успеха вам в новом году, друзья!
Спасибо, что остаётесь с нами!
Please open Telegram to view this post
VIEW IN TELEGRAM
🎉13❤🔥2❤1👍1
rtdl-num-embeddings
Библиотека на python, позволяющая получать эмбеддинги для непрерывных признаков в задачах для табличных данных. Используемые вместо скалярных признаков эмбеддинги улучшают итоговое качество моделей на специфических задачах, при этом не увеличивая вычислительную сложность. В своей работе авторы представляют несколько алгоритмов получения эбмеддингов, а в экспериментальной части показывают состоятельность метода. В частности, сравнивая DL-алгоритмы с классическими подходами, такими как GBDT, на задачах, заточенных под последние. В таком режиме DL методы без использования эмебеддингов уступают классическим, а при использовании обходят их. Библиотека может быть полезна DS-специалистам, дата аналитикам и ML-инженерам.
статья | код
Библиотека на python, позволяющая получать эмбеддинги для непрерывных признаков в задачах для табличных данных. Используемые вместо скалярных признаков эмбеддинги улучшают итоговое качество моделей на специфических задачах, при этом не увеличивая вычислительную сложность. В своей работе авторы представляют несколько алгоритмов получения эбмеддингов, а в экспериментальной части показывают состоятельность метода. В частности, сравнивая DL-алгоритмы с классическими подходами, такими как GBDT, на задачах, заточенных под последние. В таком режиме DL методы без использования эмебеддингов уступают классическим, а при использовании обходят их. Библиотека может быть полезна DS-специалистам, дата аналитикам и ML-инженерам.
статья | код
GitHub
GitHub - yandex-research/rtdl-num-embeddings: (NeurIPS 2022) On Embeddings for Numerical Features in Tabular Deep Learning
(NeurIPS 2022) On Embeddings for Numerical Features in Tabular Deep Learning - yandex-research/rtdl-num-embeddings
🔥12
RATANSunPy
Библиотека на python, разработанный для доступа, визуализации и анализа многополосных радионаблюдений Солнца с комплекса РАТАН-600. Эти данные представляют ценность для диагностики состояния солнечной плазмы и прогнозирования солнечной активности. Пакет предлагает комплексные функции обработки данных, включая прямой доступ к необработанным данным, основные этапы обработки, такие как калибровка и нормализация тихого Солнца, а также инструменты для анализа солнечной активности. Сюда входит автоматическое обнаружение локальных источников, идентификация их с активными областями NOAA и дальнейшее определение параметров для локальных источников и активных областей. Работа может быть полезна физикам, астрономам, и DS-специалистам.
статья | код
Библиотека на python, разработанный для доступа, визуализации и анализа многополосных радионаблюдений Солнца с комплекса РАТАН-600. Эти данные представляют ценность для диагностики состояния солнечной плазмы и прогнозирования солнечной активности. Пакет предлагает комплексные функции обработки данных, включая прямой доступ к необработанным данным, основные этапы обработки, такие как калибровка и нормализация тихого Солнца, а также инструменты для анализа солнечной активности. Сюда входит автоматическое обнаружение локальных источников, идентификация их с активными областями NOAA и дальнейшее определение параметров для локальных источников и активных областей. Работа может быть полезна физикам, астрономам, и DS-специалистам.
статья | код
GitHub
GitHub - SpbfSAO/RATANSunPy: RATAN-600 radioastronomical solar data and methods Python library
RATAN-600 radioastronomical solar data and methods Python library - SpbfSAO/RATANSunPy
❤3👍1🔥1
structural-graph-shifts
В работе рассматривается проблема оценки робастности моделей графовых нейронных сетей. Для оценки неопределенности прогноза в таких моделях используются различные подходы: общие, например, ансамблирование, и специфические, использующие свойства графовой структуры. Вне зависимости от метода оценки устойчивости модели, для его обучения необходимы данные, содержащие в себе различные источники неопределенностей, например, сдвиги распределений. Типичные датасеты для оценки робастности графовых нейронных сетей используют сдвиги на уровне признаков. Авторы предлагают более универсальный способ создания неопределенности в данных, основанный на особенностях графовых данных. В репозитории проекта содержится код, позволяющий получить подобные данные с различными видами неопределенности, а также имплементацию различных методов оценки неопределенности и улучшения робастности. В серии экспериментов авторы демонстрируют сложность, с которой сталкиваются модели в таком режиме обучения. При этом более простые модели часто превосходят в качестве прогноза продвинутые алгоритмы. Работа может быть полезна DL-исследователям, специалистам по графовым нейронным сетям, DS-специалистам и дата аналитикам.
статья | код
В работе рассматривается проблема оценки робастности моделей графовых нейронных сетей. Для оценки неопределенности прогноза в таких моделях используются различные подходы: общие, например, ансамблирование, и специфические, использующие свойства графовой структуры. Вне зависимости от метода оценки устойчивости модели, для его обучения необходимы данные, содержащие в себе различные источники неопределенностей, например, сдвиги распределений. Типичные датасеты для оценки робастности графовых нейронных сетей используют сдвиги на уровне признаков. Авторы предлагают более универсальный способ создания неопределенности в данных, основанный на особенностях графовых данных. В репозитории проекта содержится код, позволяющий получить подобные данные с различными видами неопределенности, а также имплементацию различных методов оценки неопределенности и улучшения робастности. В серии экспериментов авторы демонстрируют сложность, с которой сталкиваются модели в таком режиме обучения. При этом более простые модели часто превосходят в качестве прогноза продвинутые алгоритмы. Работа может быть полезна DL-исследователям, специалистам по графовым нейронным сетям, DS-специалистам и дата аналитикам.
статья | код
GitHub
GitHub - yandex-research/structural-graph-shifts: New structural distributional shifts for evaluating graph models
New structural distributional shifts for evaluating graph models - yandex-research/structural-graph-shifts
❤6👍2
Первое исследование open source от СберТеха
Исследователи из СберТеха проанализировали тысячи профилей на GitHub и получили интересные результаты об open source в мире и в России.
Некоторые выводы исследования:
🟢 основные языки разработки — Python и JavaScript, в тренде —TypeScript, Rust и Lua;
🟢 самый популярный российский проект на GitHub — JavaScript-фреймворк core-js;
🟢 самая популярная у нас отечественная большая языковая модель — ruGPT3 (Сбер), а СУБД — YDB (Яндекс);
🟢 самые популярные категории open source проектов — JavaScript-, web- и css-фреймворки;
🟢 локальное китайское open source сообщество Gitee растет быстрее, чем на GitHub, и уже опережает его более чем в 1,5 раза по числу репозиториев.
Полный отчет можно посмотреть здесь.
Исследователи из СберТеха проанализировали тысячи профилей на GitHub и получили интересные результаты об open source в мире и в России.
Некоторые выводы исследования:
🟢 основные языки разработки — Python и JavaScript, в тренде —TypeScript, Rust и Lua;
🟢 самый популярный российский проект на GitHub — JavaScript-фреймворк core-js;
🟢 самая популярная у нас отечественная большая языковая модель — ruGPT3 (Сбер), а СУБД — YDB (Яндекс);
🟢 самые популярные категории open source проектов — JavaScript-, web- и css-фреймворки;
🟢 локальное китайское open source сообщество Gitee растет быстрее, чем на GitHub, и уже опережает его более чем в 1,5 раза по числу репозиториев.
Полный отчет можно посмотреть здесь.
🔥5❤1👍1
DeepZ
Репозиторий содержит код и данные для обучения нейросетей для поиска и выявления паттернов в Z-ДНК генома человека и мышей. Вопрос о роли Z-ДНК в процессе транскрипции актуален для вычислительной биологии и медицины. Исследования роли Z-флипонов в процессе создания РНК-копий генов может помочь в разработке новых лекарств. При обучении учитывалась не только информация из линейной последовательности ДНК, но и данные из десятков тысяч омиксных экспериментов. Обученные модели - для человека и мыши - выявляют в последовательности ДНК участки, которые с наибольшей вероятностью являются Z-ДНК. Работа может быть полезна медикам, биологам, биоинженерам и фармакологам.
статья | код
Репозиторий содержит код и данные для обучения нейросетей для поиска и выявления паттернов в Z-ДНК генома человека и мышей. Вопрос о роли Z-ДНК в процессе транскрипции актуален для вычислительной биологии и медицины. Исследования роли Z-флипонов в процессе создания РНК-копий генов может помочь в разработке новых лекарств. При обучении учитывалась не только информация из линейной последовательности ДНК, но и данные из десятков тысяч омиксных экспериментов. Обученные модели - для человека и мыши - выявляют в последовательности ДНК участки, которые с наибольшей вероятностью являются Z-ДНК. Работа может быть полезна медикам, биологам, биоинженерам и фармакологам.
статья | код
GitHub
GitHub - Nazar1997/DeepZ_MM: DeepZ approach interpolated on mouse genome
DeepZ approach interpolated on mouse genome. Contribute to Nazar1997/DeepZ_MM development by creating an account on GitHub.
🔥12🤨4❤3🤔1
Mr.Handy
Handy — проект с открытым исходным кодом на С++ и python, поддерживаемый HSE Robotics Group. Цель проекта — спроектировать и разработать роботизированный манипулятор, который сможет играть в настольный теннис. В репозитории есть код для считывания данных с камер, обучения и инференса модели для детекции шарика для тенниса, а так же для управления рукой-манипулятором. Весь код, наборы данных, модели и инструкции по разработке доступны и, как обещают авторы, всегда будут доступны онлайн. Следить за проектом можно в канале группы робототехники. Проект может быть полезен начинающим специалистам в области робототехники, машинного обучения и программирования микроконтроллеров.
код | канал
Handy — проект с открытым исходным кодом на С++ и python, поддерживаемый HSE Robotics Group. Цель проекта — спроектировать и разработать роботизированный манипулятор, который сможет играть в настольный теннис. В репозитории есть код для считывания данных с камер, обучения и инференса модели для детекции шарика для тенниса, а так же для управления рукой-манипулятором. Весь код, наборы данных, модели и инструкции по разработке доступны и, как обещают авторы, всегда будут доступны онлайн. Следить за проектом можно в канале группы робототехники. Проект может быть полезен начинающим специалистам в области робототехники, машинного обучения и программирования микроконтроллеров.
код | канал
GitHub
GitHub - robotics-laboratory/handy: Robotics manipulator Mr. Handy
Robotics manipulator Mr. Handy. Contribute to robotics-laboratory/handy development by creating an account on GitHub.
🔥5❤1🐳1
delPezzo
Модуль для Sagemath для изучения гибкости аффинных конусов над поверхностями дель Пеццо. Код призван облегчать большинство операций для проверки общей гибкости аффинных конусов над поверхностями дель Пеццо и слабыми поверхностями дель Пеццо произвольной степени в зависимости от поляризации. Используя его, авторы проверили общую гибкость аффинных конусов над поляризациями поверхностей степени 1 при определенных условиях и над произвольными очень обильными поляризациями слабых поверхностей дель Пеццо степени 6. Репозиторий может быть полезен математикам.
статья | код
Модуль для Sagemath для изучения гибкости аффинных конусов над поверхностями дель Пеццо. Код призван облегчать большинство операций для проверки общей гибкости аффинных конусов над поверхностями дель Пеццо и слабыми поверхностями дель Пеццо произвольной степени в зависимости от поляризации. Используя его, авторы проверили общую гибкость аффинных конусов над поляризациями поверхностей степени 1 при определенных условиях и над произвольными очень обильными поляризациями слабых поверхностей дель Пеццо степени 6. Репозиторий может быть полезен математикам.
статья | код
GitHub
GitHub - hse-cs/delPezzo
Contribute to hse-cs/delPezzo development by creating an account on GitHub.
🔥8👍1
Про открытый код на Хабре
Мы нашли для вас интересный блог на Хабре, автором которого является Дмитрий Кабанов. В своих статьях Дмитрий делится полезной информацией об открытом коде в России, а также публикует интервью с представителями различных компаний и университетов.
🔥Вот несколько свежих публикаций:
1. «Перебросить код через стену из юристов — еще не значит сделать его открытым», — Константин Осипов, основатель Picodata
2. Николай Никитин, лидер «Научного опенсорса» Университета ИТМО: чем open source может помочь ученым
3. Александр Нозик, директор Scientific Programming Centre, о научном программировании, open source в России и не только
4. Этот год в open source
Подписывайтесь на блог Дмитрия Кабанова, чтобы узнать больше об открытом коде🚀
Мы нашли для вас интересный блог на Хабре, автором которого является Дмитрий Кабанов. В своих статьях Дмитрий делится полезной информацией об открытом коде в России, а также публикует интервью с представителями различных компаний и университетов.
🔥Вот несколько свежих публикаций:
1. «Перебросить код через стену из юристов — еще не значит сделать его открытым», — Константин Осипов, основатель Picodata
2. Николай Никитин, лидер «Научного опенсорса» Университета ИТМО: чем open source может помочь ученым
3. Александр Нозик, директор Scientific Programming Centre, о научном программировании, open source в России и не только
4. Этот год в open source
Подписывайтесь на блог Дмитрия Кабанова, чтобы узнать больше об открытом коде
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10❤2
Forwarded from Yandex for ML
Расскажите нам про свои опенсорс-проекты! Мы выберем среди участников 12 победителей, которые получат по 600 тысяч рублей на сервисы Yandex Cloud.
Принимаем заявки в трёх треках:
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4
vaidya-with-certificates
В репозитории представлен код для построения сертификатов точности — специальных вычислимых критериев останова в задачах выпуклой оптимизации — подходящих для методов отсечения плоскости, использующих многоугольники в качестве локализаторов. В качестве примера авторы приводят метод Вайдьи, являющийся асимптотически оптимальным с точки зрения вызова оракула. Численные эксперименты показывают превосходство представленного метода построения сертификатов по сравнению с бейзлайн подходом. В качестве причины такого феномена исследователи называют отличие в методах: описываемый алгоритм ищет сертификаты, напрямую максимизирующие функцию, используемую для ограничения остатка. Работа может быть полезна исследователям в области оптимизации, DL-исследователям и математикам.
статья | код
В репозитории представлен код для построения сертификатов точности — специальных вычислимых критериев останова в задачах выпуклой оптимизации — подходящих для методов отсечения плоскости, использующих многоугольники в качестве локализаторов. В качестве примера авторы приводят метод Вайдьи, являющийся асимптотически оптимальным с точки зрения вызова оракула. Численные эксперименты показывают превосходство представленного метода построения сертификатов по сравнению с бейзлайн подходом. В качестве причины такого феномена исследователи называют отличие в методах: описываемый алгоритм ищет сертификаты, напрямую максимизирующие функцию, используемую для ограничения остатка. Работа может быть полезна исследователям в области оптимизации, DL-исследователям и математикам.
статья | код
GitHub
GitHub - egorgladin/vaidya-with-certificates
Contribute to egorgladin/vaidya-with-certificates development by creating an account on GitHub.
🔥7❤1
LightAutoML – история создания и победы
Александр Рыжков
Руководитель проекта LightAutoML
Победитель Kaggle AutoML Grand Prix 2024
Единственный в России 4х Kaggle Grand Master
Александр поделится историей создания фреймворка LightAutoML для автоматического построения моделей машинного обучения. Вы узнаете, как зародилась идея этого проекта и каким образом он превратился в мощный инструмент, сумевший превзойти решения Кремниевой долины и привести команду к победе на Kaggle AutoML Grand Prix 2024.
🕔 27 февраля в 18:30
📍 Покровский бульвар 11, ауд. N508
Открытый доклад для всех🚀
Александр Рыжков
Руководитель проекта LightAutoML
Победитель Kaggle AutoML Grand Prix 2024
Единственный в России 4х Kaggle Grand Master
Александр поделится историей создания фреймворка LightAutoML для автоматического построения моделей машинного обучения. Вы узнаете, как зародилась идея этого проекта и каким образом он превратился в мощный инструмент, сумевший превзойти решения Кремниевой долины и привести команду к победе на Kaggle AutoML Grand Prix 2024.
🕔 27 февраля в 18:30
Открытый доклад для всех
Please open Telegram to view this post
VIEW IN TELEGRAM
❤10🔥4
heterophilous-graphs
В репозитории содержится код для воспроизведения результатов работы по критическому анализу оценки графовых нейронных сетей (GNN) на гетерофильных графах. Авторы выявили серьёзные недостатки популярных датасетов (squirrel, chameleon), включая дублирование узлов, что приводит к утечке данных между обучающей и тестовой выборками. Устранение дубликатов значительно снижает производительность моделей, меняя их ранжирование. Исследователи предлагают новые гетерофильные датасеты (roman-empire, amazon-ratings и др.), охватывающие различные домены и структурные свойства. Эксперименты показали, что стандартные GNN (например, GCN, GraphSAGE), особенно с модификацией разделения эго- и соседних эмбеддингов, часто превосходят специализированные модели для гетерофилии. Работа может быть полезна аналитикам данных, DL-исследователям и специалистам по графам.
статья | код
В репозитории содержится код для воспроизведения результатов работы по критическому анализу оценки графовых нейронных сетей (GNN) на гетерофильных графах. Авторы выявили серьёзные недостатки популярных датасетов (squirrel, chameleon), включая дублирование узлов, что приводит к утечке данных между обучающей и тестовой выборками. Устранение дубликатов значительно снижает производительность моделей, меняя их ранжирование. Исследователи предлагают новые гетерофильные датасеты (roman-empire, amazon-ratings и др.), охватывающие различные домены и структурные свойства. Эксперименты показали, что стандартные GNN (например, GCN, GraphSAGE), особенно с модификацией разделения эго- и соседних эмбеддингов, часто превосходят специализированные модели для гетерофилии. Работа может быть полезна аналитикам данных, DL-исследователям и специалистам по графам.
статья | код
GitHub
GitHub - yandex-research/heterophilous-graphs: A Critical Look at the Evaluation of GNNs under Heterophily: Are We Really Making…
A Critical Look at the Evaluation of GNNs under Heterophily: Are We Really Making Progress? - yandex-research/heterophilous-graphs
🔥11❤3
Открытый код ФКН ВШЭ
LightAutoML – история создания и победы Александр Рыжков Руководитель проекта LightAutoML Победитель Kaggle AutoML Grand Prix 2024 Единственный в России 4х Kaggle Grand Master Александр поделится историей создания фреймворка LightAutoML для автоматического…
Привет!
Напоминаем, что сегодня в 18:30 в аудитории N508 Александр Рыжков расскажет про LightAutoML и про себя 😎
Приходите послушать и задать свои вопросы Александру
Напоминаем, что сегодня в 18:30 в аудитории N508 Александр Рыжков расскажет про LightAutoML и про себя 😎
Приходите послушать и задать свои вопросы Александру
🔥13
btard
В репозитории представлен код для проведения безопасного распределённого обучения нейронных сетей с учетом атак Byzantine. Авторы предлагают новый протокол BTARD-SGD, который сочетает эффективность современных алгоритмов All‑Reduce с криптографическими методами проверки целостности данных.В работе проведён строгий теоретический анализ сходимости как для выпуклых, так и для невыпуклых задач, а также для случаев с тяжелыми хвостами распределения градиентов. Дополнительно предложена эвристика для защиты от Sybil‑атак, позволяющая новым участникам присоединяться к обучению только после демонстрации надёжности своих вычислений. Экспериментальная оценка включает обучение ResNet‑18 на CIFAR‑10 и предобучение ALBERT‑large, где предложенный протокол успешно противостоит различным типам атак (обратное знаковое, атаки случайным направлением, флиппинг меток, задержка градиентов и др.), позволяя быстро восстановить качество модели после атак. Работа может быть полезна исследователям в области распределённого обучения, специалистов по безопасности ИИ и разработчикам систем коллективного обучения, где важно объединять вычислительные ресурсы без риска компрометации результатов из-за недобросовестных участников.
статья | код
В репозитории представлен код для проведения безопасного распределённого обучения нейронных сетей с учетом атак Byzantine. Авторы предлагают новый протокол BTARD-SGD, который сочетает эффективность современных алгоритмов All‑Reduce с криптографическими методами проверки целостности данных.В работе проведён строгий теоретический анализ сходимости как для выпуклых, так и для невыпуклых задач, а также для случаев с тяжелыми хвостами распределения градиентов. Дополнительно предложена эвристика для защиты от Sybil‑атак, позволяющая новым участникам присоединяться к обучению только после демонстрации надёжности своих вычислений. Экспериментальная оценка включает обучение ResNet‑18 на CIFAR‑10 и предобучение ALBERT‑large, где предложенный протокол успешно противостоит различным типам атак (обратное знаковое, атаки случайным направлением, флиппинг меток, задержка градиентов и др.), позволяя быстро восстановить качество модели после атак. Работа может быть полезна исследователям в области распределённого обучения, специалистов по безопасности ИИ и разработчикам систем коллективного обучения, где важно объединять вычислительные ресурсы без риска компрометации результатов из-за недобросовестных участников.
статья | код
GitHub
GitHub - yandex-research/btard: Code for the paper "Secure Distributed Training at Scale" (ICML 2022)
Code for the paper "Secure Distributed Training at Scale" (ICML 2022) - yandex-research/btard
👍7
Scientific Open Source Meetup прошел 26 феравля в Санкт-Петербурге
Митап организовали наши друзья из ИТМО. Была отличная атмосфера и интересные доклады на разные open source темы. Митапы проходят регулярно. Рекомендуем к посещению и просмотру🚀
Доклады:
🔘 Знакомство с open-source AI экосистемой Китая, Олег Сиротюк, OpenScaler
🔘 OSA — ИИ-помощник для разработки научного открытого кода, Андрей Гетманов, исследователь и опенсорс энтузиаст, ИТМО
🔘 От Платона до Саурона. Путеводитель по разработке открытого кода, Илья Ревин, руководитель команды в области ИИ для промышленности, ИТМО
🔘 AI для ОС и ОС для AI — кейс openEuler, Владимир Павлов, представитель технического комитета OpenScaler
🔘 Open Hardware: как его применять для разработок в сфере ИИ, Иван Лобанов, разработчик open-source решений, ИТМО
🔘 Как выиграть на хакатонах больше 20 миллионов рублей. Лучшие и худшие практики, команда RASCAR, ИТМО, МФТИ.
🔘 Открытый код НИУ ВШЭ, Михаил Гущин, старший научный сотрудник ФКН ВШЭ
🔘 GitVerse AI-first платформа для работы с кодом, Анатолий Шипов, управляющий директор СберТеха, лидер продукта GitVerse.
🔘 Дискуссия «Новые возможности развития научного опенсорса в России»
Материалы и запись докладов есть в открытом доступе.
Митап организовали наши друзья из ИТМО. Была отличная атмосфера и интересные доклады на разные open source темы. Митапы проходят регулярно. Рекомендуем к посещению и просмотру
Доклады:
🔘 Знакомство с open-source AI экосистемой Китая, Олег Сиротюк, OpenScaler
🔘 OSA — ИИ-помощник для разработки научного открытого кода, Андрей Гетманов, исследователь и опенсорс энтузиаст, ИТМО
🔘 От Платона до Саурона. Путеводитель по разработке открытого кода, Илья Ревин, руководитель команды в области ИИ для промышленности, ИТМО
🔘 AI для ОС и ОС для AI — кейс openEuler, Владимир Павлов, представитель технического комитета OpenScaler
🔘 Open Hardware: как его применять для разработок в сфере ИИ, Иван Лобанов, разработчик open-source решений, ИТМО
🔘 Как выиграть на хакатонах больше 20 миллионов рублей. Лучшие и худшие практики, команда RASCAR, ИТМО, МФТИ.
🔘 Открытый код НИУ ВШЭ, Михаил Гущин, старший научный сотрудник ФКН ВШЭ
🔘 GitVerse AI-first платформа для работы с кодом, Анатолий Шипов, управляющий директор СберТеха, лидер продукта GitVerse.
🔘 Дискуссия «Новые возможности развития научного опенсорса в России»
Материалы и запись докладов есть в открытом доступе.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8❤3👍1
Яндекс продлил приём заявок на программу грантов Yandex Open Source до 15 марта 2025
Это напоминалка для тех, кто пропустил конкурс, но хочет податься. Рассматриваются проекты по трекам:
🟥 Обработка и хранение данных: реляционные СУБД, NoSQL-БД, NewSQL-системы, S3, брокеры сообщений и инструменты для работы с ними.
🟥 Разработка: фреймворки, библиотеки и тулзы для фронтенда, бэкенда и мобилки.
🟥 Машинное обучение: ML-модели и датасеты.
12 победителей получат по 600 тысяч рублей на сервисы Yandex Cloud.
Проекты победителей 2024 года можно посмотреть тут🏆
Это напоминалка для тех, кто пропустил конкурс, но хочет податься. Рассматриваются проекты по трекам:
🟥 Обработка и хранение данных: реляционные СУБД, NoSQL-БД, NewSQL-системы, S3, брокеры сообщений и инструменты для работы с ними.
🟥 Разработка: фреймворки, библиотеки и тулзы для фронтенда, бэкенда и мобилки.
🟥 Машинное обучение: ML-модели и датасеты.
12 победителей получат по 600 тысяч рублей на сервисы Yandex Cloud.
Проекты победителей 2024 года можно посмотреть тут
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4👍1🔥1
CodeBuddy
В репозитории содержится код для реализации сервиса генерации кода мобильных приложений (iOS/Android) на основе больших языковых моделей. Авторы адаптируют существующую модель (CodeQwen) с помощью тонкой настройки (PEFT, QLoRA), а также проводят собственное бенчмаркинговое тестирование, ориентированное на задачи мобильной разработки (Swift). Предложенная микросервисная архитектура включает несколько модулей (API Gateway, чат, авторизация, ИИ-модуль), что повышает масштабируемость и удобство интеграции. Авторы показывают, что такой сервис способен автоматически генерировать компоненты пользовательского интерфейса, бизнес-логику, а также код тестов, упрощая рутинные задачи разработчика. Работа может быть полезна разработчикам мобильных приложений, специалистам по генерации кода и исследователям, занимающимся применением больших языковых моделей в узкоспециализированных областях.
статья | код
В репозитории содержится код для реализации сервиса генерации кода мобильных приложений (iOS/Android) на основе больших языковых моделей. Авторы адаптируют существующую модель (CodeQwen) с помощью тонкой настройки (PEFT, QLoRA), а также проводят собственное бенчмаркинговое тестирование, ориентированное на задачи мобильной разработки (Swift). Предложенная микросервисная архитектура включает несколько модулей (API Gateway, чат, авторизация, ИИ-модуль), что повышает масштабируемость и удобство интеграции. Авторы показывают, что такой сервис способен автоматически генерировать компоненты пользовательского интерфейса, бизнес-логику, а также код тестов, упрощая рутинные задачи разработчика. Работа может быть полезна разработчикам мобильных приложений, специалистам по генерации кода и исследователям, занимающимся применением больших языковых моделей в узкоспециализированных областях.
статья | код
GitHub
GitHub - LucyRez/CodeBuddy: CodeBuddy – service for code generation of mobile applications
CodeBuddy – service for code generation of mobile applications - LucyRez/CodeBuddy
👍7🔥4🐳2