Институт AIRI@airi_research

Исследователи AIRI выяснили, что большие языковые модели гораздо линейнее, чем все думали

🔔

В новом исследовании ученые лаборатории FusionBrain AIRI вместе с коллегами из Сколтеха и Sber AI обнаружили, что преобразование эмбеддингов в большей части слоёв в трансформерах-декодерах на 99% имеет линейный характер, причём такое наблюдается во всех популярных моделях. Фактически, это значит, что множество нелинейных операций в таких слоях можно заменить на линейное преобразование без потери качества.

Исследование позволяет проанализировать внутренние представления языковых моделей, а также без потери качества избавиться от 10-15% слоёв. Научная статья уже принята на конференцию ACL (A*), а код выложен на GitHub.

🔖

Подробнее о деталях исследования научный сотрудник AIRI Антон Разжигаев рассказал в новой статье на нашем Хабре.

Статья попала на первое место в Daily Papers на Hugging Face, проголосовать за нее можно по ссылке 🔥

Please open Telegram to view this post

VIEW IN TELEGRAM

❤94

www.tgoop.com/airi_research_institute/526

6.19K viewsMay 22, 2024 at 14:09

tgoop.com/airi_research_institute/526

Create: 2024-05-22
Last Update: 2025-07-30 21:01:42

Исследователи AIRI выяснили, что большие языковые модели гораздо линейнее, чем все думали 🔔

В новом исследовании ученые лаборатории FusionBrain AIRI вместе с коллегами из Сколтеха и Sber AI обнаружили, что преобразование эмбеддингов в большей части слоёв в трансформерах-декодерах на 99% имеет линейный характер, причём такое наблюдается во всех популярных моделях. Фактически, это значит, что множество нелинейных операций в таких слоях можно заменить на линейное преобразование без потери качества.

Исследование позволяет проанализировать внутренние представления языковых моделей, а также без потери качества избавиться от 10-15% слоёв. Научная статья уже принята на конференцию ACL (A*), а код выложен на GitHub.

🔖Подробнее о деталях исследования научный сотрудник AIRI Антон Разжигаев рассказал в новой статье на нашем Хабре.

Статья попала на первое место в Daily Papers на Hugging Face, проголосовать за нее можно по ссылке 🔥

Telegram News

Исследователи AIRI выяснили