DATA_ANALYSIS_ML Telegram 3794
🧠 Energy-Based Transformers — модель, которая умеет думать, а не просто угадывать

Новая архитектура EBT (Energy-Based Transformers) показывает, что трансформеры можно сделать умнее и универсальнее.

Что делает EBT:
- 📊 Лучше классических трансформеров (включая Transformer++) по всем параметрам: данные, глубина, количество параметров, вычисления
- При "долгом размышлении" даёт +29% прирост качества на тестах
- 🌍 Отлично работает с любыми типами данных: текст, видео, звук, 3D и др.
- 🧠 Умеет обобщать — справляется с новыми задачами без дообучения
- Не нуждается в наградах (как в reinforcement learning)

Почему это важно:
EBT — это шаг к ИИ, который способен реально *думать*, а не просто воспроизводить шаблоны. Он не просто быстрее, он глубже понимает, что делает.

Website: https://energy-based-transformers.github.io
Paper: https://arxiv.org/abs/2507.02092

@data_analysis_ml
11👍3🔥2



tgoop.com/data_analysis_ml/3794
Create:
Last Update:

🧠 Energy-Based Transformers — модель, которая умеет думать, а не просто угадывать

Новая архитектура EBT (Energy-Based Transformers) показывает, что трансформеры можно сделать умнее и универсальнее.

Что делает EBT:
- 📊 Лучше классических трансформеров (включая Transformer++) по всем параметрам: данные, глубина, количество параметров, вычисления
- При "долгом размышлении" даёт +29% прирост качества на тестах
- 🌍 Отлично работает с любыми типами данных: текст, видео, звук, 3D и др.
- 🧠 Умеет обобщать — справляется с новыми задачами без дообучения
- Не нуждается в наградах (как в reinforcement learning)

Почему это важно:
EBT — это шаг к ИИ, который способен реально *думать*, а не просто воспроизводить шаблоны. Он не просто быстрее, он глубже понимает, что делает.

Website: https://energy-based-transformers.github.io
Paper: https://arxiv.org/abs/2507.02092

@data_analysis_ml

BY Анализ данных (Data analysis)









Share with your friend now:
tgoop.com/data_analysis_ml/3794

View MORE
Open in Telegram


Telegram News

Date: |

Among the requests, the Brazilian electoral Court wanted to know if they could obtain data on the origins of malicious content posted on the platform. According to the TSE, this would enable the authorities to track false content and identify the user responsible for publishing it in the first place. Write your hashtags in the language of your target audience. Concise Don’t publish new content at nighttime. Since not all users disable notifications for the night, you risk inadvertently disturbing them. There have been several contributions to the group with members posting voice notes of screaming, yelling, groaning, and wailing in different rhythms and pitches. Calling out the “degenerate” community or the crypto obsessives that engage in high-risk trading, Co-founder of NFT renting protocol Rentable World emiliano.eth shared this group on his Twitter. He wrote: “hey degen, are you stressed? Just let it out all out. Voice only tg channel for screaming”.
from us


Telegram Анализ данных (Data analysis)
FROM American