tgoop.com/midov_channel/470
Create:
Last Update:
Last Update:
Можно очень долго спорить о бенчмарках моделей. И есть много примеров, когда модели, которые круто перформят в бенчмарках, слабы в реальном мире.
Похоже, настоящий тест — это использование в вертикальных задачах и релевантных приложениях.
Например, в кодинге, кажется, самый честный ответ на вопрос "какая модель лучше" - это частота использования в Cursor. (источник)
#личное #genAI
BY Midov trip

Share with your friend now:
tgoop.com/midov_channel/470