Вновь о DeepSeek.

Заметки инженера - исследователя

Вновь о DeepSeek.

Одно дело - когда сам над чем-то рассуждаешь. Другое дело - когда выводы, полученные тобой исходя из общих соображений, подтверждают профильные специалисты.

Портал MIT Technology Review, статья "Как DeepSeek разнес в пух и прах принципы создания ИИ — и почему все последуют его примеру"

__________
GPT-4o, Gemini 2.0, V3 — теперь достаточно хороши, чтобы с их помощью можно было добиться поведения, похожего на рассуждение.

«R1 показывает, что при наличии достаточно сильной базовой модели, обучения с подкреплением достаточно, чтобы языковая модель рассуждала без какого-либо контроля со стороны человека», — говорит Льюис Танстолл, учёный из Hugging Face.

Другими словами, ведущие американские компании, возможно, уже поняли, как это сделать, но держали это в секрете. «Похоже, что есть умный способ взять базовую модель, предварительно обученную модель, и превратить её в гораздо более способную к рассуждениям модель, — говорит Цайлер. — И до этого момента процедура, необходимая для преобразования предварительно обученной модели в модель для рассуждений, была малоизвестна. Она не была публичной».

Отличие R1 в том, что DeepSeek опубликовал, как они это сделали. “И оказывается, что это не такой уж дорогой процесс”, - говорит Зейлер. “Самое сложное - это получить эту предварительно подготовленную модель”. Как показал Карпати на Microsoft Build в прошлом году, предварительная подготовка модели составляет 99% работы и большую часть затрат.

Если построение логических моделей не так сложно, как люди думали, мы можем ожидать распространения бесплатных моделей, которые гораздо более эффективны, чем мы когда-либо видели. По мнению Фридмана, когда ноу-хау станет достоянием общественности, между небольшими компаниями будет расширяться сотрудничество, что ослабит преимущество, которым пользовались крупнейшие компании. “Я думаю, это может стать знаменательным моментом”, - говорит он.
__________

Всё это, конечно, очень хорошо. Но этот результат подрывает классические представления о рациональности. Если рациональность высшее благо - то нафига нужен этот гнусный человек, подверженный действию иррациональности, когда есть великолепные стерильные чистые ИИ-модели?

Переход к не классическим принципам рационального познания, таким образом, становится вопросом выживания человечества.

А, собственно, кто этим вообще занимался? Ну Пуанкаре когда-то говорил о математиках-аналитиках и математиках-геометрах. Но, что называется, это было давно и неправда.

Исследования в данном направлении вели в СССР. Это Побиск Кузнецов, Мераб Мамардашвили и т.д. Кто сейчас занимается развитием этих исследований?

Предыдущие посты о DeepSeek:

https://www.tgoop.com/IngeniumNotes/1675
https://www.tgoop.com/IngeniumNotes/1695
https://www.tgoop.com/IngeniumNotes/1696

www.tgoop.com/IngeniumNotes/1702

230 viewsFeb 4 at 09:43

tgoop.com/IngeniumNotes/1702

Create: 2025-02-04
Last Update: 2025-07-07 21:50:27

BY Заметки инженера - исследователя

Share with your friend now:
tgoop.com/IngeniumNotes/1702

Telegram News

Вновь о DeepSeek.