tgoop.com/IngeniumNotes/1702
Last Update:
Вновь о DeepSeek.
Одно дело - когда сам над чем-то рассуждаешь. Другое дело - когда выводы, полученные тобой исходя из общих соображений, подтверждают профильные специалисты.
Портал MIT Technology Review, статья "Как DeepSeek разнес в пух и прах принципы создания ИИ — и почему все последуют его примеру"
__________
GPT-4o, Gemini 2.0, V3 — теперь достаточно хороши, чтобы с их помощью можно было добиться поведения, похожего на рассуждение.
«R1 показывает, что при наличии достаточно сильной базовой модели, обучения с подкреплением достаточно, чтобы языковая модель рассуждала без какого-либо контроля со стороны человека», — говорит Льюис Танстолл, учёный из Hugging Face.
Другими словами, ведущие американские компании, возможно, уже поняли, как это сделать, но держали это в секрете. «Похоже, что есть умный способ взять базовую модель, предварительно обученную модель, и превратить её в гораздо более способную к рассуждениям модель, — говорит Цайлер. — И до этого момента процедура, необходимая для преобразования предварительно обученной модели в модель для рассуждений, была малоизвестна. Она не была публичной».
Отличие R1 в том, что DeepSeek опубликовал, как они это сделали. “И оказывается, что это не такой уж дорогой процесс”, - говорит Зейлер. “Самое сложное - это получить эту предварительно подготовленную модель”. Как показал Карпати на Microsoft Build в прошлом году, предварительная подготовка модели составляет 99% работы и большую часть затрат.
Если построение логических моделей не так сложно, как люди думали, мы можем ожидать распространения бесплатных моделей, которые гораздо более эффективны, чем мы когда-либо видели. По мнению Фридмана, когда ноу-хау станет достоянием общественности, между небольшими компаниями будет расширяться сотрудничество, что ослабит преимущество, которым пользовались крупнейшие компании. “Я думаю, это может стать знаменательным моментом”, - говорит он.
__________
Всё это, конечно, очень хорошо. Но этот результат подрывает классические представления о рациональности. Если рациональность высшее благо - то нафига нужен этот гнусный человек, подверженный действию иррациональности, когда есть великолепные стерильные чистые ИИ-модели?
Переход к не классическим принципам рационального познания, таким образом, становится вопросом выживания человечества.
А, собственно, кто этим вообще занимался? Ну Пуанкаре когда-то говорил о математиках-аналитиках и математиках-геометрах. Но, что называется, это было давно и неправда.
Исследования в данном направлении вели в СССР. Это Побиск Кузнецов, Мераб Мамардашвили и т.д. Кто сейчас занимается развитием этих исследований?
Предыдущие посты о DeepSeek:
https://www.tgoop.com/IngeniumNotes/1675
https://www.tgoop.com/IngeniumNotes/1695
https://www.tgoop.com/IngeniumNotes/1696
BY Заметки инженера - исследователя
Share with your friend now:
tgoop.com/IngeniumNotes/1702