INGENIUMNOTES Telegram 1702
Вновь о DeepSeek.

Одно дело - когда сам над чем-то рассуждаешь. Другое дело - когда выводы, полученные тобой исходя из общих соображений, подтверждают профильные специалисты.

Портал MIT Technology Review, статья "Как DeepSeek разнес в пух и прах принципы создания ИИ — и почему все последуют его примеру"

__________
GPT-4o, Gemini 2.0, V3 — теперь достаточно хороши, чтобы с их помощью можно было добиться поведения, похожего на рассуждение.

«R1 показывает, что при наличии достаточно сильной базовой модели, обучения с подкреплением достаточно, чтобы языковая модель рассуждала без какого-либо контроля со стороны человека», — говорит Льюис Танстолл, учёный из Hugging Face.

Другими словами, ведущие американские компании, возможно, уже поняли, как это сделать, но держали это в секрете. «Похоже, что есть умный способ взять базовую модель, предварительно обученную модель, и превратить её в гораздо более способную к рассуждениям модель, — говорит Цайлер. — И до этого момента процедура, необходимая для преобразования предварительно обученной модели в модель для рассуждений, была малоизвестна. Она не была публичной».

Отличие R1 в том, что DeepSeek опубликовал, как они это сделали. “И оказывается, что это не такой уж дорогой процесс”, - говорит Зейлер. “Самое сложное - это получить эту предварительно подготовленную модель”. Как показал Карпати на Microsoft Build в прошлом году, предварительная подготовка модели составляет 99% работы и большую часть затрат.

Если построение логических моделей не так сложно, как люди думали, мы можем ожидать распространения бесплатных моделей, которые гораздо более эффективны, чем мы когда-либо видели. По мнению Фридмана, когда ноу-хау станет достоянием общественности, между небольшими компаниями будет расширяться сотрудничество, что ослабит преимущество, которым пользовались крупнейшие компании. “Я думаю, это может стать знаменательным моментом”, - говорит он. 
__________

Всё это, конечно, очень хорошо. Но этот результат подрывает классические представления о рациональности. Если рациональность высшее благо - то нафига нужен этот гнусный человек, подверженный действию иррациональности, когда есть великолепные стерильные чистые ИИ-модели?

Переход к не классическим принципам рационального познания, таким образом, становится вопросом выживания человечества.

А, собственно, кто этим вообще занимался? Ну Пуанкаре когда-то говорил о математиках-аналитиках и математиках-геометрах. Но, что называется, это было давно и неправда.

Исследования в данном направлении вели в СССР. Это Побиск Кузнецов, Мераб Мамардашвили и т.д. Кто сейчас занимается развитием этих исследований?

Предыдущие посты о DeepSeek:

https://www.tgoop.com/IngeniumNotes/1675
https://www.tgoop.com/IngeniumNotes/1695
https://www.tgoop.com/IngeniumNotes/1696



tgoop.com/IngeniumNotes/1702
Create:
Last Update:

Вновь о DeepSeek.

Одно дело - когда сам над чем-то рассуждаешь. Другое дело - когда выводы, полученные тобой исходя из общих соображений, подтверждают профильные специалисты.

Портал MIT Technology Review, статья "Как DeepSeek разнес в пух и прах принципы создания ИИ — и почему все последуют его примеру"

__________
GPT-4o, Gemini 2.0, V3 — теперь достаточно хороши, чтобы с их помощью можно было добиться поведения, похожего на рассуждение.

«R1 показывает, что при наличии достаточно сильной базовой модели, обучения с подкреплением достаточно, чтобы языковая модель рассуждала без какого-либо контроля со стороны человека», — говорит Льюис Танстолл, учёный из Hugging Face.

Другими словами, ведущие американские компании, возможно, уже поняли, как это сделать, но держали это в секрете. «Похоже, что есть умный способ взять базовую модель, предварительно обученную модель, и превратить её в гораздо более способную к рассуждениям модель, — говорит Цайлер. — И до этого момента процедура, необходимая для преобразования предварительно обученной модели в модель для рассуждений, была малоизвестна. Она не была публичной».

Отличие R1 в том, что DeepSeek опубликовал, как они это сделали. “И оказывается, что это не такой уж дорогой процесс”, - говорит Зейлер. “Самое сложное - это получить эту предварительно подготовленную модель”. Как показал Карпати на Microsoft Build в прошлом году, предварительная подготовка модели составляет 99% работы и большую часть затрат.

Если построение логических моделей не так сложно, как люди думали, мы можем ожидать распространения бесплатных моделей, которые гораздо более эффективны, чем мы когда-либо видели. По мнению Фридмана, когда ноу-хау станет достоянием общественности, между небольшими компаниями будет расширяться сотрудничество, что ослабит преимущество, которым пользовались крупнейшие компании. “Я думаю, это может стать знаменательным моментом”, - говорит он. 
__________

Всё это, конечно, очень хорошо. Но этот результат подрывает классические представления о рациональности. Если рациональность высшее благо - то нафига нужен этот гнусный человек, подверженный действию иррациональности, когда есть великолепные стерильные чистые ИИ-модели?

Переход к не классическим принципам рационального познания, таким образом, становится вопросом выживания человечества.

А, собственно, кто этим вообще занимался? Ну Пуанкаре когда-то говорил о математиках-аналитиках и математиках-геометрах. Но, что называется, это было давно и неправда.

Исследования в данном направлении вели в СССР. Это Побиск Кузнецов, Мераб Мамардашвили и т.д. Кто сейчас занимается развитием этих исследований?

Предыдущие посты о DeepSeek:

https://www.tgoop.com/IngeniumNotes/1675
https://www.tgoop.com/IngeniumNotes/1695
https://www.tgoop.com/IngeniumNotes/1696

BY Заметки инженера - исследователя


Share with your friend now:
tgoop.com/IngeniumNotes/1702

View MORE
Open in Telegram


Telegram News

Date: |

Write your hashtags in the language of your target audience. The public channel had more than 109,000 subscribers, Judge Hui said. Ng had the power to remove or amend the messages in the channel, but he “allowed them to exist.” How to Create a Private or Public Channel on Telegram? Just at this time, Bitcoin and the broader crypto market have dropped to new 2022 lows. The Bitcoin price has tanked 10 percent dropping to $20,000. On the other hand, the altcoin space is witnessing even more brutal correction. Bitcoin has dropped nearly 60 percent year-to-date and more than 70 percent since its all-time high in November 2021. During the meeting with TSE Minister Edson Fachin, Perekopsky also mentioned the TSE channel on the platform as one of the firm's key success stories. Launched as part of the company's commitments to tackle the spread of fake news in Brazil, the verified channel has attracted more than 184,000 members in less than a month.
from us


Telegram Заметки инженера - исследователя
FROM American