در این پژوهش نوآورانه، نشون داده شده که مدلهای زبانی بزرگ (LLMs) میتونن استدلالهای پیچیده رو بدون دسترسی به پاسخ درست یاد بگیرن!
❗️ چطور؟ فقط با تکیه بر «حس درونی اطمینان خودشون» یعنی مدل بدون نیاز به پاداش یا دادههای واقعی از بیرون، خودش یاد میگیره که چه استدلالهایی براش قابل اعتمادتر هستن و مسیر یادگیری رو با همون معیار جلو میبره.
در این پژوهش نوآورانه، نشون داده شده که مدلهای زبانی بزرگ (LLMs) میتونن استدلالهای پیچیده رو بدون دسترسی به پاسخ درست یاد بگیرن!
❗️ چطور؟ فقط با تکیه بر «حس درونی اطمینان خودشون» یعنی مدل بدون نیاز به پاداش یا دادههای واقعی از بیرون، خودش یاد میگیره که چه استدلالهایی براش قابل اعتمادتر هستن و مسیر یادگیری رو با همون معیار جلو میبره.
1What is Telegram Channels? “[The defendant] could not shift his criminal liability,” Hui said. In handing down the sentence yesterday, deputy judge Peter Hui Shiu-keung of the district court said that even if Ng did not post the messages, he cannot shirk responsibility as the owner and administrator of such a big group for allowing these messages that incite illegal behaviors to exist. Co-founder of NFT renting protocol Rentable World emiliano.eth shared the group Tuesday morning on Twitter, calling out the "degenerate" community, or crypto obsessives that engage in high-risk trading. A few years ago, you had to use a special bot to run a poll on Telegram. Now you can easily do that yourself in two clicks. Hit the Menu icon and select “Create Poll.” Write your question and add up to 10 options. Running polls is a powerful strategy for getting feedback from your audience. If you’re considering the possibility of modifying your channel in any way, be sure to ask your subscribers’ opinions first.
from us