Notice: file_put_contents(): Write of 93 bytes failed with errno=28 No space left on device in /var/www/tgoop/post.php on line 50

Warning: file_put_contents(): Only 16384 of 16477 bytes written, possibly out of free disk space in /var/www/tgoop/post.php on line 50
PyTorch Howsam@pytorch_howsam P.681
PYTORCH_HOWSAM Telegram 681
قبلا، لرنینگ کرو رو براساس تعداد ایپاک رسم می‌کردیم. مثلا می‌گفتیم، مدل رزنت برای 30 ایپاک روی دیتاست x ترین شده و نمودار لاس به ایپاک رو رسم می‌کردیم. میشه گفت، شبیه این بود که یک فرد بگه من این کتاب رو 30 دور خوندم. نگاه جالبیه...

اما، الان توی بحث LLM-ها که دیتاست‌ها خیلی بزرگه، لرنینگ کرو رو براساس تعداد توکن‌ها رسم میکنن. مثلا، میگیم که مدل Llama روی 50 میلیارد توکن آموزش دیده. حالا ممکنه این 50 میلیارد توکن حتی یک ایپاک از دیتاست هم نباشه! ولی نگاه جالبیه که میگیم این مدل روی n تا توکن (تقریبا کلمه) آموزش دیده.

حالا، با فرض ثابت بودن سخت‌افزار، می‌تونیم لرنینگ کرو رو براساس مدت زمان آموزش رسم کنیم. مثلا بگیم که این مدل 30 ساعت آموزش دیده. نگاه قشنگی هست. انگار که بگیم 30 ساعت درس خوندم. یا مثلا، مدلی که 90 روز درس خونده. :)

توی نمودار بالا، لرنینگ کرو دو اجرا رو براساس تعداد توکن (محور افقی پایین) و مدت زمان (محور افقی بالا) نشون دادم.



tgoop.com/pytorch_howsam/681
Create:
Last Update:

قبلا، لرنینگ کرو رو براساس تعداد ایپاک رسم می‌کردیم. مثلا می‌گفتیم، مدل رزنت برای 30 ایپاک روی دیتاست x ترین شده و نمودار لاس به ایپاک رو رسم می‌کردیم. میشه گفت، شبیه این بود که یک فرد بگه من این کتاب رو 30 دور خوندم. نگاه جالبیه...

اما، الان توی بحث LLM-ها که دیتاست‌ها خیلی بزرگه، لرنینگ کرو رو براساس تعداد توکن‌ها رسم میکنن. مثلا، میگیم که مدل Llama روی 50 میلیارد توکن آموزش دیده. حالا ممکنه این 50 میلیارد توکن حتی یک ایپاک از دیتاست هم نباشه! ولی نگاه جالبیه که میگیم این مدل روی n تا توکن (تقریبا کلمه) آموزش دیده.

حالا، با فرض ثابت بودن سخت‌افزار، می‌تونیم لرنینگ کرو رو براساس مدت زمان آموزش رسم کنیم. مثلا بگیم که این مدل 30 ساعت آموزش دیده. نگاه قشنگی هست. انگار که بگیم 30 ساعت درس خوندم. یا مثلا، مدلی که 90 روز درس خونده. :)

توی نمودار بالا، لرنینگ کرو دو اجرا رو براساس تعداد توکن (محور افقی پایین) و مدت زمان (محور افقی بالا) نشون دادم.

BY PyTorch Howsam




Share with your friend now:
tgoop.com/pytorch_howsam/681

View MORE
Open in Telegram


Telegram News

Date: |

Matt Hussey, editorial director at NEAR Protocol also responded to this news with “#meIRL”. Just as you search “Bear Market Screaming” in Telegram, you will see a Pepe frog yelling as the group’s featured image. Although some crypto traders have moved toward screaming as a coping mechanism, several mental health experts call this therapy a pseudoscience. The crypto community finds its way to engage in one or the other way and share its feelings with other fellow members. The initiatives announced by Perekopsky include monitoring the content in groups. According to the executive, posts identified as lacking context or as containing false information will be flagged as a potential source of disinformation. The content is then forwarded to Telegram's fact-checking channels for analysis and subsequent publication of verified information. Find your optimal posting schedule and stick to it. The peak posting times include 8 am, 6 pm, and 8 pm on social media. Try to publish serious stuff in the morning and leave less demanding content later in the day. More>>
from us


Telegram PyTorch Howsam
FROM American