این مقاله نشون میده که عملکرد مدلهای زبانی بزرگ، در مکالمات چند مرحلهای به طور قابل توجهی کاهش پیدا میکنه. بیشتر معیارهای ارزیابی بر روی تنظیمات دستورالعملهای کاملا مشخص و تک مرحلهای تمرکز دارن.
این تحقیق نشون میده که LLM ها اغلب در مراحل اولیه، فرضیات نادرستی میسازن و در ادامهی گفتگو به همان فرضیات تکیه میکنن و هرگز اونها رو اصلاح نمیکنن.
نتیجه اینه که اگه یه مکالمه ی چند مرحلهای به نتایج مطلوب نرسید، بهتره که گفتگو رو از نو و به صورت یک گفتگوی تازه آغاز کنیم و تمام اطلاعات مربوط به مکالمهی قبلی را در همان نوبت اول گفتگو جدید بگنجونید. همونطور که در شکل بالا میبینید این مساله مخصوصا در کاربرد هایی مثل مشاوره، برنامهنویسی، یا پرسشهای تحلیلی پیچیده اهمیت زیادی داره
https://arxiv.org/abs/2505.06120
این تحقیق نشون میده که LLM ها اغلب در مراحل اولیه، فرضیات نادرستی میسازن و در ادامهی گفتگو به همان فرضیات تکیه میکنن و هرگز اونها رو اصلاح نمیکنن.
نتیجه اینه که اگه یه مکالمه ی چند مرحلهای به نتایج مطلوب نرسید، بهتره که گفتگو رو از نو و به صورت یک گفتگوی تازه آغاز کنیم و تمام اطلاعات مربوط به مکالمهی قبلی را در همان نوبت اول گفتگو جدید بگنجونید. همونطور که در شکل بالا میبینید این مساله مخصوصا در کاربرد هایی مثل مشاوره، برنامهنویسی، یا پرسشهای تحلیلی پیچیده اهمیت زیادی داره
https://arxiv.org/abs/2505.06120
Tensorflow(@CVision)
دیپ مایند از «AlphaEvolve» که یه عامل برنامه نویسی مبتنی بر Gemini برای کشف الگوریتم ها هست رونمایی کرد. میگه ما از AlphaEvolve برای حل بیش از ۵۰ مسئله باز در زمینههای تحلیل، هندسه، ترکیبیات و نظریه اعداد استفاده کردیم. در ۷۵٪ از موارد، این سیستم تونست…
#تکملیی
الگوریتم AlphaEvolve تونست الگوریتم معروف استراسن که در سال ۱۹۶۹ معرفی شده بود رو بهبود بده، بطوریکه موفق شد ضرب ماتریسهای ۴×۴ با مقادیر مختلط رو تنها با استفاده از ۴۸ ضرب عددی (اسکالر) انجام بده، در حالی که رکورد قبلی ۴۹ ضرب بود. شاید در نگاه اول این تفاوت یک عددی چشمگیر به نظر نرسه، اما این رکورد برای پنجاه و شش سال شکسته نشده بود.
برای درک بهتر اهمیت چند نکته رو باید گفت:
ضرب ماتریسی یکی از بنیادی ترین عملیات در علوم کامپیوتره، از رندر گرافیکی گرفته تا شبکههای عصبی و شبیهسازیهای علمی.
دستاورد استراسن در سال ۱۹۶۹ بهقدری مهم بود که دهه ها در کلاسهای الگوریتم دانشگاهی تدریس میشد.
در طول بیش از نیم قرن، ریاضیدانان و دانشمندان کامپیوتر برجستهای روی این مسئله کار کرده بودن و موفق به بهبود اون نشده بودن.
این دستاورد شبیه به شکستن یک رکورد جهانیه که از زمان فرود انسان روی ماه باقی مانده بود.
نکته عجیب تر اینه که AlphaEvolve حتی برای این کار طراحی نشده بود. سیستم قبلی یعنی AlphaTensor که مشخصا برای بهینه سازی ضرب ماتریس طراحی شده بود، نتونسته بود الگوریتم استراسن برای ماتریسهای مختلط رو شکست بده، اما این سیستم عمومی جدید، بدون تمرکز خاص، براحتی مسئلهای رو حل کرده که نسلها برای انسان ها حلناشدنی بوده.
پیامدهای این دستاورد عظیمه، اینجا در مورد بهبود سرعت در کل حوزه محاسبات صحبت میکنیم. با توجه به تعداد بی شمار ضرب ماتریسی که هر ثانیه در رایانههای سراسر جهان انجام میشه، حتی بهبود کوچکی مانند این، میتونه به صرفهجویی عظیم در منابع، زمان و انرژی منجر شه!
فراتر از مزایای عملی، این دستاورد نشون دهنده لحظهای واقعیه که هوش مصنوعی تونسته دانش بشر رو در یک حوزه بنیادین ریاضی پیش ببره. این سیستم صرفا یک ترفند پیادهسازی یا بهینه سازی پیدا نکرده، بلکه یک الگوریتم اثبات شده و بهتر کشف کرده که انسانها بیش از نیم قرن نتونسته بودن به اون برسن.
در این ویدیو موارد جالبی در این خصوص بحث میشه، که بخشی از اون اینجا عنوان شد
https://youtu.be/vC9nAosXrJw?feature=shared
الگوریتم AlphaEvolve تونست الگوریتم معروف استراسن که در سال ۱۹۶۹ معرفی شده بود رو بهبود بده، بطوریکه موفق شد ضرب ماتریسهای ۴×۴ با مقادیر مختلط رو تنها با استفاده از ۴۸ ضرب عددی (اسکالر) انجام بده، در حالی که رکورد قبلی ۴۹ ضرب بود. شاید در نگاه اول این تفاوت یک عددی چشمگیر به نظر نرسه، اما این رکورد برای پنجاه و شش سال شکسته نشده بود.
برای درک بهتر اهمیت چند نکته رو باید گفت:
ضرب ماتریسی یکی از بنیادی ترین عملیات در علوم کامپیوتره، از رندر گرافیکی گرفته تا شبکههای عصبی و شبیهسازیهای علمی.
دستاورد استراسن در سال ۱۹۶۹ بهقدری مهم بود که دهه ها در کلاسهای الگوریتم دانشگاهی تدریس میشد.
در طول بیش از نیم قرن، ریاضیدانان و دانشمندان کامپیوتر برجستهای روی این مسئله کار کرده بودن و موفق به بهبود اون نشده بودن.
این دستاورد شبیه به شکستن یک رکورد جهانیه که از زمان فرود انسان روی ماه باقی مانده بود.
نکته عجیب تر اینه که AlphaEvolve حتی برای این کار طراحی نشده بود. سیستم قبلی یعنی AlphaTensor که مشخصا برای بهینه سازی ضرب ماتریس طراحی شده بود، نتونسته بود الگوریتم استراسن برای ماتریسهای مختلط رو شکست بده، اما این سیستم عمومی جدید، بدون تمرکز خاص، براحتی مسئلهای رو حل کرده که نسلها برای انسان ها حلناشدنی بوده.
پیامدهای این دستاورد عظیمه، اینجا در مورد بهبود سرعت در کل حوزه محاسبات صحبت میکنیم. با توجه به تعداد بی شمار ضرب ماتریسی که هر ثانیه در رایانههای سراسر جهان انجام میشه، حتی بهبود کوچکی مانند این، میتونه به صرفهجویی عظیم در منابع، زمان و انرژی منجر شه!
فراتر از مزایای عملی، این دستاورد نشون دهنده لحظهای واقعیه که هوش مصنوعی تونسته دانش بشر رو در یک حوزه بنیادین ریاضی پیش ببره. این سیستم صرفا یک ترفند پیادهسازی یا بهینه سازی پیدا نکرده، بلکه یک الگوریتم اثبات شده و بهتر کشف کرده که انسانها بیش از نیم قرن نتونسته بودن به اون برسن.
در این ویدیو موارد جالبی در این خصوص بحث میشه، که بخشی از اون اینجا عنوان شد
https://youtu.be/vC9nAosXrJw?feature=shared
YouTube
Wild breakthrough on Math after 56 years... [Exclusive]
Today Google DeepMind released AlphaEvolve: a Gemini coding agent for algorithm discovery. It beat the famous Strassen algorithm for matrix multiplication set 56 years ago. Google has been killing it recently. We had early access to the paper and interviewed…
Tensorflow(@CVision)
دیپ مایند از «AlphaEvolve» که یه عامل برنامه نویسی مبتنی بر Gemini برای کشف الگوریتم ها هست رونمایی کرد. میگه ما از AlphaEvolve برای حل بیش از ۵۰ مسئله باز در زمینههای تحلیل، هندسه، ترکیبیات و نظریه اعداد استفاده کردیم. در ۷۵٪ از موارد، این سیستم تونست…
آموزش مدل های هوش مصنوعی اغلب شامل پیمایش فضاهای پارامتری با ابعاد بسیار بالا برای یافتن هایپر پارامترهای بهینه، معماریهای مناسب شبکه عصبی و برنامه های آموزش مناسبه.
https://youtu.be/NrO20Jb-hy0?feature=shared
توانایی AlphaEvolve در اکستریم سازی (یافتن نقاط بیشینه یا کمینه) توابع در چنین فضاهایی میتونه برای خودکارسازی و بهبود این وظایف بهینهسازی بکار گرفته شه، که در نتیجه به همگرایی سریع تر و مدلهایی با عملکرد بهتر منجر خواهد شد.
ترنس تائو، ریاضیدان برجسته و برنده مدال فیلدز، اخیرا اعلام کرده که با تیم DeepMind در حال همکاری بر روی توسعه ابزاری نوین برای بهینه سازی توابع در فضاهای پارامتری با ابعاد بالاست.
این ابزار قادره توابعی مانند F(x) رو که در فضای پارامترهای با ابعاد بالا تعریف شدن رو بیشینه یا کمینه کنه، حتی زمانی که ساختارهای پنهان و پیچیدهای دارن که الگوریتمهای سنتی قادر به درک اونها نیستن.
تائو در پاسخ به این پرسش که آیا این ابزار میتونه جایگزینی برای بهینهسازهای سنتی مانند گرادیان نزولی (SGD) در آموزش شبکههای عصبی بزرگ باشه، اظهار داره که این امر کاملا محتمله، بهویژه در وظایف با مقیاس بزرگ که نظارت انسانی کافی برای تنظیم دستی هایپر پارامترها وجود نداره و پیشنهاد میده که این ابزار میتوانه بهعنوان یک لایه meta-optimizer بر روی ابزارهای موجود عمل کنه، بهطوری که تصمیم بگیره کدام ترکیب از این ابزارها استفاده شه و چه مقادیری از هایپر پارامترها به اونها اختصاص داده شه.
https://mathstodon.xyz/@tao/114508029896631083
https://youtu.be/NrO20Jb-hy0?feature=shared
توانایی AlphaEvolve در اکستریم سازی (یافتن نقاط بیشینه یا کمینه) توابع در چنین فضاهایی میتونه برای خودکارسازی و بهبود این وظایف بهینهسازی بکار گرفته شه، که در نتیجه به همگرایی سریع تر و مدلهایی با عملکرد بهتر منجر خواهد شد.
ترنس تائو، ریاضیدان برجسته و برنده مدال فیلدز، اخیرا اعلام کرده که با تیم DeepMind در حال همکاری بر روی توسعه ابزاری نوین برای بهینه سازی توابع در فضاهای پارامتری با ابعاد بالاست.
این ابزار قادره توابعی مانند F(x) رو که در فضای پارامترهای با ابعاد بالا تعریف شدن رو بیشینه یا کمینه کنه، حتی زمانی که ساختارهای پنهان و پیچیدهای دارن که الگوریتمهای سنتی قادر به درک اونها نیستن.
تائو در پاسخ به این پرسش که آیا این ابزار میتونه جایگزینی برای بهینهسازهای سنتی مانند گرادیان نزولی (SGD) در آموزش شبکههای عصبی بزرگ باشه، اظهار داره که این امر کاملا محتمله، بهویژه در وظایف با مقیاس بزرگ که نظارت انسانی کافی برای تنظیم دستی هایپر پارامترها وجود نداره و پیشنهاد میده که این ابزار میتوانه بهعنوان یک لایه meta-optimizer بر روی ابزارهای موجود عمل کنه، بهطوری که تصمیم بگیره کدام ترکیب از این ابزارها استفاده شه و چه مقادیری از هایپر پارامترها به اونها اختصاص داده شه.
https://mathstodon.xyz/@tao/114508029896631083
YouTube
How AI Models Learn, Explained Visually [Gradient Descent]
Take your personal data back with Incogni! Use code WELCHLABS and get 60% off an annual plan: http://incogni.com/welchlabs
Loss Landscape Posters! 21:23
https://www.welchlabs.com/resources/loss-landscape-poster-17x19
https://www.welchlabs.com/resources/loss…
Loss Landscape Posters! 21:23
https://www.welchlabs.com/resources/loss-landscape-poster-17x19
https://www.welchlabs.com/resources/loss…
Media is too big
VIEW IN TELEGRAM
چین با راه اندازی بزرگ ترین ناوگان کامیون های معدنی برقی و بدون راننده در جهان، گام بزرگی در مسیر توسعه هوش مصنوعی صنعتی برداشته. این ناوگان که توسط گروه دولتی Huaneng در معدن زغالسنگ Yimin مستقر شده، از فناوری خودران شرکت Huawei بهره میبره
100 کامیون هوشمند این پروژه، بدون نیاز به راننده و در شرایط سخت محیطی، بهطور کاملا خودکار بارگیری، حمل و تخلیه مواد رو انجام میدن.
این پروژه بخشی از استراتژی ملی چین برای دیجیتال سازی صنایع سنتی مانند صنایع معدنیه و انتظار میره بهرهوری حمل و نقل رو بطور چشمگیری افزایش و هزینههای عملیاتی رو کاهش بده. هدف گذاری شده که تا سه سال آینده، تعداد این کامیونها در این معدن به ۳۰۰ دستگاه برسه و در سطح کشور به ۱۰ هزار دستگاه خودران تا سال ۲۰۲۶ افزایش پیدا کنه.
https://www.scmp.com/tech/big-tech/article/3310470/china-deploys-worlds-largest-fleet-driverless-mining-trucks-powered-huawei-tech
100 کامیون هوشمند این پروژه، بدون نیاز به راننده و در شرایط سخت محیطی، بهطور کاملا خودکار بارگیری، حمل و تخلیه مواد رو انجام میدن.
این پروژه بخشی از استراتژی ملی چین برای دیجیتال سازی صنایع سنتی مانند صنایع معدنیه و انتظار میره بهرهوری حمل و نقل رو بطور چشمگیری افزایش و هزینههای عملیاتی رو کاهش بده. هدف گذاری شده که تا سه سال آینده، تعداد این کامیونها در این معدن به ۳۰۰ دستگاه برسه و در سطح کشور به ۱۰ هزار دستگاه خودران تا سال ۲۰۲۶ افزایش پیدا کنه.
https://www.scmp.com/tech/big-tech/article/3310470/china-deploys-worlds-largest-fleet-driverless-mining-trucks-powered-huawei-tech
اینتل در Computex 2025 رسما از کارتهای گرافیک حرفهای سری جدید خود با معماری Battlemage (Xe2) رونمایی کرد:
Arc Pro B60
با ۲۴ گیگابایت حافظه GDDR6 و رابط ۱۹۲ بیتی، تنها با قیمت ۵۰۰ دلار معرفی شده، یه گزینه بسیار مقرون بصرفه برای ایستگاه های کاری در حوزه هوش مصنوعی.
مدل پایینتر یعنی Arc Pro B50 دارای ۱۶ گیگابایت حافظه هست و هنوز قیمت دقیقی نداره، اما انتظار میره با قیمت کمتر از B60 عرضه شه.
همچنین نسخه دوگانه B60 با دو GPU و مجموع ۴۸ گیگ رم برای پردازش های سنگین هوش مصنوعی طراحی شده. این نسخه احتمالاً با قیمتی زیر ۱۰۰۰ دلار وارد بازار خواهد شد.
در شرایطی که NVIDIA و AMD همچنان تمرکز بر بازارهای حرفهای دارن، اینتل با این قیمت گذاری تهاجمی و حافظه های بالا، تلاش میکنه جایگاه جدی تری در بازار GPU های workstation و AI پیدا کنه.
https://youtu.be/Y8MWbPBP9i0?si=wuq5iRl9zWFF0Ret
Arc Pro B60
با ۲۴ گیگابایت حافظه GDDR6 و رابط ۱۹۲ بیتی، تنها با قیمت ۵۰۰ دلار معرفی شده، یه گزینه بسیار مقرون بصرفه برای ایستگاه های کاری در حوزه هوش مصنوعی.
مدل پایینتر یعنی Arc Pro B50 دارای ۱۶ گیگابایت حافظه هست و هنوز قیمت دقیقی نداره، اما انتظار میره با قیمت کمتر از B60 عرضه شه.
همچنین نسخه دوگانه B60 با دو GPU و مجموع ۴۸ گیگ رم برای پردازش های سنگین هوش مصنوعی طراحی شده. این نسخه احتمالاً با قیمتی زیر ۱۰۰۰ دلار وارد بازار خواهد شد.
در شرایطی که NVIDIA و AMD همچنان تمرکز بر بازارهای حرفهای دارن، اینتل با این قیمت گذاری تهاجمی و حافظه های بالا، تلاش میکنه جایگاه جدی تری در بازار GPU های workstation و AI پیدا کنه.
https://youtu.be/Y8MWbPBP9i0?si=wuq5iRl9zWFF0Ret
YouTube
Intel Arc B60 DUAL-GPU 48GB Video Card Tear-Down | MAXSUN Arc Pro B60 Dual
Sponsor: Hyte Y70 and Touch Infinite on their site https://geni.us/Ir9vKEK
This is a dual-GPU video card with 2x Intel Arc GPUs on one PCB. Intel has new Arc GPUs in the Battlemage family that are using existing BMG silicon, but with more memory and some…
This is a dual-GPU video card with 2x Intel Arc GPUs on one PCB. Intel has new Arc GPUs in the Battlemage family that are using existing BMG silicon, but with more memory and some…
Forwarded from آکادمی Med-AI
در آکادمی Med-AI شبکه نخبگان ایران با ما همراه باشید
Please open Telegram to view this post
VIEW IN TELEGRAM
گوگل به تازگی مدلهای جدید Gemma 3n رو در HuggingFace منتشر کرده.
مدلهای Gemma 3n برای اجرای بهینه روی دستگاههایی با منابع محدود مثل تلفن همراه به صورت محلی طراحی شدن. این مدل ها توانایی دریافت ورودی های چندرسانهای رو دارن به این معنی که میتونن متن، تصویر، ویدیو و صدا رو پردازش و خروجی متنی تولید کنن. این مدلها با داده های ۱۴۰ زبان آموزش دیدن.
مدلهای Gemma 3n از فناوری "فعال سازی انتخابی پارامترها" استفاده میکنن تا نیاز به منابع رو کاهش بدن. این تکنیک باعث میشه مدل فقط بخش هایی از پارامترهاش رو هنگام انجام یک وظیفه فعال کنه. در نتیجه مصرف حافظه کاهش پیدا میکنه، بدون افت قابل توجه در عملکرد.
https://huggingface.co/collections/google/gemma-3n-preview-682ca41097a31e5ac804d57b
مدلهای Gemma 3n برای اجرای بهینه روی دستگاههایی با منابع محدود مثل تلفن همراه به صورت محلی طراحی شدن. این مدل ها توانایی دریافت ورودی های چندرسانهای رو دارن به این معنی که میتونن متن، تصویر، ویدیو و صدا رو پردازش و خروجی متنی تولید کنن. این مدلها با داده های ۱۴۰ زبان آموزش دیدن.
مدلهای Gemma 3n از فناوری "فعال سازی انتخابی پارامترها" استفاده میکنن تا نیاز به منابع رو کاهش بدن. این تکنیک باعث میشه مدل فقط بخش هایی از پارامترهاش رو هنگام انجام یک وظیفه فعال کنه. در نتیجه مصرف حافظه کاهش پیدا میکنه، بدون افت قابل توجه در عملکرد.
https://huggingface.co/collections/google/gemma-3n-preview-682ca41097a31e5ac804d57b
Tensorflow(@CVision)
🔥🔥🔥Google I/O 2025 - (Live) https://www.youtube.com/live/o8NiE3XMPrM?si=acuYsEKky78LIO5b
گوگل I/O ۲۰۲۵ تا اینجا:
حالت «AI Mode» در جستجوی گوگل به صورت جهانی در حال گسترشه و ویژگی های هوش مصنوعی بیشتری رو اضافه میکنه
Google Beam
نام جدید پروژه «Starline» هست که کیفیت جلسات مجازی رو بهتر میکنه.
عینکهای هوشمند واقعیت ترکیبی (XR) اندروید در راه هستن، با همکاری برندهایی مثل Warby Parker و Gentle Monster.
قابلیت Gemini به مرورگر Google Chrome اضافه شده!
پاسخ های هوشمند جیمیل از هوش مصنوعی استفاده میکنن تا با توجه به محتوای ایمیلها و Google Drive، پیشنهاد بدن.
Google Meet
امکان ترجمه زنده صحبتها رو با حفظ صدای گوینده از طریق هوش مصنوعی فراهم کرده !
Imagen 4
کیفیت تصاویر تولیدشده با هوش مصنوعی رو با جزئیات ارتقا داده.
Veo 3
کیفیت تولید ویدیو با هوش مصنوعی رو بالا برده و صداگذاری و دیالوگ رو اضافه کرده!
Flow
ابزار جدید ویرایش ویدیو با هوش مصنوعیه که با Veo 3 و Imagen 4 هماهنگ میشه.
حالت «Agent Mode» در اپلیکیشن Gemini به هوش مصنوعی اجازه میده کارها رو به صورت خودکار انجام بده
حالت «AI Mode» در جستجوی گوگل به صورت جهانی در حال گسترشه و ویژگی های هوش مصنوعی بیشتری رو اضافه میکنه
Google Beam
نام جدید پروژه «Starline» هست که کیفیت جلسات مجازی رو بهتر میکنه.
عینکهای هوشمند واقعیت ترکیبی (XR) اندروید در راه هستن، با همکاری برندهایی مثل Warby Parker و Gentle Monster.
قابلیت Gemini به مرورگر Google Chrome اضافه شده!
پاسخ های هوشمند جیمیل از هوش مصنوعی استفاده میکنن تا با توجه به محتوای ایمیلها و Google Drive، پیشنهاد بدن.
Google Meet
امکان ترجمه زنده صحبتها رو با حفظ صدای گوینده از طریق هوش مصنوعی فراهم کرده !
Imagen 4
کیفیت تصاویر تولیدشده با هوش مصنوعی رو با جزئیات ارتقا داده.
Veo 3
کیفیت تولید ویدیو با هوش مصنوعی رو بالا برده و صداگذاری و دیالوگ رو اضافه کرده!
Flow
ابزار جدید ویرایش ویدیو با هوش مصنوعیه که با Veo 3 و Imagen 4 هماهنگ میشه.
حالت «Agent Mode» در اپلیکیشن Gemini به هوش مصنوعی اجازه میده کارها رو به صورت خودکار انجام بده
Tensorflow(@CVision)
گوگل I/O ۲۰۲۵ تا اینجا: حالت «AI Mode» در جستجوی گوگل به صورت جهانی در حال گسترشه و ویژگی های هوش مصنوعی بیشتری رو اضافه میکنه Google Beam نام جدید پروژه «Starline» هست که کیفیت جلسات مجازی رو بهتر میکنه. عینکهای هوشمند واقعیت ترکیبی (XR) اندروید…
نسخه جدید Gemini 2.5 Pro توانایی های بهتری در استدلال، برنامهنویسی و کار با ورودی های چند رسانهای پیدا کرده.
Tensorflow(@CVision)
نسخه جدید Gemini 2.5 Pro توانایی های بهتری در استدلال، برنامهنویسی و کار با ورودی های چند رسانهای پیدا کرده.
طرح «AI Ultra» گوگل با پرداخت ماهیانه ۲۴۹.۹۹ دلار، دسترسی به نسخههای پیشرفته هوش مصنوعی رو فراهم میکنه.
ابزار کدنویسی جدید گوگل به نام «Stitch» به توسعه
دهندگان در طراحی سریع رابط کاربری کمک میکنه
Gemini Live
امکان اشتراک گذاری زنده دوربین با هوش مصنوعی رو به جستجوی گوگل و اپلیکیشن Gemini اضافه کرده
ابزار کدنویسی جدید گوگل به نام «Stitch» به توسعه
دهندگان در طراحی سریع رابط کاربری کمک میکنه
Gemini Live
امکان اشتراک گذاری زنده دوربین با هوش مصنوعی رو به جستجوی گوگل و اپلیکیشن Gemini اضافه کرده
Tensorflow(@CVision)
طرح «AI Ultra» گوگل با پرداخت ماهیانه ۲۴۹.۹۹ دلار، دسترسی به نسخههای پیشرفته هوش مصنوعی رو فراهم میکنه. ابزار کدنویسی جدید گوگل به نام «Stitch» به توسعه دهندگان در طراحی سریع رابط کاربری کمک میکنه Gemini Live امکان اشتراک گذاری زنده دوربین با هوش…
همچنین گوگل مدل Gemini Diffusion رو معرفی کرد که یه مدل زبانی غیرترتیبی هست و با استفاده از روش Diffusion بلوک های متنی رو بصورت هم زمان تولید می کنه
https://deepmind.google/models/gemini-diffusion/
https://deepmind.google/models/gemini-diffusion/
Google DeepMind
Gemini Diffusion
Gemini Diffusion is our state-of-the-art research model exploring what diffusion means for language – and text generation.
Tensorflow(@CVision)
گوگل I/O ۲۰۲۵ تا اینجا: حالت «AI Mode» در جستجوی گوگل به صورت جهانی در حال گسترشه و ویژگی های هوش مصنوعی بیشتری رو اضافه میکنه Google Beam نام جدید پروژه «Starline» هست که کیفیت جلسات مجازی رو بهتر میکنه. عینکهای هوشمند واقعیت ترکیبی (XR) اندروید…
This media is not supported in your browser
VIEW IN TELEGRAM
قابلیت ترجمه زنده در Google Meet
Tensorflow(@CVision)
گوگل I/O ۲۰۲۵ تا اینجا: حالت «AI Mode» در جستجوی گوگل به صورت جهانی در حال گسترشه و ویژگی های هوش مصنوعی بیشتری رو اضافه میکنه Google Beam نام جدید پروژه «Starline» هست که کیفیت جلسات مجازی رو بهتر میکنه. عینکهای هوشمند واقعیت ترکیبی (XR) اندروید…
This media is not supported in your browser
VIEW IN TELEGRAM
Veo 3🔥
Tensorflow(@CVision)
گوگل I/O ۲۰۲۵ تا اینجا: حالت «AI Mode» در جستجوی گوگل به صورت جهانی در حال گسترشه و ویژگی های هوش مصنوعی بیشتری رو اضافه میکنه Google Beam نام جدید پروژه «Starline» هست که کیفیت جلسات مجازی رو بهتر میکنه. عینکهای هوشمند واقعیت ترکیبی (XR) اندروید…
This media is not supported in your browser
VIEW IN TELEGRAM
نمای کلی ویدیویی بزودی به NotebookLM اضافه میشه. فعلا فقط برای زبان انگلیسی در دسترس خواهد بود، اما بزودی میتونید خلاصه های ویدیویی کوتاه از منابع خود مانند فایلهای PDF، عکسها و سایر محتواها بسازین.
Tensorflow(@CVision)
گوگل I/O ۲۰۲۵ تا اینجا: حالت «AI Mode» در جستجوی گوگل به صورت جهانی در حال گسترشه و ویژگی های هوش مصنوعی بیشتری رو اضافه میکنه Google Beam نام جدید پروژه «Starline» هست که کیفیت جلسات مجازی رو بهتر میکنه. عینکهای هوشمند واقعیت ترکیبی (XR) اندروید…
Media is too big
VIEW IN TELEGRAM
فناوریای که پشت دوربین و اشتراک گذاری صفحه در Gemini Live قرار داره، حالا با ویژگیهای هوشمندانه تری معرفی شده .
این فناوری تحت عنوان Project Astra در قالب یک اپلیکیشن اندروید برای برخی کاربران در دسترس قرار گرفته.
نکته جالب اینکه Astra حالا تواناییهایی عاملی (agentic) داره، یعنی میتونه به صورت هوشمند برخی بخشهای گوشی اندرویدی شما رو کنترل کنه
این فناوری تحت عنوان Project Astra در قالب یک اپلیکیشن اندروید برای برخی کاربران در دسترس قرار گرفته.
نکته جالب اینکه Astra حالا تواناییهایی عاملی (agentic) داره، یعنی میتونه به صورت هوشمند برخی بخشهای گوشی اندرویدی شما رو کنترل کنه
Tensorflow(@CVision)
گوگل به تازگی مدلهای جدید Gemma 3n رو در HuggingFace منتشر کرده. مدلهای Gemma 3n برای اجرای بهینه روی دستگاههایی با منابع محدود مثل تلفن همراه به صورت محلی طراحی شدن. این مدل ها توانایی دریافت ورودی های چندرسانهای رو دارن به این معنی که میتونن متن،…
راهنمای نصب Gemma 3n برای کاربران اندروید:
فایل APK اپلیکیشن Edge Gallery رو از گیتهاب دانلود کنید:
https://github.com/google-ai-edge/gallery/releases/tag/1.0.0
یکی از فایلهای .task رو از سایت Hugging Face دانلود کنید:
https://huggingface.co/collections/google/gemma-3n-preview-682ca41097a31e5ac804d57b
فایل .task رو با زدن دکمه + در پایین سمت راست، داخل اپلیکیشن Edge Gallery وارد کنید.
همچنین میتونید مستقیما از داخل برنامه عکس بگیرید و با مدل گفتگو کنید
فایل APK اپلیکیشن Edge Gallery رو از گیتهاب دانلود کنید:
https://github.com/google-ai-edge/gallery/releases/tag/1.0.0
یکی از فایلهای .task رو از سایت Hugging Face دانلود کنید:
https://huggingface.co/collections/google/gemma-3n-preview-682ca41097a31e5ac804d57b
فایل .task رو با زدن دکمه + در پایین سمت راست، داخل اپلیکیشن Edge Gallery وارد کنید.
همچنین میتونید مستقیما از داخل برنامه عکس بگیرید و با مدل گفتگو کنید
GitHub
Release 1.0.0 · google-ai-edge/gallery
A gallery that showcases on-device ML/GenAI use cases and allows people to try and use models locally. - Release 1.0.0 · google-ai-edge/gallery
Media is too big
VIEW IN TELEGRAM
آنچه در Veo 3 بیش از همه با سایر نسخه ها و ابزارهای متن باز مثل Wan یا hunyuan تفاوت ایجاد کرده، نه صرفا توانایی تولید محتوای تصویری در یک مرحله، بلکه امکانات پیشرفته در ویرایش و صداگذاری خودکار هست مثل توانایی در تعریف حرکت، جهت، برش ها و حتی ترکیب صدا با تصویر و حتی لهجه ها!
این ابزار بیشتر به سمت کاربرد های حرفهای، مانند آژانس های تبلیغاتی و تولیدات سینمایی، هدف گذاری شدن.
مسیری که از سال ۲۰۱۴، زمانی که Ian Goodfellow برای نخستین بار معماری GAN رو معرفی کرد، آغاز شد، سالی که تولید تصاویر کدر و پیکسلی برامون هیجانانگیز بود تا به امروز، واقعا شگفتانگیز و الهام بخشه
این ابزار بیشتر به سمت کاربرد های حرفهای، مانند آژانس های تبلیغاتی و تولیدات سینمایی، هدف گذاری شدن.
مسیری که از سال ۲۰۱۴، زمانی که Ian Goodfellow برای نخستین بار معماری GAN رو معرفی کرد، آغاز شد، سالی که تولید تصاویر کدر و پیکسلی برامون هیجانانگیز بود تا به امروز، واقعا شگفتانگیز و الهام بخشه
از سال ۲۰۱۷، سخت افزارهای پر مصرف مخصوص AI باعث شدن مصرف برق مراکز داده تا سال ۲۰۲۳ دو برابر شه.
در حالی که ChatGPT در اواخر ۲۰۲۲ منتشر شد، رشد واقعی مصرف انرژی توسط هوش مصنوعی از سال ها قبل آغاز شده بود، از وقتی که AlphaGo با غلبه بر قهرمان بازی Go، جهان رو شوکه کرد و مقاله «Attention is All You Need» دنیای یادگیری ماشین رو دگرگون ساخت.
طبق گزارشی جدید، ۴.۴٪ از کل انرژی مصرفی آمریکا صرف مراکز داده میشه و پیشبینی میشه تا سال ۲۰۲۸، تنها هوش مصنوعی بهاندازه ۲۲٪ از برق مصرفی تمام خانوارهای آمریکا انرژی مصرف کنه.
آیا سیستم های انرژی فعلی تاب این رشد فزاینده رو دارن؟
https://www.technologyreview.com/2025/05/20/1116327/ai-energy-usage-climate-footprint-big-tech/
در حالی که ChatGPT در اواخر ۲۰۲۲ منتشر شد، رشد واقعی مصرف انرژی توسط هوش مصنوعی از سال ها قبل آغاز شده بود، از وقتی که AlphaGo با غلبه بر قهرمان بازی Go، جهان رو شوکه کرد و مقاله «Attention is All You Need» دنیای یادگیری ماشین رو دگرگون ساخت.
طبق گزارشی جدید، ۴.۴٪ از کل انرژی مصرفی آمریکا صرف مراکز داده میشه و پیشبینی میشه تا سال ۲۰۲۸، تنها هوش مصنوعی بهاندازه ۲۲٪ از برق مصرفی تمام خانوارهای آمریکا انرژی مصرف کنه.
آیا سیستم های انرژی فعلی تاب این رشد فزاینده رو دارن؟
https://www.technologyreview.com/2025/05/20/1116327/ai-energy-usage-climate-footprint-big-tech/
MIT Technology Review
We did the math on AI’s energy footprint. Here’s the story you haven’t heard.
The emissions from individual AI text, image, and video queries seem small—until you add up what the industry isn’t tracking and consider where it’s heading next.