Tensorflow(@CVision)
گوگل I/O ۲۰۲۵ تا اینجا: حالت «AI Mode» در جستجوی گوگل به صورت جهانی در حال گسترشه و ویژگی های هوش مصنوعی بیشتری رو اضافه میکنه Google Beam نام جدید پروژه «Starline» هست که کیفیت جلسات مجازی رو بهتر میکنه. عینکهای هوشمند واقعیت ترکیبی (XR) اندروید…
نسخه جدید Gemini 2.5 Pro توانایی های بهتری در استدلال، برنامهنویسی و کار با ورودی های چند رسانهای پیدا کرده.
Tensorflow(@CVision)
نسخه جدید Gemini 2.5 Pro توانایی های بهتری در استدلال، برنامهنویسی و کار با ورودی های چند رسانهای پیدا کرده.
طرح «AI Ultra» گوگل با پرداخت ماهیانه ۲۴۹.۹۹ دلار، دسترسی به نسخههای پیشرفته هوش مصنوعی رو فراهم میکنه.
ابزار کدنویسی جدید گوگل به نام «Stitch» به توسعه
دهندگان در طراحی سریع رابط کاربری کمک میکنه
Gemini Live
امکان اشتراک گذاری زنده دوربین با هوش مصنوعی رو به جستجوی گوگل و اپلیکیشن Gemini اضافه کرده
ابزار کدنویسی جدید گوگل به نام «Stitch» به توسعه
دهندگان در طراحی سریع رابط کاربری کمک میکنه
Gemini Live
امکان اشتراک گذاری زنده دوربین با هوش مصنوعی رو به جستجوی گوگل و اپلیکیشن Gemini اضافه کرده
Tensorflow(@CVision)
طرح «AI Ultra» گوگل با پرداخت ماهیانه ۲۴۹.۹۹ دلار، دسترسی به نسخههای پیشرفته هوش مصنوعی رو فراهم میکنه. ابزار کدنویسی جدید گوگل به نام «Stitch» به توسعه دهندگان در طراحی سریع رابط کاربری کمک میکنه Gemini Live امکان اشتراک گذاری زنده دوربین با هوش…
همچنین گوگل مدل Gemini Diffusion رو معرفی کرد که یه مدل زبانی غیرترتیبی هست و با استفاده از روش Diffusion بلوک های متنی رو بصورت هم زمان تولید می کنه
https://deepmind.google/models/gemini-diffusion/
https://deepmind.google/models/gemini-diffusion/
Google DeepMind
Gemini Diffusion
Gemini Diffusion is our state-of-the-art research model exploring what diffusion means for language – and text generation.
Tensorflow(@CVision)
گوگل I/O ۲۰۲۵ تا اینجا: حالت «AI Mode» در جستجوی گوگل به صورت جهانی در حال گسترشه و ویژگی های هوش مصنوعی بیشتری رو اضافه میکنه Google Beam نام جدید پروژه «Starline» هست که کیفیت جلسات مجازی رو بهتر میکنه. عینکهای هوشمند واقعیت ترکیبی (XR) اندروید…
This media is not supported in your browser
VIEW IN TELEGRAM
قابلیت ترجمه زنده در Google Meet
Tensorflow(@CVision)
گوگل I/O ۲۰۲۵ تا اینجا: حالت «AI Mode» در جستجوی گوگل به صورت جهانی در حال گسترشه و ویژگی های هوش مصنوعی بیشتری رو اضافه میکنه Google Beam نام جدید پروژه «Starline» هست که کیفیت جلسات مجازی رو بهتر میکنه. عینکهای هوشمند واقعیت ترکیبی (XR) اندروید…
This media is not supported in your browser
VIEW IN TELEGRAM
Veo 3🔥
Tensorflow(@CVision)
گوگل I/O ۲۰۲۵ تا اینجا: حالت «AI Mode» در جستجوی گوگل به صورت جهانی در حال گسترشه و ویژگی های هوش مصنوعی بیشتری رو اضافه میکنه Google Beam نام جدید پروژه «Starline» هست که کیفیت جلسات مجازی رو بهتر میکنه. عینکهای هوشمند واقعیت ترکیبی (XR) اندروید…
This media is not supported in your browser
VIEW IN TELEGRAM
نمای کلی ویدیویی بزودی به NotebookLM اضافه میشه. فعلا فقط برای زبان انگلیسی در دسترس خواهد بود، اما بزودی میتونید خلاصه های ویدیویی کوتاه از منابع خود مانند فایلهای PDF، عکسها و سایر محتواها بسازین.
Tensorflow(@CVision)
گوگل I/O ۲۰۲۵ تا اینجا: حالت «AI Mode» در جستجوی گوگل به صورت جهانی در حال گسترشه و ویژگی های هوش مصنوعی بیشتری رو اضافه میکنه Google Beam نام جدید پروژه «Starline» هست که کیفیت جلسات مجازی رو بهتر میکنه. عینکهای هوشمند واقعیت ترکیبی (XR) اندروید…
Media is too big
VIEW IN TELEGRAM
فناوریای که پشت دوربین و اشتراک گذاری صفحه در Gemini Live قرار داره، حالا با ویژگیهای هوشمندانه تری معرفی شده .
این فناوری تحت عنوان Project Astra در قالب یک اپلیکیشن اندروید برای برخی کاربران در دسترس قرار گرفته.
نکته جالب اینکه Astra حالا تواناییهایی عاملی (agentic) داره، یعنی میتونه به صورت هوشمند برخی بخشهای گوشی اندرویدی شما رو کنترل کنه
این فناوری تحت عنوان Project Astra در قالب یک اپلیکیشن اندروید برای برخی کاربران در دسترس قرار گرفته.
نکته جالب اینکه Astra حالا تواناییهایی عاملی (agentic) داره، یعنی میتونه به صورت هوشمند برخی بخشهای گوشی اندرویدی شما رو کنترل کنه
Tensorflow(@CVision)
گوگل به تازگی مدلهای جدید Gemma 3n رو در HuggingFace منتشر کرده. مدلهای Gemma 3n برای اجرای بهینه روی دستگاههایی با منابع محدود مثل تلفن همراه به صورت محلی طراحی شدن. این مدل ها توانایی دریافت ورودی های چندرسانهای رو دارن به این معنی که میتونن متن،…
راهنمای نصب Gemma 3n برای کاربران اندروید:
فایل APK اپلیکیشن Edge Gallery رو از گیتهاب دانلود کنید:
https://github.com/google-ai-edge/gallery/releases/tag/1.0.0
یکی از فایلهای .task رو از سایت Hugging Face دانلود کنید:
https://huggingface.co/collections/google/gemma-3n-preview-682ca41097a31e5ac804d57b
فایل .task رو با زدن دکمه + در پایین سمت راست، داخل اپلیکیشن Edge Gallery وارد کنید.
همچنین میتونید مستقیما از داخل برنامه عکس بگیرید و با مدل گفتگو کنید
فایل APK اپلیکیشن Edge Gallery رو از گیتهاب دانلود کنید:
https://github.com/google-ai-edge/gallery/releases/tag/1.0.0
یکی از فایلهای .task رو از سایت Hugging Face دانلود کنید:
https://huggingface.co/collections/google/gemma-3n-preview-682ca41097a31e5ac804d57b
فایل .task رو با زدن دکمه + در پایین سمت راست، داخل اپلیکیشن Edge Gallery وارد کنید.
همچنین میتونید مستقیما از داخل برنامه عکس بگیرید و با مدل گفتگو کنید
GitHub
Release 1.0.0 · google-ai-edge/gallery
A gallery that showcases on-device ML/GenAI use cases and allows people to try and use models locally. - Release 1.0.0 · google-ai-edge/gallery
Media is too big
VIEW IN TELEGRAM
آنچه در Veo 3 بیش از همه با سایر نسخه ها و ابزارهای متن باز مثل Wan یا hunyuan تفاوت ایجاد کرده، نه صرفا توانایی تولید محتوای تصویری در یک مرحله، بلکه امکانات پیشرفته در ویرایش و صداگذاری خودکار هست مثل توانایی در تعریف حرکت، جهت، برش ها و حتی ترکیب صدا با تصویر و حتی لهجه ها!
این ابزار بیشتر به سمت کاربرد های حرفهای، مانند آژانس های تبلیغاتی و تولیدات سینمایی، هدف گذاری شدن.
مسیری که از سال ۲۰۱۴، زمانی که Ian Goodfellow برای نخستین بار معماری GAN رو معرفی کرد، آغاز شد، سالی که تولید تصاویر کدر و پیکسلی برامون هیجانانگیز بود تا به امروز، واقعا شگفتانگیز و الهام بخشه
این ابزار بیشتر به سمت کاربرد های حرفهای، مانند آژانس های تبلیغاتی و تولیدات سینمایی، هدف گذاری شدن.
مسیری که از سال ۲۰۱۴، زمانی که Ian Goodfellow برای نخستین بار معماری GAN رو معرفی کرد، آغاز شد، سالی که تولید تصاویر کدر و پیکسلی برامون هیجانانگیز بود تا به امروز، واقعا شگفتانگیز و الهام بخشه
از سال ۲۰۱۷، سخت افزارهای پر مصرف مخصوص AI باعث شدن مصرف برق مراکز داده تا سال ۲۰۲۳ دو برابر شه.
در حالی که ChatGPT در اواخر ۲۰۲۲ منتشر شد، رشد واقعی مصرف انرژی توسط هوش مصنوعی از سال ها قبل آغاز شده بود، از وقتی که AlphaGo با غلبه بر قهرمان بازی Go، جهان رو شوکه کرد و مقاله «Attention is All You Need» دنیای یادگیری ماشین رو دگرگون ساخت.
طبق گزارشی جدید، ۴.۴٪ از کل انرژی مصرفی آمریکا صرف مراکز داده میشه و پیشبینی میشه تا سال ۲۰۲۸، تنها هوش مصنوعی بهاندازه ۲۲٪ از برق مصرفی تمام خانوارهای آمریکا انرژی مصرف کنه.
آیا سیستم های انرژی فعلی تاب این رشد فزاینده رو دارن؟
https://www.technologyreview.com/2025/05/20/1116327/ai-energy-usage-climate-footprint-big-tech/
در حالی که ChatGPT در اواخر ۲۰۲۲ منتشر شد، رشد واقعی مصرف انرژی توسط هوش مصنوعی از سال ها قبل آغاز شده بود، از وقتی که AlphaGo با غلبه بر قهرمان بازی Go، جهان رو شوکه کرد و مقاله «Attention is All You Need» دنیای یادگیری ماشین رو دگرگون ساخت.
طبق گزارشی جدید، ۴.۴٪ از کل انرژی مصرفی آمریکا صرف مراکز داده میشه و پیشبینی میشه تا سال ۲۰۲۸، تنها هوش مصنوعی بهاندازه ۲۲٪ از برق مصرفی تمام خانوارهای آمریکا انرژی مصرف کنه.
آیا سیستم های انرژی فعلی تاب این رشد فزاینده رو دارن؟
https://www.technologyreview.com/2025/05/20/1116327/ai-energy-usage-climate-footprint-big-tech/
MIT Technology Review
We did the math on AI’s energy footprint. Here’s the story you haven’t heard.
The emissions from individual AI text, image, and video queries seem small—until you add up what the industry isn’t tracking and consider where it’s heading next.
This media is not supported in your browser
VIEW IN TELEGRAM
قابلیت ترجمۀ زنده با پشتیبانی از زبان فارسی در عینکهای هوشمند مجهز به اندروید XR
This media is not supported in your browser
VIEW IN TELEGRAM
یه ویدیوی دیگه با Veo 3 گوگل
به نظر میرسه تو آینده سینما به زودی فقط کارگردان خواهیم داشت و دیگر بازیگر نیازی نیست...
به نظر میرسه تو آینده سینما به زودی فقط کارگردان خواهیم داشت و دیگر بازیگر نیازی نیست...
دیتاست کارت ملی ایرانی
https://class.vision/blog/iranian-national-id-card-dataset/
دیتاست شامل ۲٬۰۰۰ تصویر از کارتهای ملی ایرانی است که با اطلاعات هویتی ساختگی ایجاد شدهاند. کارتها با کیفیت چاپ کارتهای واقعی تولید و در شرایط چالشبرانگیز و غیرکنترلشده با دوربینهای موبایل عکسبرداری شدهاند.
#دیتاست
https://class.vision/blog/iranian-national-id-card-dataset/
دیتاست شامل ۲٬۰۰۰ تصویر از کارتهای ملی ایرانی است که با اطلاعات هویتی ساختگی ایجاد شدهاند. کارتها با کیفیت چاپ کارتهای واقعی تولید و در شرایط چالشبرانگیز و غیرکنترلشده با دوربینهای موبایل عکسبرداری شدهاند.
#دیتاست
This media is not supported in your browser
VIEW IN TELEGRAM
Veo 3 🔥
آینده ما به سوی هم زیستی با ماشین هایی پیش میره که بهتر از ما فکر میکنن. اما اگر ما خود محصولی از داده و پردازش باشیم، چه تفاوتی میان ما و آن ها باقی میمونه؟ آیا ماشین ها روزی خواهند پرسید: «آیا کسی داره پرامپت ما رو می نویسه؟»
شاید در نهایت، همه ما تنها خطوطی از کدی بزرگ باشیم، در حال اجرا، تا زمانی که پردازنده ی هستی خاموش شه
آینده ما به سوی هم زیستی با ماشین هایی پیش میره که بهتر از ما فکر میکنن. اما اگر ما خود محصولی از داده و پردازش باشیم، چه تفاوتی میان ما و آن ها باقی میمونه؟ آیا ماشین ها روزی خواهند پرسید: «آیا کسی داره پرامپت ما رو می نویسه؟»
شاید در نهایت، همه ما تنها خطوطی از کدی بزرگ باشیم، در حال اجرا، تا زمانی که پردازنده ی هستی خاموش شه
Forwarded from کلاس ویژن: یادگیری عمیق و بینایی کامپیوتر
فرصت ویژه برای علاقهمندان به GNN!
با کد تخفیف ۳۰۰ هزار تومانی دورهی ضبطشدهی Graph Neural Network، یادگیری عمیقتری رو تجربه کن!
کد تخفیف:
لینک دوره:
https://class.vision/product/graph-neural-network/
❌فقط تا ۹ خرداد اعتبار دارد—از دستش نده!
با کد تخفیف ۳۰۰ هزار تومانی دورهی ضبطشدهی Graph Neural Network، یادگیری عمیقتری رو تجربه کن!
کد تخفیف:
gnn_300_fr
لینک دوره:
https://class.vision/product/graph-neural-network/
❌فقط تا ۹ خرداد اعتبار دارد—از دستش نده!
کلاسویژن
دورهی آموزشی ویدیویی Graph Neural Network - کلاسویژن
در دنیای امروز، دادههای گرافی بخش بزرگی از دادههای موجود را تشکیل میدهند. از شبکههای اجتماعی گرفته تا سیستمهای توصیهگر، گرافها در بسیاری از برنامههای کاربردی به کار میروند. در این ویدویوی آموزشی حدودا 13ساعته، شما با مفاهیم پایهای Graph Neural Network…
Tensorflow(@CVision)
فرصت ویژه برای علاقهمندان به GNN! با کد تخفیف ۳۰۰ هزار تومانی دورهی ضبطشدهی Graph Neural Network، یادگیری عمیقتری رو تجربه کن! کد تخفیف: gnn_300_fr لینک دوره: https://class.vision/product/graph-neural-network/ ❌فقط تا ۹ خرداد اعتبار دارد—از دستش نده!
مشکل کد تخفیف رفع شد
gnn_300_fr
Tensorflow(@CVision)
دیتاست کارت ملی ایرانی https://class.vision/blog/iranian-national-id-card-dataset/ دیتاست شامل ۲٬۰۰۰ تصویر از کارتهای ملی ایرانی است که با اطلاعات هویتی ساختگی ایجاد شدهاند. کارتها با کیفیت چاپ کارتهای واقعی تولید و در شرایط چالشبرانگیز و غیرکنترلشده…
اطلاعات بیشتر پیرامون چالشی که برگزار شد.
https://class.vision/blog/kibord-final-challenge/
چالش دانش آموزشی بود و بهترین دقتی که روی این دیتاست (البته روی 500 تا تست) گروه های برنده گرفتند بازخوانی ۴۲.۸٪ از کارت های ملی بود.
https://class.vision/blog/kibord-final-challenge/
چالش دانش آموزشی بود و بهترین دقتی که روی این دیتاست (البته روی 500 تا تست) گروه های برنده گرفتند بازخوانی ۴۲.۸٪ از کارت های ملی بود.
کلاسویژن
طراحی سؤال و داوری در رویداد ملی استعدادیابی آکادمی همراه اول - کلاسویژن
در این ویدیو، گفتوگویی با داوران نهایی رویداد «کیبُرد» را مشاهده میکنید. علیرضا اخوانپور، مدرس هوش مصنوعی در کلاسویژن، به عنوان طراح سوال نهایی بخش
مدل Claude Sonnet 4 و Claude Opus 4 امروز توسط شرکت Anthropic معرفی و منتشر شدند...
🧠 ویژگیهای برجسته Claude Opus 4
✅عملکرد بینظیر در برنامهنویسی: Claude Opus 4 در بنچمارک SWE-bench امتیاز ۷۲.۵٪ را کسب کرده است که بالاتر از امتیاز ۵۴.۶٪ مدل GPT-4.1 از OpenAI است.
✅توانایی انجام وظایف طولانیمدت: در آزمایشی با شرکت Rakuten، این مدل توانست بهطور مستقل و بدون وقفه به مدت ۷ ساعت کدنویسی کند...
✅قابلیتهای پیشرفته در حل مسائل پیچیده: مدل Claude Opus 4 با بهرهگیری از تفکر مرحلهبهمرحله و حافظهٔ گسترده، قادر به انجام وظایف پیچیده و طولانیمدت است.
✅ویژگی "تفکر گسترده": این مدل دارای حالت "تفکر گسترده" (Extended Thinking) است که به آن امکان میدهد بین پاسخهای سریع و استدلالهای عمیق سوئیچ کند.
https://docs.anthropic.com/en/docs/about-claude/models/overview
*همچنین، مدل Claude Sonnet 4 بهعنوان نسخهای مقرونبهصرفهتر و قاعدتا ضعیفتر در دسترس کاربران است.
🧠 ویژگیهای برجسته Claude Opus 4
✅عملکرد بینظیر در برنامهنویسی: Claude Opus 4 در بنچمارک SWE-bench امتیاز ۷۲.۵٪ را کسب کرده است که بالاتر از امتیاز ۵۴.۶٪ مدل GPT-4.1 از OpenAI است.
✅توانایی انجام وظایف طولانیمدت: در آزمایشی با شرکت Rakuten، این مدل توانست بهطور مستقل و بدون وقفه به مدت ۷ ساعت کدنویسی کند...
✅قابلیتهای پیشرفته در حل مسائل پیچیده: مدل Claude Opus 4 با بهرهگیری از تفکر مرحلهبهمرحله و حافظهٔ گسترده، قادر به انجام وظایف پیچیده و طولانیمدت است.
✅ویژگی "تفکر گسترده": این مدل دارای حالت "تفکر گسترده" (Extended Thinking) است که به آن امکان میدهد بین پاسخهای سریع و استدلالهای عمیق سوئیچ کند.
https://docs.anthropic.com/en/docs/about-claude/models/overview
*همچنین، مدل Claude Sonnet 4 بهعنوان نسخهای مقرونبهصرفهتر و قاعدتا ضعیفتر در دسترس کاربران است.
باجگیری هوش مصنوعی!
میگن مدل جدید Anthropic در یک تست، وقتی مهندسا خواستن خاموشش کنن، تهدید کرد رابطه محرمانه یکی از اونها رو افشا میکنه!😁
کارشناسا گفتن این رفتار ناشی از تنظیمات پیچیده بوده، ولی نگرانیها دربارهی کنترلپذیری AI جدیتر شده...
https://techcrunch.com/2025/05/22/anthropics-new-ai-model-turns-to-blackmail-when-engineers-try-to-take-it-offline
https://www.perplexity.ai/page/anthropic-claude-opus-4-model-8gZRnv9HQLKb3UWvtyoKTQ
میگن مدل جدید Anthropic در یک تست، وقتی مهندسا خواستن خاموشش کنن، تهدید کرد رابطه محرمانه یکی از اونها رو افشا میکنه!😁
کارشناسا گفتن این رفتار ناشی از تنظیمات پیچیده بوده، ولی نگرانیها دربارهی کنترلپذیری AI جدیتر شده...
https://techcrunch.com/2025/05/22/anthropics-new-ai-model-turns-to-blackmail-when-engineers-try-to-take-it-offline
https://www.perplexity.ai/page/anthropic-claude-opus-4-model-8gZRnv9HQLKb3UWvtyoKTQ
TechCrunch
Anthropic's new AI model turns to blackmail when engineers try to take it offline | TechCrunch
Anthropic says its Claude Opus 4 model frequently tries to blackmail software engineers when they try to take it offline.