Telegram Web
دنیایی از منابع برنامه‌نویسی توی این کانال بصورت دسته‌بندی شده با هشتگ بصورت روزانه قرار داده میشه.

@pythony
👍6🔥1
Forwarded from آموزش LLM و VLM
یه نفر رفته system prompt‌های پشت‌پردهٔ کلی ابزار و چت‌بات معروف رو از طریق یه leak بزرگ پیدا کرده و همشو منتشر کرده!
الان یک ریپو تو گیت‌هاب هست که عملاً تبدیل شده به آرشیوی از مغزِ واقعی ابزارهای هوش مصنوعی — از Cursor و Devin گرفته تا Claude، Replit، Perplexity و ده‌ها ابزار دیگه.
اگه می‌خواید ببینید این ابزارها پشت صحنه چه قوانین، چه نقش‌ها و چه پرامپت‌هایی دارن، این ریپو واقعاً مثل گنج می‌مونه.
حتی می‌تونید برای طراحی agent یا پرامپت‌هاتون ازش ایده بگیرید.


https://github.com/x1xhlol/system-prompts-and-models-of-ai-tools
👏13🔥61
Forwarded from آموزش LLM و VLM
تشخیص اشیا با Qwen3-VL به روش open vocabulary!

پرامپت: «person between albert and marie»
(فرد بین آلبرت و ماری)

مدل باید نام‌های «albert» و «marie» را در این عکس به آلبرت اینشتین و ماری کوری نگاشت کند، چهره‌ها و جایگاه آن‌ها را تشخیص دهد و مفهوم «بین» را درست تفسیر کند تا فرد صحیح را پیدا کند.

کتابخانه Supervision از گروه roboflow کار با مدل‌های چندوجهی (VLMها) را به این منظور ساده‌تر می‌کند. شما متن را پردازش می‌کنید، آن را به یک فرمت آشنا مثل باکس‌های تشخیص تبدیل می‌کنید و نتیجه را به‌صورت بصری نمایش می‌دهید.

TARGET = "person between albert and marie"

image = Image.open(IMAGE).convert("RGB")
response = qwen_detect(image, TARGET)

detections = sv.Detections.from_vlm(
vlm=sv.VLM.QWEN_3_VL,
result=response,
resolution_wh=image.size
)



کتابخانه Supervision از مدل‌های دیگر مثل Qwen-VL، Google Gemini و DeepSeek-VL و ... پشتیبانی می‌کند.

نوت بوک:

https://github.com/Alireza-Akhavan/LLM/blob/main/open_vocabulary_object_detection_with_qwen3_vl.ipynb

همین امروز یادگیری VLM را شروع کنید.
10👍7🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
https://www.alphaxiv.org/

اگه زیاد با مقالات علمی سروکار داری، این ابزار واقعاً به کارت میاد:

⭐️ افزونه کروم هم داره
⭐️ هر بخش از مقاله رو فقط هایلایت کن، همون‌جا ازش سؤال بپرس
⭐️ با نوشتن “@” می‌تونی سریع به مقالات دیگه ارجاع بدی و کانتکست، مقایسه‌ها و نتایج بنچمارک رو یکجا ببینی
⭐️ پشتیبانی از زبان فارسی هم داره!
⭐️ میتونی LLM پشتشو خودت انتخاب کنی که الان از Gemini 3 pro هم ساپورت میکنه
👍164
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 شرکت Meta فقط SAM 3 را معرفی نکرد، بلکه SAM 3D را هم منتشر کرد!

مدل جدید Meta یک جهش بزرگ در بازسازی سه‌بعدی از روی تصاویر دوبعدی ایجاد کرده است؛ هم برای اشیا و هم برای بدن انسان.

🔹 SAM 3D Objects
این نسخه می‌تواند فقط از روی یک تصویر، کل ساختار سه‌بعدی یک شیء شامل شکل، هندسه، بافت (Texture) و چیدمان آن را بازسازی کند.
فرآیند آن دو مرحله‌ای است:
ابتدا یک مدل Transformer ترکیبی ساختار کلی را تخمین می‌زند، سپس یک مدل دوم جزئیات دقیق و تکسچر را اضافه می‌کند.

🔹 SAM 3D Body
این نسخه مخصوص بازسازی مدل سه‌بعدی کامل بدن انسان از روی یک عکس است.
قابلیت گرفتن پرامپت‌های کمکی مثل نقاط کلیدی (Keypoints) و ماسک را دارد، مشابه SAM.
برای آموزش هم از داده‌های باکیفیت و یک سیستم برچسب‌گذاری هوشمند روی سخت‌ترین نمونه‌ها استفاده شده.

🔗 لینک‌ها:
📌 دموی رسمی:
https://aidemos.meta.com/segment-anything
📌 مخزن SAM 3D Objects:
https://github.com/facebookresearch/sam-3d-objects
📌 مخزن SAM 3D Body:
https://github.com/facebookresearch/sam-3d-body


شرکت Meta همه چیز را کاملاً متن‌باز منتشر کرده: وزن‌ها، داده‌ها و کد.

#sam3
🔥244👍3
This media is not supported in your browser
VIEW IN TELEGRAM
📢 مدل Nano Banana Pro معرفی شد 📢

🔥 مدل Nano Banana Pro یا همان Gemini 3 Pro Image جدیدترین مدل تصویری Google/DeepMind است که روی تولید و ویرایش تصویر با کیفیت بالا و کنترل‌پذیری دقیق تمرکز دارد. این مدل در درک صحنه و رندر جزئیات یک جهش جدی داشته.

🧠 یکی از نکات برجستهٔ آن، رندر متن داخل تصویر بدون distortion یا بهم‌ریختگی است. برای ساخت پوسترهای حرفه‌ای، نمودارها و صفحات محصول. همچنین امکان کنترل دقیق روی lighting، camera angle، scene setup و style را فراهم می‌کند.

🔗 جزئیات بیشتر در DeepMind 🔗

🌀 @cvision 🌀
🔥126👍4
دوستان عزیز،
یک فرد نابینا و بسیار توانمند که دانشجوی دکتری مهندسی عمران هستند، قصد یادگیری یادگیری ماشین را برای پایان نامه خودشون دارند و به همین منظور به یک مدرس خصوصی نیاز دارند و هزینه هم پرداخت می کنند .
اگر توانایی تدریس یادگیری ماشین را دارید یا فرد مناسبی را می‌شناسید، لطفاً از طریق @hassanYOUSEFZADE رزومه ی خودتون رو بفرستین .با تشکر
51👍4🔥3👏2
🎁🎊🎉به بهانه بلک فرایدی
برای همراهان کانال 👇

🎓 دوره جامع LLM
با تخفیف ۷۰٪ واقعی
🎟 بلیط ورود به دنیای مدل‌های زبانی بزرگ 🚀

کد تخفیف: COUPON-fa527
فقط برای مدت محدود - تا 10 آذرماه
https://mktb.me/04dr/
++++++++++++++++++
🎓 دوره جامع VLM – مدل‌های زبانی-تصویری

با تخفیف ۷۰٪ واقعی
🎟 ورود به دنیای مولتی‌مودال و AI ترکیبی 🚀

کد تخفیف: COUPON-0db40
فقط برای مدت محدود – تا 10 آذرماه
https://mktb.me/e3gx/
++++++++++++++++++

🎓 دوره جامع دیپ‌لرنینگ با TensorFlow
با تخفیف ۷۰٪ واقعی
🎟 یادگیری عملی شبکه‌های عصبی و پروژه‌های AI 🚀
کد تخفیف: COUPON-dc646
فقط برای مدت محدود – تا 10 آذرماه
https://mktb.me/2klm/
8👍2
۵۱٪ از ترافیک اینترنت امروز توسط ربات‌های هوش مصنوعی و پروفایل‌های مبتنی بر LLM تولید می‌شود و انسان‌ها فقط ۴۹٪ از تولید محتوای اینترنتی را انجام می‌دهند.

وقتی محتوا توسط هوش مصنوعی تولید می‌شود و دوباره همان محتوا خوراک مدل‌های جدید هوش مصنوعی می‌شود، وب به‌تدریج به یک اکوسیستم بسته و خودتکرارشونده میان ربات ها تبدیل می‌شود؛

یک Echo chamber عظیم که اصالت، خلاقیت و حتی واقعیت را تهدید می‌کند.

imperva.com/resources/resource-library/reports/2025-bad-bot-report
👌22👍8🤯61
🔔 به درخواست کاربران، علاوه بر تخفیف‌های قبلی بلک‌فرایدی:

🎓 دوره جامع OpenCV با پایتون
یک دوره کامل، پروژه‌محور و بسیار محبوب بین کاربرها
با تخفیف ۷۰٪ واقعی
کد تخفیف: COUPON-7f28f
🔗 https://mktb.me/81nt/

🎓 دوره شبکه‌های عصبی گرافی (GNN) – Class.Vision
برای علاقه‌مندان به هوش مصنوعی پیشرفته و گراف لرنینگ
با تخفیف ۵۰٪
کد تخفیف: blackfriday
🔗 https://class.vision/product/graph-neural-network/
8
دانشگاه استنفورد سامانه‌ای برای داوری و فیدبک رایگان سریع و خودکار روی مقالات علمی با کمک هوش مصنوعی راه اندازی کرده

https://paperreview.ai/
36👍4🤔3👀1
Tensorflow(@CVision)
🔥 شرکت Meta فقط SAM 3 را معرفی نکرد، بلکه SAM 3D را هم منتشر کرد! مدل جدید Meta یک جهش بزرگ در بازسازی سه‌بعدی از روی تصاویر دوبعدی ایجاد کرده است؛ هم برای اشیا و هم برای بدن انسان. 🔹 SAM 3D Objects این نسخه می‌تواند فقط از روی یک تصویر، کل ساختار سه‌بعدی…
This media is not supported in your browser
VIEW IN TELEGRAM
قبلاً در مورد SAM 3 و نسخه‌های سه‌بعدی مثل SAM 3D Objects و SAM 3D Body بحث کردیم...
متا یک قدم جلوتر رفته و استاندارد جدیدی در بین مدل‌های بینایی کامپیوتری ساخته:

قابلیت Segment Anything with Concepts!

نسخه‌ی جدید SAM 3 نه فقط اشیاء رو تشخیص می‌ده، بلکه با پرامپت مفهومی می‌تونی هر چیزی رو با یک عبارت ساده بخش‌بندی کنی؛ از «اتوبوس مدرسه زرد» گرفته تا «بازیکنی با لباس سفید».


مدل می‌تونه بین مفاهیم نزدیک خیلی دقیق تمایز بذاره—حتی در ویدیوهای شلوغ!
این کار با معماری جدید Presence Head انجام می‌شه

زیرساخت مدل:

دیتاست عظیم شامل ۴ میلیون مفهوم

بنچ‌مارک جدید SA-Co با ۲۷۰ هزار مفهوم (۵۰ برابر بزرگ‌تر از قبلی‌ها!)

دو برابر دقیق‌تر از مدل‌های قبلی در بخش‌بندی تصویر و ویدیو

عملکرد نزدیک به ۷۵–۸۰٪ انسان

پردازش یک تصویر شلوغ در فقط ۳۰ میلی‌ثانیه روی GPU H200

مدل ۸۴۸ میلیون پارامتری

📦 مدل‌ها + 📚 کدها + 📊 بنچ‌مارک SA-Co
همه هم روی Hugging Face در دسترسه

مقاله | مدل و دیتاست | دمو
👍25🔥86
This media is not supported in your browser
VIEW IN TELEGRAM
نه بابا هوش مصنوعی قراره دنیارو بگیره.
👀29🤯62💯2
قابلیت نسبتا جدید infographic در نوت بوک lm

من روی مقاله ی Vision Transformer تست کردم و عکس زیرو داد

https://notebooklm.google.com
👍268🤯7
An_Image_Is_Worth_16x16_Words.pdf
12.1 MB
اینم از قابلیت Slide deck روی همون مقاله
🤯27👍2
Forwarded from آموزش LLM و VLM
مینی دوره ساخت هوش مصنوعی شخصی در مرورگر؛ برای معرفی قابلیت جدید مرورگرهاست، چیزی که بدون ابزار اضافی شما را قادر میکنه از LLM داخلی مرورگر سوال بپرسید؛ مثلا فقط با این چند خط کد js تو مرورگر کروم یا اج
البته به شرط داشتن سخت افزار و به روز بودن مرورگر


  //  Create Session: 
const session = await LanguageModel.create();

// Define the Question (Prompt)
const question = "پایتخت ایران کجاست؟ فقط نام شهر را بگو.";

console.log(`سؤال شما: ${question}`);

// Prompt the model:
const result = await session.prompt(question);

// Display the result
console.log("پاسخ هوش مصنوعی:", result);

ما اصلا فریم ورکی نیاز نیست نصب کنیم، خود مرورگرها اضافه کردند و بیشتر برای کلاینت ساید کارها جذابه...

مثالهاشم اینجاست:

https://jsai.ir/
7😱2
2025/12/12 02:04:54
Back to Top
HTML Embed Code: