173 - Telegram Web

Data Portal | Data Science & Машиннное обучение

Отличное приложение на основе ИИ начинается с выбора подходящего типа эмбеддингов.

Вот 6 типов эмбеддингов и случаи, когда стоит их использовать:

• Sparse embeddings: https://weaviate.io/developers/weaviate/search/bm25
• Dense embeddings: https://weaviate.io/developers/weaviate/search/similarity
• Quantized embeddings: https://weaviate.io/developers/weaviate/concepts/vector-quantization
• Binary embeddings: https://weaviate.io/developers/weaviate/concepts/vector-quantization#binary-quantization
• Variable dimensions: https://weaviate.io/blog/openais-matryoshka-embeddings-in-weaviate
• Multi-vector embeddings: https://weaviate.io/developers/weaviate/tutorials/multi-vector-embeddings

👉

@DataSciencegx

Please open Telegram to view this post

VIEW IN TELEGRAM

3.4K views09:03

Data Portal | Data Science & Машиннное обучение

0:02

This media is not supported in your browser

VIEW IN TELEGRAM

Google представил Agent2Agent (A2A)

Протокол для общения ИИ-агентов между собой, независимо от платформы или фреймворка. Использует технологии HTTP, SSE и JSON-RPC. Подробнее тут

Agent2Agent Protocol vs. Model Context Protocol, четкое объяснение (с визуализацией):

— Протокол Agent2Agent позволяет AI-агентам подключаться к другим агентам.

— Протокол Model Context позволяет AI-агентам подключаться к инструментам и API.

Оба протокола являются open-source и не конкурируют друг с другом

👉

@DataSciencegx

Please open Telegram to view this post

VIEW IN TELEGRAM

3.7K views07:09

Data Portal | Data Science & Машиннное обучение

Forwarded from Python Portal

NVIDIA завезла нативную поддержку Python в CUDA

Теперь можно напрямую использовать ускорение на GPU прямо из Python — что сильно упрощает работу над проектами в сфере ИИ, машинного обучения и научных вычислений. Никаких обёрток, костылей и танцев с C/C++.

— CUDA Core — переосмыслен для Python: здесь сделан упор на JIT-компиляцию и минимизацию зависимостей
— cuPyNumeric — прокачанная версия NumPy, работающая на GPU
— NVMath — поддержка линейной алгебры, совместима с хостом и устройством
— Добавлены инструменты для профилирования и анализа кода
— Новый подход к параллельным вычислениям — CuTile. Абстракция не на уровне потоков, а на уровне массивов и тайлов

Посмотреть презентацию можно тут

✌️

👉

@PythonPortal

Please open Telegram to view this post

VIEW IN TELEGRAM

3.1K views15:30

Data Portal | Data Science & Машиннное обучение

Если вы только начинаете заниматься ML/DL и переживаете, что придётся потратить недели на подтягивание математики, поверьте — этого видео вам достаточно.

Это видео длится 5 часов, и этого вполне достаточно, чтобы начать.

Не усложняйте

https://www.youtube.com/watch?v=Ixl3nykKG9M

👉

@DataSciencegx

Please open Telegram to view this post

VIEW IN TELEGRAM

3.7K views04:58

Data Portal | Data Science & Машиннное обучение

Сделайте sentence transformers в 50 раз меньше и в 500 раз быстрее

Model2Vec преобразует любой sentence transformer в компактную статическую модель с минимальной потерей качества. Кроме того, он обеспечивает мгновенный векторный поиск по миллионам документов без предварительной индексации.

Полностью с открытым исходным кодом

https://github.com/MinishLab/model2vec/tree/main

👉

@DataSciencegx

Please open Telegram to view this post

VIEW IN TELEGRAM

3.6K views14:34

Data Portal | Data Science & Машиннное обучение

Полный краш-курс по MCP для Python-разработчиков

– Что такое MCP и как он устроен
– Как поднять свой MCP-сервер
– Подключение Python-приложений к MCP
– Интеграция LLM-моделей с MCP
– MCP против function calling
– Деплой в Docker
– Управление жизненным циклом

Гайд для тех, кто хочет строить AI-системы на базе MCP и выйти за рамки базовых туториалов:
https://www.youtube.com/watch?v=5xqFjh56AwM

👉

@DataSciencegx

Please open Telegram to view this post

VIEW IN TELEGRAM

3.0K views07:29

Data Portal | Data Science & Машиннное обучение

Открытый репозиторий по Data Science для изучения и применения в решении реальных задач.

Это упрощённый путь для начала изучения Data Science.

Всё необходимое вы найдёте здесь: https://github.com/academic/awesome-datascience

👉

@DataSciencegx

Please open Telegram to view this post

VIEW IN TELEGRAM

2.9K views13:27

Data Portal | Data Science & Машиннное обучение

Подключите любую LLM к любому MCP-серверу

MCP-Use — это open-source способ подключить любую LLM к любому MCP-серверу и создавать кастомных агентов с доступом к инструментам без использования проприетарных решений или клиентских приложений.

Создавайте полностью локальные MCP-клиенты: https://github.com/pietrozullo/mcp-use

👉

@DataSciencegx

Please open Telegram to view this post

VIEW IN TELEGRAM

2.7K views13:40

Data Portal | Data Science & Машиннное обучение

Стэнфорд выкатил свежий курс по LLM — CS336: Language Modeling from Scratch

Курс с фокусом на практику: вся теория по LLM раскрывается через создание собственной модели. Ты изучаешь всё end-to-end — от обработки данных и архитектуры трансформеров до RL и эвала

Ведёт курс Перси Лианг — профессор Стэнфорда и сооснователь TogetherAI.

Курс прямо сейчас идёт в Стэнфорде, и лекции заливаются по ходу — контент свежий, как только из печи

Первые лекции здесь, а домашка и ноутбуки — тут.

👉

@DataSciencegx

Please open Telegram to view this post

VIEW IN TELEGRAM

3.4K views18:04

Data Portal | Data Science & Машиннное обучение

0:01

This media is not supported in your browser

VIEW IN TELEGRAM

4 стратегии обучения на нескольких GPU, объяснённые наглядно:

👉

@DataSciencegx

Please open Telegram to view this post

VIEW IN TELEGRAM

2.7K views09:42

Data Portal | Data Science & Машиннное обучение

Эта лекция о больших языковых моделях (LLM) обязательна к просмотру для инженеров в области ИИ.

Полуторачасовая лекция охватывает: токенизацию, законы масштабирования, дообучение, оценку, оптимизацию, вызовы, затраты и многое другое.

От Стэнфорда, около 1 млн просмотров

https://www.youtube.com/watch?v=9vM4p9NN0Ts

👉

@DataSciencegx

Please open Telegram to view this post

VIEW IN TELEGRAM

3.2K views19:03

Data Portal | Data Science & Машиннное обучение

Этот репозиторий на GitHub — настоящая находка для ML-специалистов

Репозиторий Kaggle Solutions собирает решения и идеи от лучших участников прошлых соревнований Kaggle. Список регулярно обновляется после каждого соревнования.

Он охватывает интервью по машинному обучению, лекции и решения

https://github.com/faridrashidi/kaggle-solutions

👉

@DataSciencegx

Please open Telegram to view this post

VIEW IN TELEGRAM

3.0K views14:06

Data Portal | Data Science & Машиннное обучение

Вот как запустить модель случайного леса на GPU

Hummingbird компилирует обученные традиционные модели машинного обучения в тензорные вычисления. Это позволяет запускать их на аппаратных ускорителях, таких как GPU, для более быстрой инференции.

Инференция в 40 раз быстрее всего за 2 строки кода

👉

@DataSciencegx

Please open Telegram to view this post

VIEW IN TELEGRAM

4.1K views17:07

Data Portal | Data Science & Машиннное обучение

Forwarded from IT Portal

Топ на выходные: 3 сайта с задачками для прокачки ML-навыков

Линейная алгебра, machine и deep learning — разный уровень сложности: задачи отсортированы по Easy, Mediums и Hard. Автоматическая проверка и подсказки в комплекте

Deep-ML, Tensorgym и ML cекция на NeetCode — не благодарите

@IT_Portal

3.9K views09:09

Data Portal | Data Science & Машиннное обучение

Внутренности PyTorch

Подробное руководство о том, как разобраться в кодовой базе PyTorch и начать вносить вклад в её развитие

https://blog.ezyang.com/2019/05/pytorch-internals/

👉

@DataSciencegx

Please open Telegram to view this post

VIEW IN TELEGRAM

3.6K views06:24

Data Portal | Data Science & Машиннное обучение

Один из лучших гайдов по выборке в больших языковых моделях (LLM Sampling) вышел, написанный создателем движка инференса Aphrodite (этот парень реально обожает сэмплеры)

https://rentry.org/samplers

👉

@DataSciencegx

Please open Telegram to view this post

VIEW IN TELEGRAM

3.4K views08:49

Data Portal | Data Science & Машиннное обучение

Создание трансформера с нуля
https://github.com/DorsaRoh/Machine-Learning

Реализация и подробное объяснение трансформера, с расчётом на полное отсутствие предварительных знаний.

Приятного изучения ✌️

👉

@DataSciencegx

Please open Telegram to view this post

VIEW IN TELEGRAM

GitHub

GitHub - DorsaRoh/Machine-Learning: ML from scratch

ML from scratch. Contribute to DorsaRoh/Machine-Learning development by creating an account on GitHub.

3.4K views13:08

Data Portal | Data Science & Машиннное обучение

Эти лекции были записаны 10 лет назад, но до сих пор, вероятно, остаются одними из лучших по следующим темам — теория информации и распознавание образов.

Основаны на книге Information Theory, Inference, and Learning Algorithm

https://www.youtube.com/playlist?list=PLruBu5BI5n4aFpG32iMbdWoRVAA-Vcso6

👉

@DataSciencegx

Please open Telegram to view this post

VIEW IN TELEGRAM

4.1K views14:08

Data Portal | Data Science & Машиннное обучение

Нашел видеоуроки по построению DeepSeek с нуля — уже вышло 25 выпусков. Объясняется неплохо, можно смотреть вместе с руководством по построению DeepSeek с нуля на HuggingFace.

Ссылка: http://youtube.com/watch?v=QWNxQIq0hMo&list=PLPTV0NXA_ZSiOpKKlHCyOq9lnp-dLvlms

👉

@DataSciencegx

Please open Telegram to view this post

VIEW IN TELEGRAM

3.4K views05:32

2025/07/06 06:14:02
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.tgoop.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>