Спасибо что вы есть!
Please open Telegram to view this post
VIEW IN TELEGRAM
Daily Dose of Datascience выпустили детальный обзор по MCP протоколу с примерами.
Годнота на 74 страницы.
Качаем в комментарии.
#DDODS #MCP #обучение
------
@tsingular
Годнота на 74 страницы.
Качаем в комментарии.
#DDODS #MCP #обучение
------
@tsingular
Google выпустил полную версию Gemma 3n с поддержкой аудио и видео
Google представил Gemma 3n - новую мобильную ИИ-модель с мультимодальными возможностями. Ключевые фишки:
• MatFormer архитектура - одна модель содержит несколько размеров (2B и 4B параметров)
• Встроенная обработка аудио до 30 секунд с поддержкой перевода речи
• Новый MobileNet-V5 энкодер для видео - в 13 раз быстрее предыдущей версии
• Оптимизация для мобильных устройств с минимальным использованием памяти
Модель уже поддерживается в Hugging Face, Ollama, llama.cpp и других популярных инструментах. Google запустил конкурс с призовым фондом $150,000 для разработчиков приложений.
Серьёзный шаг к полноценному ИИ прямо в смартфоне без интернета.
1300 Elo score для модели такого размера, - это рекорд!
gemma-3n-E4B-it-MLX-bf16 - всего 17 Гигабайт!
#Gemma3n #OnDeviceAI #Google
------
@tsingular
Google представил Gemma 3n - новую мобильную ИИ-модель с мультимодальными возможностями. Ключевые фишки:
• MatFormer архитектура - одна модель содержит несколько размеров (2B и 4B параметров)
• Встроенная обработка аудио до 30 секунд с поддержкой перевода речи
• Новый MobileNet-V5 энкодер для видео - в 13 раз быстрее предыдущей версии
• Оптимизация для мобильных устройств с минимальным использованием памяти
Модель уже поддерживается в Hugging Face, Ollama, llama.cpp и других популярных инструментах. Google запустил конкурс с призовым фондом $150,000 для разработчиков приложений.
Серьёзный шаг к полноценному ИИ прямо в смартфоне без интернета.
1300 Elo score для модели такого размера, - это рекорд!
gemma-3n-E4B-it-MLX-bf16 - всего 17 Гигабайт!
#Gemma3n #OnDeviceAI #Google
------
@tsingular
Tencent выпустил рассуждающую малую модель Hunyuan-A13B
Tencent представил открытую языковую модель Hunyuan-A13B на основе архитектуры Mixture-of-Experts.
Модель имеет 80 млрд параметров, но активно использует только 13 млрд.
Доступны версии FP8 и INT4. Поддерживается TensorRT-LLM, vLLM и SGLang.
Можно рассмотреть как альтернативу Qwen-3. Чуть лучше по некоторым метрикам.
UPD: а вот они следом выпустили нарезку GPTQ-Int4 на 42 гига.
#MoE #Hunyuan #TencentAI
———
@tsingular
Tencent представил открытую языковую модель Hunyuan-A13B на основе архитектуры Mixture-of-Experts.
Модель имеет 80 млрд параметров, но активно использует только 13 млрд.
Доступны версии FP8 и INT4. Поддерживается TensorRT-LLM, vLLM и SGLang.
Можно рассмотреть как альтернативу Qwen-3. Чуть лучше по некоторым метрикам.
UPD: а вот они следом выпустили нарезку GPTQ-Int4 на 42 гига.
#MoE #Hunyuan #TencentAI
———
@tsingular
Speech Note,- оффлайн комбайн для Linux с поддержкой русского
Полноценный набор инструментов для работы с речью без интернета.
Speech Note умеет распознавать речь в текст, читать текст вслух и переводить между языками.
Ключевые фишки:
- Полностью офлайн работа - никуда не передает данные
- Поддержка русского языка для всех функций
- CLI интерфейс для автоматизации
- Доступен через Flatpak на Flathub
Использует движки Whisper, Coqui TTS, Piper и многие другие.
Модели скачиваются прямо из приложения.
Отличный комбайн, который можно развернуть на сервере и вызывать через CLI тем же n8n.
#STT #TTS #SpeechNote
------
@tsingular
Полноценный набор инструментов для работы с речью без интернета.
Speech Note умеет распознавать речь в текст, читать текст вслух и переводить между языками.
Ключевые фишки:
- Полностью офлайн работа - никуда не передает данные
- Поддержка русского языка для всех функций
- CLI интерфейс для автоматизации
- Доступен через Flatpak на Flathub
Использует движки Whisper, Coqui TTS, Piper и многие другие.
Модели скачиваются прямо из приложения.
Отличный комбайн, который можно развернуть на сервере и вызывать через CLI тем же n8n.
#STT #TTS #SpeechNote
------
@tsingular
OpenAI представила Deep Research API
Новый Deep Research API автоматизирует сложные исследовательские задачи через программный интерфейс.
Агентная модель самостоятельно декомпозирует запросы, проводит веб-поиск и синтезирует результаты в структурированные отчеты с цитатами.
В отличие от ChatGPT, где процесс скрыт, API дает полный контроль над исследованием. Модель планирует подвопросы, использует инструменты поиска и выполнения кода.
Поддержка MCP-инструментов позволяет интегрировать внутренние документы компании в процесс исследования.
Идеально для создания аналитических отчетов, сравнительных исследований и структурированного анализа данных.
#DeepResearch #OpenAI #ResearchAPI
------
@tsingular
Новый Deep Research API автоматизирует сложные исследовательские задачи через программный интерфейс.
Агентная модель самостоятельно декомпозирует запросы, проводит веб-поиск и синтезирует результаты в структурированные отчеты с цитатами.
В отличие от ChatGPT, где процесс скрыт, API дает полный контроль над исследованием. Модель планирует подвопросы, использует инструменты поиска и выполнения кода.
Поддержка MCP-инструментов позволяет интегрировать внутренние документы компании в процесс исследования.
Идеально для создания аналитических отчетов, сравнительных исследований и структурированного анализа данных.
#DeepResearch #OpenAI #ResearchAPI
------
@tsingular
Иран запустил программу обучения ИИ для 2 миллионов школьников
Стартовала национальная программа Iran Digital - бесплатное обучение искусственному интеллекту для 2 миллионов учеников средних классов и 1000 учителей.
Программа включает практические проекты и игровую интерактивную платформу с соревнованиями и призами. Лучшие участники получат доступ к продвинутым курсам и стажировкам.
Цель - подготовить студентов к будущему рынку труда, развить критическое мышление и цифровую грамотность. Эксперты подчеркивают важность этичного использования ИИ в образовании как дополнения, а не замены человеческого фактора.
Иран активно развивает применение ИИ в образовании после конференции в Тегеране в октябре 2024 года.
#Education #Иран
------
@tsingular
Стартовала национальная программа Iran Digital - бесплатное обучение искусственному интеллекту для 2 миллионов учеников средних классов и 1000 учителей.
Программа включает практические проекты и игровую интерактивную платформу с соревнованиями и призами. Лучшие участники получат доступ к продвинутым курсам и стажировкам.
Цель - подготовить студентов к будущему рынку труда, развить критическое мышление и цифровую грамотность. Эксперты подчеркивают важность этичного использования ИИ в образовании как дополнения, а не замены человеческого фактора.
Иран активно развивает применение ИИ в образовании после конференции в Тегеране в октябре 2024 года.
#Education #Иран
------
@tsingular
Google выпустили инструкцию как с ADK можно создать ИИ-агента с инструментами
Google опубликовала детальное пошаговое руководство по созданию ИИ-агента с помощью Agent Development Kit (ADK).
В примере показали как создать бот-помощника для обработки багов с 5 типами инструментов.
Встроенные функции для расчетов, интеграция с LangChain и StackOverflow, подключение к GitHub через протокол MCP (Model Context Protocol) от Anthropic, работа с базами данных через MCP Toolbox.
Агент работает на Gemini 2.5 Flash и может создавать тикеты, искать баги, анализировать CVE и подключаться к внешним API.
Пример развернут на Google Cloud на Cloud Run и Cloud SQL, но как инструкцию полезно почитать и дальше использовать на любой платформе.
#Google #ADK #Agents #MCP
———
@tsingular
Google опубликовала детальное пошаговое руководство по созданию ИИ-агента с помощью Agent Development Kit (ADK).
В примере показали как создать бот-помощника для обработки багов с 5 типами инструментов.
Встроенные функции для расчетов, интеграция с LangChain и StackOverflow, подключение к GitHub через протокол MCP (Model Context Protocol) от Anthropic, работа с базами данных через MCP Toolbox.
Агент работает на Gemini 2.5 Flash и может создавать тикеты, искать баги, анализировать CVE и подключаться к внешним API.
Пример развернут на Google Cloud на Cloud Run и Cloud SQL, но как инструкцию полезно почитать и дальше использовать на любой платформе.
#Google #ADK #Agents #MCP
———
@tsingular
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 Seedance 1.0: ByteDance выпустил видеогенератор, который обошел всех на Artificial Analysis
ByteDance (разрабы ТикТока) представили Seedance 1.0 — модель генерации видео, которая заняла первое место в лидербордах Artificial Analysis как в text-to-video, так и в image-to-video категориях, обогнав Veo 3, Kling 2.0 и Sora.
Ключевые технические улучшения:
- Архитектура с разделенными пространственными и временными слоями — нативно поддерживает мультисценовую генерацию
- 10× ускорение инференса через многоступенчатую дистилляцию
- Генерация 5-секундного 1080p видео занимает 41.4 секунды на NVIDIA L20
- Единая модель для T2V и I2V задач
Что выделяет Seedance:
- Мультиаспектное повествование — создает последовательные кадры с сохранением персонажей и стиля (shot-reverse shot, match cuts)
- Точное следование промптам в сложных сценах с несколькими объектами
- Поддержка разнообразных стилей: от фотореализма до киберпанка и аниме
- Двуязычность (китайский/английский)
Модель уже интегрирована в Doubao и Jimeng — сервисы ByteDance для видеогенерации.
Интересная деталь: в посттренинге использовали RLHF с тремя специализированными reward-моделями (основная, движение, эстетика), что позволило улучшить все аспекты генерации одновременно .
Попробовать можно тут
(Нужен китайский номер)
#Seedance #ByteDance #нейрорендер
———
@tsingular
ByteDance (разрабы ТикТока) представили Seedance 1.0 — модель генерации видео, которая заняла первое место в лидербордах Artificial Analysis как в text-to-video, так и в image-to-video категориях, обогнав Veo 3, Kling 2.0 и Sora.
Ключевые технические улучшения:
- Архитектура с разделенными пространственными и временными слоями — нативно поддерживает мультисценовую генерацию
- 10× ускорение инференса через многоступенчатую дистилляцию
- Генерация 5-секундного 1080p видео занимает 41.4 секунды на NVIDIA L20
- Единая модель для T2V и I2V задач
Что выделяет Seedance:
- Мультиаспектное повествование — создает последовательные кадры с сохранением персонажей и стиля (shot-reverse shot, match cuts)
- Точное следование промптам в сложных сценах с несколькими объектами
- Поддержка разнообразных стилей: от фотореализма до киберпанка и аниме
- Двуязычность (китайский/английский)
Модель уже интегрирована в Doubao и Jimeng — сервисы ByteDance для видеогенерации.
Интересная деталь: в посттренинге использовали RLHF с тремя специализированными reward-моделями (основная, движение, эстетика), что позволило улучшить все аспекты генерации одновременно .
Попробовать можно тут
(Нужен китайский номер)
#Seedance #ByteDance #нейрорендер
———
@tsingular
This media is not supported in your browser
VIEW IN TELEGRAM
Windows MCP: ИИ-агенты теперь могут управлять Windows
Появился легковесный MCP-сервер для интеграции ИИ с операционной системой Windows.
Позволяет любым LLM (включая Claude) напрямую управлять Windows: открывать приложения, кликать по интерфейсу, имитировать пользовательский ввод, проводить QA-тестирование.
Главная фишка - работает с любой языковой моделью без компьютерного зрения или специального обучения. Задержка между действиями всего 1.5-2.3 секунды.
Проект с открытым исходным кодом под MIT лицензией. Интегрируется с Claude Desktop через расширения.
#MCP #Windows #Agents
------
@tsingular
Появился легковесный MCP-сервер для интеграции ИИ с операционной системой Windows.
Позволяет любым LLM (включая Claude) напрямую управлять Windows: открывать приложения, кликать по интерфейсу, имитировать пользовательский ввод, проводить QA-тестирование.
Главная фишка - работает с любой языковой моделью без компьютерного зрения или специального обучения. Задержка между действиями всего 1.5-2.3 секунды.
Проект с открытым исходным кодом под MIT лицензией. Интегрируется с Claude Desktop через расширения.
#MCP #Windows #Agents
------
@tsingular
По следам демо на GigaConf - ИСХОДНИК СХЕМЫ для n8n
Не забудьте поднять gpt2giga
В каждом вызове инструмента календаря Яндекса нужно отдельно прописать креды, которые создаются в профиле Яндекса - пароли приложений.
В модулях Transcribe и Generate Speech - креды от SaluteSpeech, соответственно.
#demo #n8n #dev #Яндекс
———
@tsingular
Не забудьте поднять gpt2giga
В каждом вызове инструмента календаря Яндекса нужно отдельно прописать креды, которые создаются в профиле Яндекса - пароли приложений.
В модулях Transcribe и Generate Speech - креды от SaluteSpeech, соответственно.
#demo #n8n #dev #Яндекс
———
@tsingular
OpenAI переходит с чипов NVIDIA на Google TPU
По данным The Information, OpenAI начала использовать тензорные процессоры Google TPU вместо GPU NVIDIA для работы ChatGPT и других AI-продуктов.
Основная причина — снижение операционных расходов. Высокие цены и дефицит GPU от NVIDIA открывают возможности для альтернативных решений.
Google активно предлагает свои TPU облачным провайдерам, что может серьезно ударить по почти монопольному положению NVIDIA в сфере высокопроизводительных AI-чипов.
Интересно, что Apple тоже использовала Google TPU для обучения Apple Intelligence, что показывает растущую популярность альтернативы чипам NVIDIA.
#OpenAI #GoogleTPU #NVIDIA
------
@tsingular
По данным The Information, OpenAI начала использовать тензорные процессоры Google TPU вместо GPU NVIDIA для работы ChatGPT и других AI-продуктов.
Основная причина — снижение операционных расходов. Высокие цены и дефицит GPU от NVIDIA открывают возможности для альтернативных решений.
Google активно предлагает свои TPU облачным провайдерам, что может серьезно ударить по почти монопольному положению NVIDIA в сфере высокопроизводительных AI-чипов.
Интересно, что Apple тоже использовала Google TPU для обучения Apple Intelligence, что показывает растущую популярность альтернативы чипам NVIDIA.
#OpenAI #GoogleTPU #NVIDIA
------
@tsingular