Мои фанаты часто спрашивают, - "С чего ты взял, что мы твои фанаты?"
Разбирали вопросы после доклада.
#gigaconf #юмор
———
@tsingular
Разбирали вопросы после доклада.
#gigaconf #юмор
———
@tsingular
Google DeepMind представила AlphaGenome — ИИ для понимания ДНК
После AlphaFold для белков теперь появился AlphaGenome для генома. ИИ предсказывает, как изменения в ДНК влияют на активность генов.
Модель может заменить часть лабораторных экспериментов компьютерными расчетами. Особенно полезна для анализа редких мутаций при раке и генетических заболеваниях.
DeepMind планирует сделать систему бесплатной для исследователей. Для коммерческого использования изучают варианты монетизации.
ИИ обучен на данных научных проектов и использует трансформерную архитектуру. Не предназначен для персональных геномных предсказаний вроде 23andMe.
#AlphaGenome #DeepMind #GenomicsAI
------
@tsingular
После AlphaFold для белков теперь появился AlphaGenome для генома. ИИ предсказывает, как изменения в ДНК влияют на активность генов.
Модель может заменить часть лабораторных экспериментов компьютерными расчетами. Особенно полезна для анализа редких мутаций при раке и генетических заболеваниях.
DeepMind планирует сделать систему бесплатной для исследователей. Для коммерческого использования изучают варианты монетизации.
ИИ обучен на данных научных проектов и использует трансформерную архитектуру. Не предназначен для персональных геномных предсказаний вроде 23andMe.
#AlphaGenome #DeepMind #GenomicsAI
------
@tsingular
Китай готовит более 100 прорывов уровня DeepSeek
Бывший зампред Народного банка Китая Чжу Минь заявил на всемирном экономическом форуме: в ближайшие 18 месяцев Китай выпустит более 100 продуктов уровня DeepSeek.
По его словам, новые ИИ-решения «кардинально изменят природу и технологическую основу всей китайской экономики».
Что интересно, одновременно с этой новостью проскользнула другая версия или интерпретация, что DeepSeek планирует разработку моделей для здравоохранения, сельского хозяйства и финансов и всего их будет порядка 100 штук, - это уже со слов CEO Li Jian.
И складывается ощущение, что компания готовит 100 частных моделей, как, собственно, у нас тоже делают лидеры рынка, - дообучают модели под частные задачи, а это попало в доклад на WEF как - "ждем 100 продуктов уровня Дипсик"
А потом предъявят, - ну где же ваши 100 Дипсиков, - всё понятно, - ИИ зима наступила, раз нет.
#DeepSeek #Китай
———
@tsingular
Бывший зампред Народного банка Китая Чжу Минь заявил на всемирном экономическом форуме: в ближайшие 18 месяцев Китай выпустит более 100 продуктов уровня DeepSeek.
По его словам, новые ИИ-решения «кардинально изменят природу и технологическую основу всей китайской экономики».
Что интересно, одновременно с этой новостью проскользнула другая версия или интерпретация, что DeepSeek планирует разработку моделей для здравоохранения, сельского хозяйства и финансов и всего их будет порядка 100 штук, - это уже со слов CEO Li Jian.
И складывается ощущение, что компания готовит 100 частных моделей, как, собственно, у нас тоже делают лидеры рынка, - дообучают модели под частные задачи, а это попало в доклад на WEF как - "ждем 100 продуктов уровня Дипсик"
А потом предъявят, - ну где же ваши 100 Дипсиков, - всё понятно, - ИИ зима наступила, раз нет.
#DeepSeek #Китай
———
@tsingular
Forwarded from Анализ данных (Data analysis)
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 Fireplexity — открытый аналог Perplexity
Простой движок вопросов и ответов на базе ИИ.
Работает через два основных эндпоинта:
•
•
Ответы ИИ формируются на основе найденной информации и включают ссылки на источники.
Можно использовать как готовый сервис или собрать свою версию — код открыт.
Подходит для интеграции в чат-ботов, ассистентов и внутренних инструментов.
📌 Github
@data_analysis_ml
Простой движок вопросов и ответов на базе ИИ.
Работает через два основных эндпоинта:
•
/search
— выполняет поиск по интернету •
/scrape
— извлекает текст со страницОтветы ИИ формируются на основе найденной информации и включают ссылки на источники.
Можно использовать как готовый сервис или собрать свою версию — код открыт.
Подходит для интеграции в чат-ботов, ассистентов и внутренних инструментов.
git clone https://github.com/mendableai/fireplexity.git
cd fireplexity
npm install
📌 Github
@data_analysis_ml
Media is too big
VIEW IN TELEGRAM
🚀 HeyGen представили Video Agent — "Creative Operating System" для видеопроизводства
Новая платформа автоматизирует весь цикл производства видео,- принцип "замесить и порубить" наконец-то выстрелит.
Как работает:
• Анализирует входные данные (текст, документы, фрагменты роликов, картинки)
• Автоматически находит сюжетную линию и пишет сценарий
• Подбирает кадры или генерирует видеоконтент
• Проводит кастинг виртуальных актёров
• Полный монтаж: темп, движение, субтитры
Применение:
Реклама, TikTok-контент, короткометражки, product demo — любые видеоформаты от идеи до публикации.
По сути, HeyGen полностью берет на себя весь производственный процесс - просто загрузите в него все, что относится к ролику и дальшепечка Heygen сделает все сам.
Студиям и креативным агентствам придется пересмотреть бизнес-модели.📹
А пока можно только записаться в очередь
#HeyGen
———
@tsingular
Новая платформа автоматизирует весь цикл производства видео,- принцип "замесить и порубить" наконец-то выстрелит.
Как работает:
• Анализирует входные данные (текст, документы, фрагменты роликов, картинки)
• Автоматически находит сюжетную линию и пишет сценарий
• Подбирает кадры или генерирует видеоконтент
• Проводит кастинг виртуальных актёров
• Полный монтаж: темп, движение, субтитры
Применение:
Реклама, TikTok-контент, короткометражки, product demo — любые видеоформаты от идеи до публикации.
По сути, HeyGen полностью берет на себя весь производственный процесс - просто загрузите в него все, что относится к ролику и дальше
Студиям и креативным агентствам придется пересмотреть бизнес-модели.
А пока можно только записаться в очередь
#HeyGen
———
@tsingular
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Machinelearning
Please open Telegram to view this post
VIEW IN TELEGRAM
Спасибо что вы есть!
Please open Telegram to view this post
VIEW IN TELEGRAM
Daily Dose of Datascience выпустили детальный обзор по MCP протоколу с примерами.
Годнота на 74 страницы.
Качаем в комментарии.
#DDODS #MCP #обучение
------
@tsingular
Годнота на 74 страницы.
Качаем в комментарии.
#DDODS #MCP #обучение
------
@tsingular
Google выпустил полную версию Gemma 3n с поддержкой аудио и видео
Google представил Gemma 3n - новую мобильную ИИ-модель с мультимодальными возможностями. Ключевые фишки:
• MatFormer архитектура - одна модель содержит несколько размеров (2B и 4B параметров)
• Встроенная обработка аудио до 30 секунд с поддержкой перевода речи
• Новый MobileNet-V5 энкодер для видео - в 13 раз быстрее предыдущей версии
• Оптимизация для мобильных устройств с минимальным использованием памяти
Модель уже поддерживается в Hugging Face, Ollama, llama.cpp и других популярных инструментах. Google запустил конкурс с призовым фондом $150,000 для разработчиков приложений.
Серьёзный шаг к полноценному ИИ прямо в смартфоне без интернета.
1300 Elo score для модели такого размера, - это рекорд!
gemma-3n-E4B-it-MLX-bf16 - всего 17 Гигабайт!
#Gemma3n #OnDeviceAI #Google
------
@tsingular
Google представил Gemma 3n - новую мобильную ИИ-модель с мультимодальными возможностями. Ключевые фишки:
• MatFormer архитектура - одна модель содержит несколько размеров (2B и 4B параметров)
• Встроенная обработка аудио до 30 секунд с поддержкой перевода речи
• Новый MobileNet-V5 энкодер для видео - в 13 раз быстрее предыдущей версии
• Оптимизация для мобильных устройств с минимальным использованием памяти
Модель уже поддерживается в Hugging Face, Ollama, llama.cpp и других популярных инструментах. Google запустил конкурс с призовым фондом $150,000 для разработчиков приложений.
Серьёзный шаг к полноценному ИИ прямо в смартфоне без интернета.
1300 Elo score для модели такого размера, - это рекорд!
gemma-3n-E4B-it-MLX-bf16 - всего 17 Гигабайт!
#Gemma3n #OnDeviceAI #Google
------
@tsingular
Tencent выпустил рассуждающую малую модель Hunyuan-A13B
Tencent представил открытую языковую модель Hunyuan-A13B на основе архитектуры Mixture-of-Experts.
Модель имеет 80 млрд параметров, но активно использует только 13 млрд.
Доступны версии FP8 и INT4. Поддерживается TensorRT-LLM, vLLM и SGLang.
Можно рассмотреть как альтернативу Qwen-3. Чуть лучше по некоторым метрикам.
UPD: а вот они следом выпустили нарезку GPTQ-Int4 на 42 гига.
#MoE #Hunyuan #TencentAI
———
@tsingular
Tencent представил открытую языковую модель Hunyuan-A13B на основе архитектуры Mixture-of-Experts.
Модель имеет 80 млрд параметров, но активно использует только 13 млрд.
Доступны версии FP8 и INT4. Поддерживается TensorRT-LLM, vLLM и SGLang.
Можно рассмотреть как альтернативу Qwen-3. Чуть лучше по некоторым метрикам.
UPD: а вот они следом выпустили нарезку GPTQ-Int4 на 42 гига.
#MoE #Hunyuan #TencentAI
———
@tsingular
Speech Note,- оффлайн комбайн для Linux с поддержкой русского
Полноценный набор инструментов для работы с речью без интернета.
Speech Note умеет распознавать речь в текст, читать текст вслух и переводить между языками.
Ключевые фишки:
- Полностью офлайн работа - никуда не передает данные
- Поддержка русского языка для всех функций
- CLI интерфейс для автоматизации
- Доступен через Flatpak на Flathub
Использует движки Whisper, Coqui TTS, Piper и многие другие.
Модели скачиваются прямо из приложения.
Отличный комбайн, который можно развернуть на сервере и вызывать через CLI тем же n8n.
#STT #TTS #SpeechNote
------
@tsingular
Полноценный набор инструментов для работы с речью без интернета.
Speech Note умеет распознавать речь в текст, читать текст вслух и переводить между языками.
Ключевые фишки:
- Полностью офлайн работа - никуда не передает данные
- Поддержка русского языка для всех функций
- CLI интерфейс для автоматизации
- Доступен через Flatpak на Flathub
Использует движки Whisper, Coqui TTS, Piper и многие другие.
Модели скачиваются прямо из приложения.
Отличный комбайн, который можно развернуть на сервере и вызывать через CLI тем же n8n.
#STT #TTS #SpeechNote
------
@tsingular
OpenAI представила Deep Research API
Новый Deep Research API автоматизирует сложные исследовательские задачи через программный интерфейс.
Агентная модель самостоятельно декомпозирует запросы, проводит веб-поиск и синтезирует результаты в структурированные отчеты с цитатами.
В отличие от ChatGPT, где процесс скрыт, API дает полный контроль над исследованием. Модель планирует подвопросы, использует инструменты поиска и выполнения кода.
Поддержка MCP-инструментов позволяет интегрировать внутренние документы компании в процесс исследования.
Идеально для создания аналитических отчетов, сравнительных исследований и структурированного анализа данных.
#DeepResearch #OpenAI #ResearchAPI
------
@tsingular
Новый Deep Research API автоматизирует сложные исследовательские задачи через программный интерфейс.
Агентная модель самостоятельно декомпозирует запросы, проводит веб-поиск и синтезирует результаты в структурированные отчеты с цитатами.
В отличие от ChatGPT, где процесс скрыт, API дает полный контроль над исследованием. Модель планирует подвопросы, использует инструменты поиска и выполнения кода.
Поддержка MCP-инструментов позволяет интегрировать внутренние документы компании в процесс исследования.
Идеально для создания аналитических отчетов, сравнительных исследований и структурированного анализа данных.
#DeepResearch #OpenAI #ResearchAPI
------
@tsingular
Иран запустил программу обучения ИИ для 2 миллионов школьников
Стартовала национальная программа Iran Digital - бесплатное обучение искусственному интеллекту для 2 миллионов учеников средних классов и 1000 учителей.
Программа включает практические проекты и игровую интерактивную платформу с соревнованиями и призами. Лучшие участники получат доступ к продвинутым курсам и стажировкам.
Цель - подготовить студентов к будущему рынку труда, развить критическое мышление и цифровую грамотность. Эксперты подчеркивают важность этичного использования ИИ в образовании как дополнения, а не замены человеческого фактора.
Иран активно развивает применение ИИ в образовании после конференции в Тегеране в октябре 2024 года.
#Education #Иран
------
@tsingular
Стартовала национальная программа Iran Digital - бесплатное обучение искусственному интеллекту для 2 миллионов учеников средних классов и 1000 учителей.
Программа включает практические проекты и игровую интерактивную платформу с соревнованиями и призами. Лучшие участники получат доступ к продвинутым курсам и стажировкам.
Цель - подготовить студентов к будущему рынку труда, развить критическое мышление и цифровую грамотность. Эксперты подчеркивают важность этичного использования ИИ в образовании как дополнения, а не замены человеческого фактора.
Иран активно развивает применение ИИ в образовании после конференции в Тегеране в октябре 2024 года.
#Education #Иран
------
@tsingular
Google выпустили инструкцию как с ADK можно создать ИИ-агента с инструментами
Google опубликовала детальное пошаговое руководство по созданию ИИ-агента с помощью Agent Development Kit (ADK).
В примере показали как создать бот-помощника для обработки багов с 5 типами инструментов.
Встроенные функции для расчетов, интеграция с LangChain и StackOverflow, подключение к GitHub через протокол MCP (Model Context Protocol) от Anthropic, работа с базами данных через MCP Toolbox.
Агент работает на Gemini 2.5 Flash и может создавать тикеты, искать баги, анализировать CVE и подключаться к внешним API.
Пример развернут на Google Cloud на Cloud Run и Cloud SQL, но как инструкцию полезно почитать и дальше использовать на любой платформе.
#Google #ADK #Agents #MCP
———
@tsingular
Google опубликовала детальное пошаговое руководство по созданию ИИ-агента с помощью Agent Development Kit (ADK).
В примере показали как создать бот-помощника для обработки багов с 5 типами инструментов.
Встроенные функции для расчетов, интеграция с LangChain и StackOverflow, подключение к GitHub через протокол MCP (Model Context Protocol) от Anthropic, работа с базами данных через MCP Toolbox.
Агент работает на Gemini 2.5 Flash и может создавать тикеты, искать баги, анализировать CVE и подключаться к внешним API.
Пример развернут на Google Cloud на Cloud Run и Cloud SQL, но как инструкцию полезно почитать и дальше использовать на любой платформе.
#Google #ADK #Agents #MCP
———
@tsingular
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 Seedance 1.0: ByteDance выпустил видеогенератор, который обошел всех на Artificial Analysis
ByteDance (разрабы ТикТока) представили Seedance 1.0 — модель генерации видео, которая заняла первое место в лидербордах Artificial Analysis как в text-to-video, так и в image-to-video категориях, обогнав Veo 3, Kling 2.0 и Sora.
Ключевые технические улучшения:
- Архитектура с разделенными пространственными и временными слоями — нативно поддерживает мультисценовую генерацию
- 10× ускорение инференса через многоступенчатую дистилляцию
- Генерация 5-секундного 1080p видео занимает 41.4 секунды на NVIDIA L20
- Единая модель для T2V и I2V задач
Что выделяет Seedance:
- Мультиаспектное повествование — создает последовательные кадры с сохранением персонажей и стиля (shot-reverse shot, match cuts)
- Точное следование промптам в сложных сценах с несколькими объектами
- Поддержка разнообразных стилей: от фотореализма до киберпанка и аниме
- Двуязычность (китайский/английский)
Модель уже интегрирована в Doubao и Jimeng — сервисы ByteDance для видеогенерации.
Интересная деталь: в посттренинге использовали RLHF с тремя специализированными reward-моделями (основная, движение, эстетика), что позволило улучшить все аспекты генерации одновременно .
Попробовать можно тут
(Нужен китайский номер)
#Seedance #ByteDance #нейрорендер
———
@tsingular
ByteDance (разрабы ТикТока) представили Seedance 1.0 — модель генерации видео, которая заняла первое место в лидербордах Artificial Analysis как в text-to-video, так и в image-to-video категориях, обогнав Veo 3, Kling 2.0 и Sora.
Ключевые технические улучшения:
- Архитектура с разделенными пространственными и временными слоями — нативно поддерживает мультисценовую генерацию
- 10× ускорение инференса через многоступенчатую дистилляцию
- Генерация 5-секундного 1080p видео занимает 41.4 секунды на NVIDIA L20
- Единая модель для T2V и I2V задач
Что выделяет Seedance:
- Мультиаспектное повествование — создает последовательные кадры с сохранением персонажей и стиля (shot-reverse shot, match cuts)
- Точное следование промптам в сложных сценах с несколькими объектами
- Поддержка разнообразных стилей: от фотореализма до киберпанка и аниме
- Двуязычность (китайский/английский)
Модель уже интегрирована в Doubao и Jimeng — сервисы ByteDance для видеогенерации.
Интересная деталь: в посттренинге использовали RLHF с тремя специализированными reward-моделями (основная, движение, эстетика), что позволило улучшить все аспекты генерации одновременно .
Попробовать можно тут
(Нужен китайский номер)
#Seedance #ByteDance #нейрорендер
———
@tsingular
This media is not supported in your browser
VIEW IN TELEGRAM
Windows MCP: ИИ-агенты теперь могут управлять Windows
Появился легковесный MCP-сервер для интеграции ИИ с операционной системой Windows.
Позволяет любым LLM (включая Claude) напрямую управлять Windows: открывать приложения, кликать по интерфейсу, имитировать пользовательский ввод, проводить QA-тестирование.
Главная фишка - работает с любой языковой моделью без компьютерного зрения или специального обучения. Задержка между действиями всего 1.5-2.3 секунды.
Проект с открытым исходным кодом под MIT лицензией. Интегрируется с Claude Desktop через расширения.
#MCP #Windows #Agents
------
@tsingular
Появился легковесный MCP-сервер для интеграции ИИ с операционной системой Windows.
Позволяет любым LLM (включая Claude) напрямую управлять Windows: открывать приложения, кликать по интерфейсу, имитировать пользовательский ввод, проводить QA-тестирование.
Главная фишка - работает с любой языковой моделью без компьютерного зрения или специального обучения. Задержка между действиями всего 1.5-2.3 секунды.
Проект с открытым исходным кодом под MIT лицензией. Интегрируется с Claude Desktop через расширения.
#MCP #Windows #Agents
------
@tsingular
По следам демо на GigaConf - ИСХОДНИК СХЕМЫ для n8n
Не забудьте поднять gpt2giga
В каждом вызове инструмента календаря Яндекса нужно отдельно прописать креды, которые создаются в профиле Яндекса - пароли приложений.
В модулях Transcribe и Generate Speech - креды от SaluteSpeech, соответственно.
#demo #n8n #dev #Яндекс
———
@tsingular
Не забудьте поднять gpt2giga
В каждом вызове инструмента календаря Яндекса нужно отдельно прописать креды, которые создаются в профиле Яндекса - пароли приложений.
В модулях Transcribe и Generate Speech - креды от SaluteSpeech, соответственно.
#demo #n8n #dev #Яндекс
———
@tsingular
OpenAI переходит с чипов NVIDIA на Google TPU
По данным The Information, OpenAI начала использовать тензорные процессоры Google TPU вместо GPU NVIDIA для работы ChatGPT и других AI-продуктов.
Основная причина — снижение операционных расходов. Высокие цены и дефицит GPU от NVIDIA открывают возможности для альтернативных решений.
Google активно предлагает свои TPU облачным провайдерам, что может серьезно ударить по почти монопольному положению NVIDIA в сфере высокопроизводительных AI-чипов.
Интересно, что Apple тоже использовала Google TPU для обучения Apple Intelligence, что показывает растущую популярность альтернативы чипам NVIDIA.
#OpenAI #GoogleTPU #NVIDIA
------
@tsingular
По данным The Information, OpenAI начала использовать тензорные процессоры Google TPU вместо GPU NVIDIA для работы ChatGPT и других AI-продуктов.
Основная причина — снижение операционных расходов. Высокие цены и дефицит GPU от NVIDIA открывают возможности для альтернативных решений.
Google активно предлагает свои TPU облачным провайдерам, что может серьезно ударить по почти монопольному положению NVIDIA в сфере высокопроизводительных AI-чипов.
Интересно, что Apple тоже использовала Google TPU для обучения Apple Intelligence, что показывает растущую популярность альтернативы чипам NVIDIA.
#OpenAI #GoogleTPU #NVIDIA
------
@tsingular