🐙 TruLens - Инструмент для глубокого анализа LLM-приложений. Проект предлагает целую экосистему для отслеживания работы всех компонентов LLM-стека — от промптов до ретриверов.
Недавно в систему добавили концепцию RAG Triad, позволяющая оценивать релевантность, groundedness и полезность ответов. В отличие от поверхностных проверок, TruLens даёт возможность выявлять системные проблемы: например, когда модель генерирует правдоподобные, но оторванные от контекста ответы.
🤖 GitHub
@bigdatai
Недавно в систему добавили концепцию RAG Triad, позволяющая оценивать релевантность, groundedness и полезность ответов. В отличие от поверхностных проверок, TruLens даёт возможность выявлять системные проблемы: например, когда модель генерирует правдоподобные, но оторванные от контекста ответы.
🤖 GitHub
@bigdatai
Forwarded from Machinelearning
Deep Cogito выпустила семейство языковых моделей размером 3B, 8B, 14B, 32B и 70B параметров, которые уже доступны для загрузки.
По заявлению разработчиков, их модели превосходят аналогичные открытые решения от LLaMA, DeepSeek и Qwen в большинстве стандартных бенчмарков. Например, 70B-версия обходит новую 109B MoE-модель Llama 4, несмотря на меньший размер.
Все модели обучены с помощью метода Iterated Distillation and Amplification (IDA) — стратегии, которая сочетает итеративное самоулучшение и «сжатие» интеллекта для преодоления ограничений, накладываемых человеческим контролем.
Суть IDA проста: сначала модель «усиливает» свои способности, тратя больше вычислительных ресурсов на поиск решений через CoT, а затем «дистиллирует» эти улучшения в свои параметры. Такой цикл повторяется, создавая петлю обратной связи — каждая итерация делает модель умнее, а её мышление эффективнее. По словам команды, этот подход не только масштабируем, но и быстрее, чем RLHF.
Семейство поддерживает 2 режима работы: стандартный (прямой ответ) и «рефлексивный», где система сначала обдумывает запрос, как это реализовано в Claude 3.7. Они оптимизированы для программирования, вызова функций и агентских сценариев, но без акцента на CoT — разработчики считают, что короткие шаги эффективнее в реальных задачах.
Уже в ближайшие месяцы ожидаются версии на 109B, 400B и 671B параметров и вариации с MoE-архитектурой.
Модели доступны на Hugging Face, Ollama и через API Fireworks AI/Together AI.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
📒 TabNet — революционный подход к работе с табличными данными. Этот проект предлагает уникальную реализацию нейросетевой архитектуры TabNet на PyTorch, специально разработанной для эффективного анализа табличных данных.
Проект поддерживает все основные типы ML-задач: от бинарной классификации до мультитаргетной регрессии, а его интеграция с scikit-learn делает работу интуитивно понятной даже для новичков.
📌 GitHub
@bigdatai
Проект поддерживает все основные типы ML-задач: от бинарной классификации до мультитаргетной регрессии, а его интеграция с scikit-learn делает работу интуитивно понятной даже для новичков.
📌 GitHub
@bigdatai
ИИ-помощники и гибридное облако с ИИ: главные анонсы конференции GoCloud от провайдера Cloud.ru
1. Cloud.ru Evolution AI Factory, цифровая платформа для создания AI-приложений и агентов в облаке. Платформа ускоряет разработку AI-агентов, упрощает их внедрение, снижает инфраструктурные затраты и помогает быстрее выводить продукты на рынок.
2. Cloud.ru Evolution Stack AI-bundle, первое в России гибридное облако с поддержкой искусственного интеллекта. Платформа ускорит внедрение решений на основе ИИ, поможет решать AI-задачи в гибридном сценарии: например, обучать модели в публичном облаке, а инференс выполнять в частном контуре клиента.
По словам СЕО Cloud.ru Евгения Колбина, скоро в облачной платформе Cloud.ru Evolution появится бесплатный AI-помощник.
«Мы планируем, что к 2026 году AI-помощники будут выполнять большинство задач в частотных сценариях работы в облаке. Это кардинально изменит опыт пользователей при работе с облачными продуктами. С момента запуска AI-помощники будут доступны в публичных, гибридных и частных облаках Cloud.ru», — добавил Евгений Колбин.
1. Cloud.ru Evolution AI Factory, цифровая платформа для создания AI-приложений и агентов в облаке. Платформа ускоряет разработку AI-агентов, упрощает их внедрение, снижает инфраструктурные затраты и помогает быстрее выводить продукты на рынок.
2. Cloud.ru Evolution Stack AI-bundle, первое в России гибридное облако с поддержкой искусственного интеллекта. Платформа ускорит внедрение решений на основе ИИ, поможет решать AI-задачи в гибридном сценарии: например, обучать модели в публичном облаке, а инференс выполнять в частном контуре клиента.
По словам СЕО Cloud.ru Евгения Колбина, скоро в облачной платформе Cloud.ru Evolution появится бесплатный AI-помощник.
«Мы планируем, что к 2026 году AI-помощники будут выполнять большинство задач в частотных сценариях работы в облаке. Это кардинально изменит опыт пользователей при работе с облачными продуктами. С момента запуска AI-помощники будут доступны в публичных, гибридных и частных облаках Cloud.ru», — добавил Евгений Колбин.
Forwarded from Machinelearning
Google анонсировала запуск тестовой программы новых геопространственных и Population Dynamics моделей.
Эти инструменты объединяют генеративный ИИ (под капотом - Gemini), с данными спутниковых снимков и социальными индексами, чтобы ускорить анализ в сферах урбанистики, экологии и кризисного управления.
Модели позволяют находить объекты по описанию («дороги с заторами»), сегментировать ландшафты и предсказывать динамику населения. Интеграция с Google Cloud и Earth Engine дает разработчикам возможность для создания собственных решений — от медиапланирования до мониторинга сельхозугодий.
Первыми тестерами стали Airbus, Maxar и Planet Labs: они используют модели для анализа спутниковых данных в реальном времени. Сейчас доступ к моделям открыт через программу Trusted Tester, а детали Google обещает раскрыть в ближайшие месяцы.
🔗 research.google
@ai_machinelearning_big_data
#google #geospatialreasoning
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
📦 ML Crate — структурированная песочница для ML-экспериментов. Проект предлагает начинающим чёткий шаблон для своих работ: от датасетов и Jupyter-ноутбуков до готовых веб-приложений на Flask/Streamlit.
Проект предлагает начинающим чёткий шаблон для своих работ: от датасетов и Jupyter-ноутбуков до готовых веб-приложений на Flask/Streamlit.
Важно, что репозиторий не просто хранит код, а учит правильному workflow:
▪️отдельные папки для данных, визуализаций и моделей
◾️обязательные requirements.txt и README-файлы
🔗 GitHub
@bigdatai
Проект предлагает начинающим чёткий шаблон для своих работ: от датасетов и Jupyter-ноутбуков до готовых веб-приложений на Flask/Streamlit.
Важно, что репозиторий не просто хранит код, а учит правильному workflow:
▪️отдельные папки для данных, визуализаций и моделей
◾️обязательные requirements.txt и README-файлы
🔗 GitHub
@bigdatai
This media is not supported in your browser
VIEW IN TELEGRAM
Новая технология от Hunyuan, превращающая статичные изображения в реалистичную анимацию с беспрецедентной чёткостью и стабильностью!
🆕 Что нового?
1⃣ Статичное изображение превращается → живое видео
2⃣ Невероятная реалистичность: Implicit Control + Stable Video Diffusion
3⃣ Плавность и сверхчёткая детализация в анимации лица и головы
Легко адаптируется под любые стили изображений.
Анимация создается по одному фото, нужен только видео-референс в качестве шаблона для генерации.
✅ Работает в один клик
✅ Синхронные мимика и движения головы
✅ Сохраняется черте даже при смене стиля
#Hunyuan
Please open Telegram to view this post
VIEW IN TELEGRAM
📌 Kor — прототип для извлечения структуры из текста через LLM
Проект имеет интеграцию с LangChain, но предлагает свой подход: вместо JSON-режима или function calling он полагается на шаблонизацию промптов. Это позволяет работать даже с моделями, не поддерживающими новые режимы вроде GPT-4-turbo.
Новая версия 1.0.0 принесла совместимость с Pydantic v2, хотя разработчики предупреждают, что работа может заметно замедлиться
🤖 GitHub
@bigdatai
Проект имеет интеграцию с LangChain, но предлагает свой подход: вместо JSON-режима или function calling он полагается на шаблонизацию промптов. Это позволяет работать даже с моделями, не поддерживающими новые режимы вроде GPT-4-turbo.
Новая версия 1.0.0 принесла совместимость с Pydantic v2, хотя разработчики предупреждают, что работа может заметно замедлиться
🤖 GitHub
@bigdatai
Вы когда-нибудь хотели сделать свою собственную систему рекомендаций фильмов? 🎬
Приходите на бесплатный вебинар, где Савелий Батурин, Senior ML-Engineer и преподаватель курса по ML школы Simulative в прямом эфире покажет как построить рекомендательную систему фильмов на Kaggle.
Что будем делать на вебинаре:
Вебинар будет интересен как новичкам, так и уже опытным специалистам
Please open Telegram to view this post
VIEW IN TELEGRAM
👾 Griptape — фреймворк для создания AI-приложений без головной боли. В отличие от популярных решений вроде LangChain, акцент сделан на модульность: можно легко менять провайдеров LLM, векторных БД или инструментов поиска, не переписывая бизнес-логику.
В инструменте есть встроенные механизмы для работы с памятью и готовые движки для частых задач: суммаризации, извлечения структурированных данных и даже оценки качества ответов моделей.
🤖 GitHub
@bigdata_ai
В инструменте есть встроенные механизмы для работы с памятью и готовые движки для частых задач: суммаризации, извлечения структурированных данных и даже оценки качества ответов моделей.
🤖 GitHub
@bigdata_ai
Википедия представила структурированный датасет на платформе Kaggle, чтобы облегчить разработчикам ИИ доступ к данным и снизить нагрузку на свою инфраструктуру. Вместо парсинга сырого текста ботамы, теперь доступны JSON-файлы на английском и французском языках с разделами статей, краткими описаниями, инфобоксами и ссылками на изображения.
Датасет оптимизирован для ML-задач: файнтюна моделей, анализа и тестирования. Это часть стратегии Викимедии, которая не только экономит ресурсы Википедии, но и упрощает работу с контентом — вместо борьбы с ботами разработчики получают готовый инструмент.
enterprise.wikimedia.com
Please open Telegram to view this post
VIEW IN TELEGRAM
🧪 Ragas — инструмент для объективной оценки LLM-приложений.
Платформа предлагает data-driven подход к тестированию языковых моделей, заменяя субъективные оценки точными метриками. С помощью Ragas можно не только анализировать качество ответов, но и автоматически генерировать тестовые датасеты, приближенные к реальным сценариям использования.
Проект выделяется глубокой интеграцией с популярными фреймворками — от LangChain до инструментов мониторинга. Особенно полезен при построении RAG-систем, где важен постоянный контроль качества на основе production-данных.
🤖 GitHub
@bigdatai
Платформа предлагает data-driven подход к тестированию языковых моделей, заменяя субъективные оценки точными метриками. С помощью Ragas можно не только анализировать качество ответов, но и автоматически генерировать тестовые датасеты, приближенные к реальным сценариям использования.
Проект выделяется глубокой интеграцией с популярными фреймворками — от LangChain до инструментов мониторинга. Особенно полезен при построении RAG-систем, где важен постоянный контроль качества на основе production-данных.
🤖 GitHub
@bigdatai
📂 Dot — локальный чат с документами на базе Phi-3.5. Этот проект выделяется на фоне корпоративных решений вроде Chat with RTX от Nvidia своей простотой и доступностью.
Разработанный студентом как side-проект, Dot предлагает минималистичный интерфейс для не-программистов, но при этом сохраняет всю мощь современных RAG-технологий под капотом.
Особенности:
▪️Готовые сборки для Windows и macOS
▪️Поддержка мультидокументных запросов
▪️Режим обычного чата без привязки к файлам
🔗 GitHub
@bigdatai
Разработанный студентом как side-проект, Dot предлагает минималистичный интерфейс для не-программистов, но при этом сохраняет всю мощь современных RAG-технологий под капотом.
Особенности:
▪️Готовые сборки для Windows и macOS
▪️Поддержка мультидокументных запросов
▪️Режим обычного чата без привязки к файлам
🔗 GitHub
@bigdatai
@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM