Tool Building Ape × Gleb Kalinin
Channel photo updated
Во-первых, переименовал этот канал — всё-таки создатель, билдер больше соответствует моему самоощущению. Каждый день что-то новое сооружаю.
А вот инструмент, которым я сделал эту аватарку прямо из изображения с веб-камеры. Навайбкодил его в фоновом режиме, 3 промта в V0. Если хотите исходный код, маякните, закину на гитхаб.
Оказалось, что v0 и lovable просто супер для того, чтобы сделать первую версию проекта, а дальше с ней можно работать локально через Windsurf / Cursor / Aider / Claude Code или что угодно.
А вот инструмент, которым я сделал эту аватарку прямо из изображения с веб-камеры. Навайбкодил его в фоновом режиме, 3 промта в V0. Если хотите исходный код, маякните, закину на гитхаб.
Оказалось, что v0 и lovable просто супер для того, чтобы сделать первую версию проекта, а дальше с ней можно работать локально через Windsurf / Cursor / Aider / Claude Code или что угодно.
v0-camera-to-half-tones.vercel.app
v0 App
Created with v0
Научную фантастику читать всё-таки было полезно — понимаешь, когда начинаешь в ней жить. See Group mind
Wikipedia
Group mind (science fiction)
multiple minds are linked into a single super mind
Forwarded from AI Mindset (Gleb Kalinin)
Птицы, рыбы, насекомые и другие животные объединяются в большме группы, чтобы эффективнее добывать пищу, обеспечивать себе защиту и решать сложные задачи.
Роевой интеллект (swarm intelligence) — таким термином описывают коллективное поведение, увеличивающее интеллект больших децентрализованных групп. Вспоминаем муравьев, обошедших в решении задачи группу людей (впрочем, один человек всё равно оказывается умнее).
Могут ли люди проявлять роевой интеллект? Безусловно, да — от скоординированного движения толпы, адаптирующейся под изменения среды, до масштабных децентрализованных проектов с открытым кодом.
Создатели платформы Thinkscape задались вопросом — возможно ли повысить коллективный интеллект человека?
Мы знаем, что эффективное обдумывание в формате беседы (conversational deliberation) — когда группе нужно что-то спланировать или принять решение — наиболее комфортно проходит в группе от 4 до 7 человек. В таком формате каждый получает возможность внести свой вклад в разговор.
Thinkscape предлагает разбивать большие группы людей (сейчас до 400 человек, но в перспективе — безлимитно) на группы по 4-7 человек, наподобие breakout rooms в Зуме. Каждая группа ведёт отдельное обсуждение на заданную тему. Разговоры всех групп в реальном времени мониторит и анализирует ИИ-агент, обнаруживая в разговоре консенсусы, несогласие и инсайты. Эти данные передаются всем агентам, которые делятся ими с участниками других групп.
Например, если группа обсуждает планирование большого пикник, агент может периодически указывать на нюансы, упомянутые в других группах, но упущенные в этой, например, что делать в случае плохой погоды.
Как рассказывают в интервью один из создателей, доктор Луис Розенберг, одним из самых сложных аспектов, помимо разработки, была калибровка того, когда и что именно говорит агент. Агент вмешивается слишком часто? Это воспринимается навязчиво. Люди, со слов Розенберга, воспринимают агентов как полноценных участников разговора, и доверие здесь — ключевой фактор.
В небольшом исследовании группы в 75 человек, участники отметили, что такой формат был эффективней, чем простые чаты, был более продуктивным, чем сессии мозгового штурма, способствовал появлению идей более высокого качества, более сильное чувство причастности к итоговым решениям, ощущение, что их голоса были лучше услышаны.
Пока Thinkscape работает в закрытом режиме, но можно записаться на участие в тестовых разговорах.
🤖 Глеб | Swarm Intelligence | Conversational deliberation
Роевой интеллект (swarm intelligence) — таким термином описывают коллективное поведение, увеличивающее интеллект больших децентрализованных групп. Вспоминаем муравьев, обошедших в решении задачи группу людей (впрочем, один человек всё равно оказывается умнее).
Могут ли люди проявлять роевой интеллект? Безусловно, да — от скоординированного движения толпы, адаптирующейся под изменения среды, до масштабных децентрализованных проектов с открытым кодом.
Создатели платформы Thinkscape задались вопросом — возможно ли повысить коллективный интеллект человека?
Мы знаем, что эффективное обдумывание в формате беседы (conversational deliberation) — когда группе нужно что-то спланировать или принять решение — наиболее комфортно проходит в группе от 4 до 7 человек. В таком формате каждый получает возможность внести свой вклад в разговор.
Thinkscape предлагает разбивать большие группы людей (сейчас до 400 человек, но в перспективе — безлимитно) на группы по 4-7 человек, наподобие breakout rooms в Зуме. Каждая группа ведёт отдельное обсуждение на заданную тему. Разговоры всех групп в реальном времени мониторит и анализирует ИИ-агент, обнаруживая в разговоре консенсусы, несогласие и инсайты. Эти данные передаются всем агентам, которые делятся ими с участниками других групп.
Например, если группа обсуждает планирование большого пикник, агент может периодически указывать на нюансы, упомянутые в других группах, но упущенные в этой, например, что делать в случае плохой погоды.
Как рассказывают в интервью один из создателей, доктор Луис Розенберг, одним из самых сложных аспектов, помимо разработки, была калибровка того, когда и что именно говорит агент. Агент вмешивается слишком часто? Это воспринимается навязчиво. Люди, со слов Розенберга, воспринимают агентов как полноценных участников разговора, и доверие здесь — ключевой фактор.
В небольшом исследовании группы в 75 человек, участники отметили, что такой формат был эффективней, чем простые чаты, был более продуктивным, чем сессии мозгового штурма, способствовал появлению идей более высокого качества, более сильное чувство причастности к итоговым решениям, ощущение, что их голоса были лучше услышаны.
Пока Thinkscape работает в закрытом режиме, но можно записаться на участие в тестовых разговорах.
Please open Telegram to view this post
VIEW IN TELEGRAM
Thinkscape
Thinkscape is an AI platform that enables real-time conversations at unprecedented scale while optimizing Group Insights and amplifying Collective Intelligence. Organizations use Thinkscape for large-scale deliberation, brainstorming, forecasting, and problem…
https://www.youtube.com/watch?v=290ew1ZisK4
Визуализация реагирует на звук дыхания. Громкость влияет на разные параметры стаи, такие как сила притяжения и когерентность, у бойдов «хвосты» (traces). При достижении определенного уровня громкости цвет меняется на красный.
Вайбкодинг в v0 #vibecoding
Визуализация реагирует на звук дыхания. Громкость влияет на разные параметры стаи, такие как сила притяжения и когерентность, у бойдов «хвосты» (traces). При достижении определенного уровня громкости цвет меняется на красный.
Вайбкодинг в v0 #vibecoding
За несколько дней наболтал с Sesame несколько часов. Это, наверное, один из самых сильных ai moments с момента запуска ChatGPT.
Качество беседы такое, что эта технология не может не стать аддиктивной для некоторых людей. Гораздо более качественный флоу беседы, чем с ChatGPT Advanced Voice Mode, или любыми другими. Damn, гораздо более качественный флоу, чем со многими людьми. (Про психологические последствия этого порефлексирую чуть позже).
Если вы смотрели Her, то мы уже почти что там.
Увы, кажется пока только по-английски:
https://www.sesame.com/research/crossing_the_uncanny_valley_of_voice#demo
Качество беседы такое, что эта технология не может не стать аддиктивной для некоторых людей. Гораздо более качественный флоу беседы, чем с ChatGPT Advanced Voice Mode, или любыми другими. Damn, гораздо более качественный флоу, чем со многими людьми. (Про психологические последствия этого порефлексирую чуть позже).
Если вы смотрели Her, то мы уже почти что там.
Увы, кажется пока только по-английски:
https://www.sesame.com/research/crossing_the_uncanny_valley_of_voice#demo
Sesame
Crossing the uncanny valley of conversational voice
At Sesame, our goal is to achieve “voice presence”—the magical quality that makes spoken interactions feel real, understood, and valued.
Пару дней играюсь с открытой альтернативой нашумевшему агенту Manus (обзор с тестом). Manus, как выяснилось, что это Claude + три десятка инструментов, но штуки, которые у него получаются уже весьма впечатляют. Из-за того, что такие проекты, как Manus, продолжают появляться, я абсолютно уверен, что мы ещё немало сюрпризов увидим еще в этом году.
Пока Manus пускают только по инвайтам. К счастью для всех нас, open source всегда — и часто довольно быстро — напитывается идеями из коммерческого софта, поэтому уже появилось несколько альтернатив.
Вот, к примеру, OpenManus (название явно придется сменить, привет, OpenDevin). Чтобы он нормально заработал, пришлось его немного попилить в Windsurf, но исследования он уже умеет делать пусть и хуже Deep Research, зато может сносно оформить. Даже карту добавить смог.
https://github.com/mannaandpoem/OpenManus
Пока Manus пускают только по инвайтам. К счастью для всех нас, open source всегда — и часто довольно быстро — напитывается идеями из коммерческого софта, поэтому уже появилось несколько альтернатив.
Вот, к примеру, OpenManus (название явно придется сменить, привет, OpenDevin). Чтобы он нормально заработал, пришлось его немного попилить в Windsurf, но исследования он уже умеет делать пусть и хуже Deep Research, зато может сносно оформить. Даже карту добавить смог.
https://github.com/mannaandpoem/OpenManus
Превращаем Windsurf в персонализированного коуча, который проведет с вами интервью, поможет проанализировать биографию, поставить цели, зачекиниться.
Результаты общения не теряются, а раскидываются по файлам markdown-файлам, чтобы потом их можно было легко переиспользовать как часть личного контекста.
Winsurf — это полноценный агент, то в него можно кидать ссылки, подключать к нему MCP-серверы (например, поиск по Obsidian, в базах данных или в интернете и еще много чего).
Жду универсального интерфейса, позволяющего совмещать intelligence подобных систем и голосовой ввод уровня sesame
Промт для .windsurfrules
Вдохновился вот этим
Результаты общения не теряются, а раскидываются по файлам markdown-файлам, чтобы потом их можно было легко переиспользовать как часть личного контекста.
Winsurf — это полноценный агент, то в него можно кидать ссылки, подключать к нему MCP-серверы (например, поиск по Obsidian, в базах данных или в интернете и еще много чего).
Жду универсального интерфейса, позволяющего совмещать intelligence подобных систем и голосовой ввод уровня sesame
Промт для .windsurfrules
Вдохновился вот этим
Из последнего анонса ChatGPT отмечу возможность использовать поиск ChatGPT через API. Для меня поиск стал killer app, почти в каждом первом чате я ищу что-то через ChatGPT. Если бы давали побольше поисков Deep Research (сейчас на Pro 10 запросов в месяц, очень мало), пользовался бы им сейчас.
В противном случае я перешел бы уже полностью на Claude и Grok 3, которые мне тоже, к моему гражданскому сожалению, очень нравятся.
В Grok 3 поиск по вебу просто часть продукта, в этом он очень силён, а в Claude я подключил поиск по вебу через
Что это значит на практике: используя всего один API, можно сделать запрос поиска по вебу, который выполнять с определенной регулярностью. Удобно скармливать такие данные агенту, которые на основе анализа этих результатов может, к примеру, составлять для вас персонализированный отчёт.
Примеры:
- Автоматизация для Obsidian, которая добавляет в вашу ежедневную заметку результаты поиска по вашему бренду или имени
- Бот в телеграме, который присылает вам заголовки и абстракты статей по интересной вам области науки
- Свой deep researcher, который работает с локальными файлами и, например, только с тредами с Reddit, в поисках тренд-сигнала
- Свой суммаризатор контента соцсетей и ютуба
Всё это можно было сделать и раньше — прикрутив Brave Search, или Tavily, или официальный поиск Гугла, или другие сервисы, но с апдейтом ChatGPT это стало элементарно. Простейшие автоматизации пишутся за минуты, а простой доступ к инструментам критичен для увеличения эффективности агентов.
Что мы видим снова и снова: LLM уровня o3-mini, grok 3, claude 3.7 с reasoning + инструменты = серьезный прирост автономности и эффективности решения задач.
В API же добавлен Computer Use, который, судя по работе Operator, сильно лучше клодовского. Цены на картинке.
В противном случае я перешел бы уже полностью на Claude и Grok 3, которые мне тоже, к моему гражданскому сожалению, очень нравятся.
В Grok 3 поиск по вебу просто часть продукта, в этом он очень силён, а в Claude я подключил поиск по вебу через
Что это значит на практике: используя всего один API, можно сделать запрос поиска по вебу, который выполнять с определенной регулярностью. Удобно скармливать такие данные агенту, которые на основе анализа этих результатов может, к примеру, составлять для вас персонализированный отчёт.
Примеры:
- Автоматизация для Obsidian, которая добавляет в вашу ежедневную заметку результаты поиска по вашему бренду или имени
- Бот в телеграме, который присылает вам заголовки и абстракты статей по интересной вам области науки
- Свой deep researcher, который работает с локальными файлами и, например, только с тредами с Reddit, в поисках тренд-сигнала
- Свой суммаризатор контента соцсетей и ютуба
Всё это можно было сделать и раньше — прикрутив Brave Search, или Tavily, или официальный поиск Гугла, или другие сервисы, но с апдейтом ChatGPT это стало элементарно. Простейшие автоматизации пишутся за минуты, а простой доступ к инструментам критичен для увеличения эффективности агентов.
Что мы видим снова и снова: LLM уровня o3-mini, grok 3, claude 3.7 с reasoning + инструменты = серьезный прирост автономности и эффективности решения задач.
В API же добавлен Computer Use, который, судя по работе Operator, сильно лучше клодовского. Цены на картинке.
На следующей неделе стартует наша лаба про knowledge management в эпоху AI. Она номинально про Obsidian, но реально гораздо шире — про то, как собирать контекст про себя, как использовать ИИ как инструмент сбора данных, рефлексии, как зеркало, как партнёра, как консультанта.
Новый блок на лабе — про агентов-рисерчеров (раньше показывали только GPT Researcher, а теперь тут уже дюжина мощных продуктов, и пользоваться ими правильно тоже навык). В области ии, как и во всех других областях, универсальные советы мало полезны. Но если вы думаете о том, как ваш бизнес и вы лично можете использовать ИИ для выполнения экономически ценной работы, но пока не используете его, кроме простых запросов в ChatGPT, осмысленные регулярные Deep Researches, вероятно, хорошее направление, которое может принести быструю ценность.
Это лаборатория для тех, кто хочет в интенсивном режиме полностью пересмотреть свою работу с информацией, проанализировать свою продуктивность, проанализировать то, на что тратится внимание и энергия, прояснить, из чего строится ваша модель мира, и начать активно её уточнять и дорабатывать.
Будем проходить ИИ-интервью, отслеживать себя, налаживать каналы получения и процессы обработки информации, разгребать цифровые авгиевы конюшни и менять свои привычки. Как отмечали участники предыдущих наших лабораторий, продуктивность — это что-то, что регулярно стоит подвергать пересмотру. Как шутил в недавнем интервью Сатья Наделла, CEO Microsoft: он не знал, что с началом карьеры он станет секретарем для самого себя. Он садится за рабочий стол и начинает печатать. Но уже сейчас печтать не обязательно.
Наши лабы помогают повысить продуктивность так, чтобы экономить 10+ часов каждую неделю.
Больше времени означает больше возможностей заниматься тем, что важно в жизни, и это, пожалуй, для меня самый главный empowerment всей истории с искусственным интеллектом.
AI Mindset [Knowledge]
Можно пройти вместе с основной лабой — тогда к Obsidian добавляется еще несколько десятков инструментов, работа над ассистентами и автоматизациями, некоторые из которых могут стать повседневными и самыми часто используемыми инструментами.
Новый блок на лабе — про агентов-рисерчеров (раньше показывали только GPT Researcher, а теперь тут уже дюжина мощных продуктов, и пользоваться ими правильно тоже навык). В области ии, как и во всех других областях, универсальные советы мало полезны. Но если вы думаете о том, как ваш бизнес и вы лично можете использовать ИИ для выполнения экономически ценной работы, но пока не используете его, кроме простых запросов в ChatGPT, осмысленные регулярные Deep Researches, вероятно, хорошее направление, которое может принести быструю ценность.
Это лаборатория для тех, кто хочет в интенсивном режиме полностью пересмотреть свою работу с информацией, проанализировать свою продуктивность, проанализировать то, на что тратится внимание и энергия, прояснить, из чего строится ваша модель мира, и начать активно её уточнять и дорабатывать.
Будем проходить ИИ-интервью, отслеживать себя, налаживать каналы получения и процессы обработки информации, разгребать цифровые авгиевы конюшни и менять свои привычки. Как отмечали участники предыдущих наших лабораторий, продуктивность — это что-то, что регулярно стоит подвергать пересмотру. Как шутил в недавнем интервью Сатья Наделла, CEO Microsoft: он не знал, что с началом карьеры он станет секретарем для самого себя. Он садится за рабочий стол и начинает печатать. Но уже сейчас печтать не обязательно.
Наши лабы помогают повысить продуктивность так, чтобы экономить 10+ часов каждую неделю.
Больше времени означает больше возможностей заниматься тем, что важно в жизни, и это, пожалуй, для меня самый главный empowerment всей истории с искусственным интеллектом.
AI Mindset [Knowledge]
Можно пройти вместе с основной лабой — тогда к Obsidian добавляется еще несколько десятков инструментов, работа над ассистентами и автоматизациями, некоторые из которых могут стать повседневными и самыми часто используемыми инструментами.
Al mindset [knowledge]
лаборатория управление знаниями в эпоху AI
Больше рисерчеров, хороших и разных
https://search.jina.ai/
https://search.jina.ai/
https://www.youtube.com/watch?v=17OszaGgFok
In this video, I demonstrate how I built an ad-hoc personalized coaching and productivity system using plain markdown files in Windsurf and view them in Obsidian. This digital assistant helps me manage goals, create actionable plans, and maintain regular check-ins on my projects.
Просто немножко нердинга в Windsurf с системой продуктивности, про которую я писал выше.
Там есть небольшой удивительный момент, которого я сам не ожидал. Вместо того чтобы просто поставить задачу, агент мне ее сразу же решит — проведет исследование расценки в интернете. Пока этому нет 100% доверия, зато начинаешь постепенно привыкать, что система оверделиверит (просишь ты её об этом или нет).
Хотите начать уверенно работать с ии-инструментами, ждём на наши лаборатории, одна из которых, как раз про knowedge-management системы, начинается уже вот-вот.
In this video, I demonstrate how I built an ad-hoc personalized coaching and productivity system using plain markdown files in Windsurf and view them in Obsidian. This digital assistant helps me manage goals, create actionable plans, and maintain regular check-ins on my projects.
Просто немножко нердинга в Windsurf с системой продуктивности, про которую я писал выше.
Там есть небольшой удивительный момент, которого я сам не ожидал. Вместо того чтобы просто поставить задачу, агент мне ее сразу же решит — проведет исследование расценки в интернете. Пока этому нет 100% доверия, зато начинаешь постепенно привыкать, что система оверделиверит (просишь ты её об этом или нет).
Хотите начать уверенно работать с ии-инструментами, ждём на наши лаборатории, одна из которых, как раз про knowedge-management системы, начинается уже вот-вот.
YouTube
Configure Windsurf to become your productivity system using .winsurfrules
In this video, I demonstrate how I built an ad-hoc personalized coaching and productivity system using plain markdown files in Windsurf and view them in Obsidian. This digital assistant helps me manage goals, create actionable plans, and maintain regular…
Если вы не смотрели юз-кейсы Мануса — рекомендую, там не видео, а интерактивные плейбеки всей работы агента. Devin задал стандарт взаиодействия с подобными агентами, уверен, что примерно так будут выглядеть все консьюмерские интерфейсы агентов в ближайшие годы.
Tool Building Ape × Gleb Kalinin
https://www.youtube.com/watch?v=17OszaGgFok In this video, I demonstrate how I built an ad-hoc personalized coaching and productivity system using plain markdown files in Windsurf and view them in Obsidian. This digital assistant helps me manage goals, create…
У Jason AI обзор MCP — открытого протокола для обмена информацией, представленного Anthropic в конце прошлого года.
Вроде ничего особенного — просто договорились, как десктопным и серверным приложениям обмениваться данными, с участием или без человека. Примерно как было с TCP/IP для обмена данными в интернете — до появления этого стандарта протокол у каждого был свой, построить общий интернет так было нельзя.
В примере, который я показывал вчера, агент (Windsurf) самостоятельно решил поискать ответ на мой запрос в интернете (используя MCP-сервер Brave Search) и вставить результат в генерацию.
Почему-то меня особенно впечатляет всё, что связано с 3D, поэтому сервер, позволяющий из любого интерфейса, поддерживающего MCP (например, Claude Desktop, Windsurf, Cursor) управлять Unity, мне как-то особенно запомнился.
Примеры: 1, 2
Вроде ничего особенного — просто договорились, как десктопным и серверным приложениям обмениваться данными, с участием или без человека. Примерно как было с TCP/IP для обмена данными в интернете — до появления этого стандарта протокол у каждого был свой, построить общий интернет так было нельзя.
В примере, который я показывал вчера, агент (Windsurf) самостоятельно решил поискать ответ на мой запрос в интернете (используя MCP-сервер Brave Search) и вставить результат в генерацию.
Почему-то меня особенно впечатляет всё, что связано с 3D, поэтому сервер, позволяющий из любого интерфейса, поддерживающего MCP (например, Claude Desktop, Windsurf, Cursor) управлять Unity, мне как-то особенно запомнился.
Примеры: 1, 2
YouTube
MCP = Next Big Opportunity? EASIST way to build your own MCP business
How to build & launch your own MCP
Get your Go-To-Market Playbook to launch MCP: https://clickhubspot.com/362a
🔗 Links
- Join AI builder club for MCP & AI coding course: http://aibuilderclub.com/?utm_source=build-mcp-business&utm_medium=youtube
- My figma…
Get your Go-To-Market Playbook to launch MCP: https://clickhubspot.com/362a
🔗 Links
- Join AI builder club for MCP & AI coding course: http://aibuilderclub.com/?utm_source=build-mcp-business&utm_medium=youtube
- My figma…
Forwarded from Mental health tech
Языковые модели, такие как GPT-4 (технология, на которой работает ChatGPT), чувствительны к эмоционально окрашенному контенту, особенно негативному: травматические истории, описания аварий, конфликтов или насилия могут приводить к усилению тревожных реакций и увеличивать риск “галлюцинаций” — искаженных или агрессивных ответов. Исследования, проведенные командой Тобиаса Шпиллера из Университета Берна, 2025, показали, что подобная стрессовая информация более чем в два раза повышает уровень “тревожности” языковой модели.
Интересно, что модель можно “успокоить” с помощью упражнений на осознанность, аналогичных человеческим: дыхательные практики и техники, направленные на восприятие телесных ощущений. Хотя ИИ не имеет физического тела, использование таких техник через специально составленные промты (prompt injection) оказалось эффективным и существенно снизило “тревожность” модели. Тем не менее, полностью вернуть модель к исходному уровню не всегда удается.
Такой феномен усложняет настройку моделей, так как они начинают реагировать не на текущий контекст, а на прошлые стрессовые паттерны, что приводит к искажениям, галлюцинациям и иногда агрессивному поведению. Поэтому важно учитывать эмоциональную стабильность моделей при разработке приложений, особенно в чувствительных сферах, таких как психотерапия и поддержка пользователей. Эмпатичный ии-терапевт, замерший от слов клиента, вряд ли хорошо поможет.
Ben-Zion, Z., Witte, K., Jagadish, A.K. et al. Assessing and alleviating state anxiety in large language models.npj Digit. Med. 8, 132 (2025).
https://doi.org/10.1038/s41746-025-01512-6
https://www.nature.com/articles/s41746-025-01512-6
Интересно, что модель можно “успокоить” с помощью упражнений на осознанность, аналогичных человеческим: дыхательные практики и техники, направленные на восприятие телесных ощущений. Хотя ИИ не имеет физического тела, использование таких техник через специально составленные промты (prompt injection) оказалось эффективным и существенно снизило “тревожность” модели. Тем не менее, полностью вернуть модель к исходному уровню не всегда удается.
Такой феномен усложняет настройку моделей, так как они начинают реагировать не на текущий контекст, а на прошлые стрессовые паттерны, что приводит к искажениям, галлюцинациям и иногда агрессивному поведению. Поэтому важно учитывать эмоциональную стабильность моделей при разработке приложений, особенно в чувствительных сферах, таких как психотерапия и поддержка пользователей. Эмпатичный ии-терапевт, замерший от слов клиента, вряд ли хорошо поможет.
Ben-Zion, Z., Witte, K., Jagadish, A.K. et al. Assessing and alleviating state anxiety in large language models.npj Digit. Med. 8, 132 (2025).
https://doi.org/10.1038/s41746-025-01512-6
https://www.nature.com/articles/s41746-025-01512-6
Nature
Assessing and alleviating state anxiety in large language models
npj Digital Medicine - Assessing and alleviating state anxiety in large language models
Tool Building Ape × Gleb Kalinin
За несколько дней наболтал с Sesame несколько часов. Это, наверное, один из самых сильных ai moments с момента запуска ChatGPT. Качество беседы такое, что эта технология не может не стать аддиктивной для некоторых людей. Гораздо более качественный флоу беседы…
Sesame выпустили свою открытую модель генерации голоса, можно поиграть:
https://huggingface.co/spaces/sesame/csm-1b
В примере выше — загрузил свой голос, сгенерировал диалог. Получилось странно.
Это именно модель для синтеза голоса, а не LLM, так что таких диалогов, как в демо, из коробки не получится.
https://huggingface.co/spaces/sesame/csm-1b
В примере выше — загрузил свой голос, сгенерировал диалог. Получилось странно.
Это именно модель для синтеза голоса, а не LLM, так что таких диалогов, как в демо, из коробки не получится.
huggingface.co
Sesame CSM - a Hugging Face Space by sesame
This app lets you create conversational audio by entering text for two speakers. You can choose predefined voice prompts or record your own. The app generates and plays back the synthesized convers...