Forwarded from Бескромный
$440 000 за отчёт из ChatGPT
В этой истории прекрасно всё.
Австралийское правительство недавно заказало у консалтингового гиганта Deloitte аудит IT-системы, которая выписывает штрафы получателям пособий.
В результате заказчик получил отчёт, написанный ChatGPT.
И не просто написанный, а с несуществующими академическими ссылками, выдуманными цитатами и судьёй по имени «Справедливость Дэвис» (на самом деле её зовут Дженнифер Дэвис).
Deloitte официально признали, что использовали GPT-4o якобы для устранения пробелов в документации — иначе говоря, чтобы дописать текст. Теперь фирма возвращает гонорар в $440 000.
Сенатор Австралии гениально подвела выводы этой истории:
Самое ироничное, что отчёт должен был проверить, не перегибает ли государство с автоматизацией. В итоге именно автоматизация подвела дорогих консультантов.
В общем, прежде чем разбираться с искусственным интеллектом, нам всё-таки стоит разобраться с человеческим.
В этой истории прекрасно всё.
Австралийское правительство недавно заказало у консалтингового гиганта Deloitte аудит IT-системы, которая выписывает штрафы получателям пособий.
В результате заказчик получил отчёт, написанный ChatGPT.
И не просто написанный, а с несуществующими академическими ссылками, выдуманными цитатами и судьёй по имени «Справедливость Дэвис» (на самом деле её зовут Дженнифер Дэвис).
Deloitte официально признали, что использовали GPT-4o якобы для устранения пробелов в документации — иначе говоря, чтобы дописать текст. Теперь фирма возвращает гонорар в $440 000.
Сенатор Австралии гениально подвела выводы этой истории:
«У Deloitte проблемы с человеческим интеллектом. Возможно, им стоит просто оформить подписку на ChatGPT.»
Самое ироничное, что отчёт должен был проверить, не перегибает ли государство с автоматизацией. В итоге именно автоматизация подвела дорогих консультантов.
В общем, прежде чем разбираться с искусственным интеллектом, нам всё-таки стоит разобраться с человеческим.
1😁44👏7🔥5🤣3🦄3❤2👍2💯2
HuMo
Есть такая open-source модель от ByteDance, умеет управлять живыми персонажами сразу по трем каналам: текст, изображение и аудио. И синхронно контролировать позу, эмоции, содержание и лип-синк.
На выходе ролики до 1080p при 30/60 fps с устойчивым обликом героя в разных ракурсах и сценах; можно генерировать как портреты, так и динамичные сюжеты с несколькими людьми. Липсинк и мимика идут вровень с озвучкой.
Подходит для говорящих голов, рекламы и обучения, коротких креативов и танцевальных сцен, сейчас демо ограничены ~8 секундами, но обещают расширение.
Репозиторий открыт на Hugging Face под Apache 2.0, есть готовые workflow для ComfyUI; внутри визуальный генератор на базе Wan2.1 и аудио-энкодер на Whisper, крупная конфигурация до 17B параметров.
Если хочется управляемых персонажей без ручной анимации, то самое время попробовать.
HG
#videoGenerative@TochkiNadAI
Есть такая open-source модель от ByteDance, умеет управлять живыми персонажами сразу по трем каналам: текст, изображение и аудио. И синхронно контролировать позу, эмоции, содержание и лип-синк.
На выходе ролики до 1080p при 30/60 fps с устойчивым обликом героя в разных ракурсах и сценах; можно генерировать как портреты, так и динамичные сюжеты с несколькими людьми. Липсинк и мимика идут вровень с озвучкой.
Подходит для говорящих голов, рекламы и обучения, коротких креативов и танцевальных сцен, сейчас демо ограничены ~8 секундами, но обещают расширение.
Репозиторий открыт на Hugging Face под Apache 2.0, есть готовые workflow для ComfyUI; внутри визуальный генератор на базе Wan2.1 и аудио-энкодер на Whisper, крупная конфигурация до 17B параметров.
Если хочется управляемых персонажей без ручной анимации, то самое время попробовать.
HG
#videoGenerative@TochkiNadAI
👍11❤6🔥3🤩1🤝1
This media is not supported in your browser
VIEW IN TELEGRAM
Визуализация сегментации и вообще CV – частенько бывают очень красивым зрелищем
Эта называется RF-DETR Segmentation, и это новая SOTA.
Она обеспечивает повышение точности +8 мАп по сравнению с лучшими моделями YOLO при аналогичной скорости и работает в 10–100 раз быстрее, чем предыдущие модели сегментации на основе трансформаторов с сопоставимой точностью.
Есть код.
#computerVision@TochkiNadAI
Эта называется RF-DETR Segmentation, и это новая SOTA.
Она обеспечивает повышение точности +8 мАп по сравнению с лучшими моделями YOLO при аналогичной скорости и работает в 10–100 раз быстрее, чем предыдущие модели сегментации на основе трансформаторов с сопоставимой точностью.
Есть код.
#computerVision@TochkiNadAI
❤12🔥9👍3 1
This media is not supported in your browser
VIEW IN TELEGRAM
Кто тестил Predictive Video в приложении Pika?
На волне популярности камео в Sora, ребята из Pika напомнили, что у них в аппке есть такой вот вайб-рилсининг.
Вы пишете короткий промпт/идею, а остальное делает модель: пишет сценарий, ставит камеру, добавляет звук.
Я вот не тестил. Интересно, что у вас получалось.
#videoGenerative@TochkiNadAI
На волне популярности камео в Sora, ребята из Pika напомнили, что у них в аппке есть такой вот вайб-рилсининг.
Вы пишете короткий промпт/идею, а остальное делает модель: пишет сценарий, ставит камеру, добавляет звук.
Я вот не тестил. Интересно, что у вас получалось.
#videoGenerative@TochkiNadAI
👍9🔥4 3❤2
This media is not supported in your browser
VIEW IN TELEGRAM
Я сегодня говорю другу:
А он говорит:
Это забавно, конечно. Обожаю такой метамодерн. Вот ссылка.
Только у меня водяные знаки получились гигантские в примере, видимо надо вертикальные видео грузить.
Можно поделать нелепых рилсов, поснимать в высоком разрешении и добавить водяные знаки Соры.
А он говорит:
Так такой сервис уже есть!
Это забавно, конечно. Обожаю такой метамодерн. Вот ссылка.
Только у меня водяные знаки получились гигантские в примере, видимо надо вертикальные видео грузить.
😁35👏9❤4👍1
Я тут продолжаю снимать свой космический сериал на Соре.
(ссылки в конце поста)
Хочу поделиться несколькими, как мне кажется, любопытными наблюдениями про нетехнечиские моменты, которые заметил за эту неделю с небольшим:
1. Во-первых я рад, что у меня появилось хобби, связанное с основной деятельностью. Классно, что можно одновременно заниматься творчеством, исследовать AI, изучать алгоритмы соц.сетей и просто развлекаться. Еще одно гилти-плэжа – смотреть метрики и анализировать подачу.
2. Со мной в сериале путешествует камео Риса. Мы живем в одном городе и не так давно познакомились лично, но оба заметили, что через бесконечный общий слоп и космический сериал появились новые совместные воспоминания, их реально много, хоть они и синтетические. Слоп сближает! Еще у нас появился отдельный новый чат на троих, где мы активно и много обсуждаем все вот это вот, что я пишу в этом посте.
3. В последние пару лет заметил, что больше стал стесняться быть "говорящей головой" в соц.сетях. Так вот Камео полностью снимает любые барьеры, я пощу, не стесняюсь что посмотрит кто-то из-знакомых, и даже наоборот репощу эти приключения в свой живой аккаунт.
4. Из не самых приятных моментов – когда сажусь генерить уставший под вечер – сильно погружаюсь в историю, все это вызывает сильные выбросы дофамина (эффект – "интересно, что там сейчас сгенерится" + быстрый результат с минимальными усилиями + свое лицо в кадре), в результате на уставший мозг вываливается много эмоций, это влияет на эмоциональное самочувствие и сон.
Есть еще ряд поинтов, но не буду нагружать пост, и так уже полотно.
Если вам интересно следить за нашими приключениями, вот ссылочки, выбирайте удобные платформы:
Inst, TikTok, YouTube, Sora.
(ссылки в конце поста)
Хочу поделиться несколькими, как мне кажется, любопытными наблюдениями про нетехнечиские моменты, которые заметил за эту неделю с небольшим:
1. Во-первых я рад, что у меня появилось хобби, связанное с основной деятельностью. Классно, что можно одновременно заниматься творчеством, исследовать AI, изучать алгоритмы соц.сетей и просто развлекаться. Еще одно гилти-плэжа – смотреть метрики и анализировать подачу.
2. Со мной в сериале путешествует камео Риса. Мы живем в одном городе и не так давно познакомились лично, но оба заметили, что через бесконечный общий слоп и космический сериал появились новые совместные воспоминания, их реально много, хоть они и синтетические. Слоп сближает! Еще у нас появился отдельный новый чат на троих, где мы активно и много обсуждаем все вот это вот, что я пишу в этом посте.
3. В последние пару лет заметил, что больше стал стесняться быть "говорящей головой" в соц.сетях. Так вот Камео полностью снимает любые барьеры, я пощу, не стесняюсь что посмотрит кто-то из-знакомых, и даже наоборот репощу эти приключения в свой живой аккаунт.
4. Из не самых приятных моментов – когда сажусь генерить уставший под вечер – сильно погружаюсь в историю, все это вызывает сильные выбросы дофамина (эффект – "интересно, что там сейчас сгенерится" + быстрый результат с минимальными усилиями + свое лицо в кадре), в результате на уставший мозг вываливается много эмоций, это влияет на эмоциональное самочувствие и сон.
Есть еще ряд поинтов, но не буду нагружать пост, и так уже полотно.
Если вам интересно следить за нашими приключениями, вот ссылочки, выбирайте удобные платформы:
Inst, TikTok, YouTube, Sora.
🔥20❤12⚡8 5👍1🤩1🦄1
This media is not supported in your browser
VIEW IN TELEGRAM
В Higgsfield появился вэйтлист на Veo 3.1
Sora 2 придется немного подвинуться.
Что обещают?
– Видео 1080p продолжительностью до 30 секунд (хотя ходят слухи про 1 минуту)
– Улучшенная консистентность персонажей и сцен
– Кинематографические пресеты, которые автоматически управляют движениями камеры, освещением и тональностью
– Генерация нескольких кадров для коротких последовательностей в одном запросе
– Улучшенное микширование звука и звуковых эффектов для более насыщенного и реалистичного звучания
Вэйтлист тут.
#videoGenerative@TochkiNadAI
Sora 2 придется немного подвинуться.
Что обещают?
– Видео 1080p продолжительностью до 30 секунд (хотя ходят слухи про 1 минуту)
– Улучшенная консистентность персонажей и сцен
– Кинематографические пресеты, которые автоматически управляют движениями камеры, освещением и тональностью
– Генерация нескольких кадров для коротких последовательностей в одном запросе
– Улучшенное микширование звука и звуковых эффектов для более насыщенного и реалистичного звучания
Вэйтлист тут.
#videoGenerative@TochkiNadAI
🔥20❤5👍2🤔1 1
This media is not supported in your browser
VIEW IN TELEGRAM
А вот, если пропустили, из мира AI 3D
В Hunyuan 3D, говорят, точность выросла в три раза, по большей части ушли плавающие детали и кривые позы, геометрия и текстуры держатся лучше.
Процесс устроен примерно так:
сначала форма, потом шлифовка, итогом становятся lifelike-поверхности и аккуратные лица, волосы, ткань. На вход текст или картинка (можно и вместе), на выход детальная 3D-модель с экспортом в OBJ/FBX/GLB.
Тестим тут.
Кстати, еще они пару недель назад показывали HunyuanImage 3.0.
Веб
GitHub
Hugging Face
#3D@TochkiNadAI
#gamedev@TochkiNadAI
В Hunyuan 3D, говорят, точность выросла в три раза, по большей части ушли плавающие детали и кривые позы, геометрия и текстуры держатся лучше.
Процесс устроен примерно так:
сначала форма, потом шлифовка, итогом становятся lifelike-поверхности и аккуратные лица, волосы, ткань. На вход текст или картинка (можно и вместе), на выход детальная 3D-модель с экспортом в OBJ/FBX/GLB.
Тестим тут.
Кстати, еще они пару недель назад показывали HunyuanImage 3.0.
Веб
GitHub
Hugging Face
#3D@TochkiNadAI
#gamedev@TochkiNadAI
🔥9👍5❤2⚡1 1
Еще одна интересная часть создания моей Космической Одиссеи – сверяться с реальными данными о космосе.
Понятно, конечно, что я не стараюсь передать все достоверно и генерирую много абсурдного контента, но все равно по пути сверяюсь с некоторыми реальными данными. Например, на днях отслеживал положение той самой Теслы, которую Маск запустил в Космос в 2018 году.
В связи с этим стало интересно, что там у нейросети Алисы? Хорошо ли она объясняет физику или астрофизику?
Спросил у нее: “что такое горизонт событий?”. Как видите на скринкасте – она быстро помогает разобраться в непонятных темах, подобрать аналогии и объяснить материал на нужном уровне — от базового до продвинутого. Я вот еще и список литературы попросил по теме.
Понятно, конечно, что я не стараюсь передать все достоверно и генерирую много абсурдного контента, но все равно по пути сверяюсь с некоторыми реальными данными. Например, на днях отслеживал положение той самой Теслы, которую Маск запустил в Космос в 2018 году.
В связи с этим стало интересно, что там у нейросети Алисы? Хорошо ли она объясняет физику или астрофизику?
Спросил у нее: “что такое горизонт событий?”. Как видите на скринкасте – она быстро помогает разобраться в непонятных темах, подобрать аналогии и объяснить материал на нужном уровне — от базового до продвинутого. Я вот еще и список литературы попросил по теме.
1🦄10👍6🤝3🤣1🆒1
This media is not supported in your browser
VIEW IN TELEGRAM
Маск внезапно вступает в гонку за создание World-моделей
В его метаверс на базе генеративных моделей я, почему-то, верю.
Для этого он переманил ряд инженеров из Nvidia. Тут почитать подробнее.
В его метаверс на базе генеративных моделей я, почему-то, верю.
Для этого он переманил ряд инженеров из Nvidia. Тут почитать подробнее.
Я тут апгрейднул подписку в ChatGPT до Pro.
Конечно же, чтобы генерить в Sora 2 с меньшими ограничениями и более высоким качеством.
Но пост не про Sora.
В Pro есть функция Pulse. Это симпатично-оформленный ежедневный дайджест новостей по интересным для вас темам.
Фактически, как телеграм-канал, на который подписаны только вы, а его автор всячески старается делать контент с упором на самое полезное и интересное.
Он подбирает темы на основе памяти из диалогов, а также спрашивает — про что вам интересно будет узнать/почитать завтра. Отвечать не обязательно, он все равно что-то для вас подсоберет.
Классная штука, мне нравится🤌🏻
Конечно же, чтобы генерить в Sora 2 с меньшими ограничениями и более высоким качеством.
Но пост не про Sora.
В Pro есть функция Pulse. Это симпатично-оформленный ежедневный дайджест новостей по интересным для вас темам.
Фактически, как телеграм-канал, на который подписаны только вы, а его автор всячески старается делать контент с упором на самое полезное и интересное.
Он подбирает темы на основе памяти из диалогов, а также спрашивает — про что вам интересно будет узнать/почитать завтра. Отвечать не обязательно, он все равно что-то для вас подсоберет.
Классная штука, мне нравится🤌🏻
👍23❤5🔥5👌1