День 7 в адвент-календаре OpenAI
Проекты в ChatGPT!
Я прям этого очень ждал. Из-за этого приходилось использовать Claude. Одни задают тренды, другие просто запрыгивают в него имея больше аудиторию. Стратегия!
- Теперь в рамках ChatGPT можно создать проекты.
- Знания для проекта можно загружать в виде файлов и инструкции.
- В рамках проекта можно создавать и вести отдельные чаты, в которых будут учитываться знания из проекта.
- В проект можно легко добавить уже существующие чаты.
- У проекта можно выбирать цвет для иконки.
Наконец-то весь хаос в истории у меня будет хоть немного, но организован. Я уже погнал создавать для себя разные чаты и вам советую заняться этим же🎩
Презентация: https://www.youtube.com/watch?v=FcB97h3vrzk
Еще 5 дней сюрпризов и релизов! Надеюсь, что впереди будут крутые штуки!
ИИволюция
Проекты в ChatGPT!
Я прям этого очень ждал. Из-за этого приходилось использовать Claude. Одни задают тренды, другие просто запрыгивают в него имея больше аудиторию. Стратегия!
- Теперь в рамках ChatGPT можно создать проекты.
- Знания для проекта можно загружать в виде файлов и инструкции.
- В рамках проекта можно создавать и вести отдельные чаты, в которых будут учитываться знания из проекта.
- В проект можно легко добавить уже существующие чаты.
- У проекта можно выбирать цвет для иконки.
Наконец-то весь хаос в истории у меня будет хоть немного, но организован. Я уже погнал создавать для себя разные чаты и вам советую заняться этим же
Презентация: https://www.youtube.com/watch?v=FcB97h3vrzk
Еще 5 дней сюрпризов и релизов! Надеюсь, что впереди будут крутые штуки!
ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Ai molodca (Dobrokotov)
Media is too big
VIEW IN TELEGRAM
Где-то в альтернативной реальности существует Челябинский свитерный завод и он заказал это видео.
Поиск и всё вокруг него!
- Доступен теперь все пользователям, даже без подписки.
- Поисковик от ChatGPT можно назначить в браузере как поисковик по умолчанию.
- Поиск доступен теперь даже в режиме Advanced Voice Mode. Т.е. ассистент по вашему запросу сбегает в сеть, найдет ответ и ответит вам.
- А еще поиск не просто выдает результаты в виде простыни текста, но и поддерживает режим карточек и просмотра деталей (не нужно переходить в браузер). Получается такой браузер внутри ChatGPT.
Выглядит классно и полезно!
Презентация: https://www.youtube.com/watch?v=OzgNJJ2ErEE
ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
Плюшки для разработчиков
- Полноценная поддержка o1 через API: structured output (в каком формате вам необходим ответ - текст, json), function calling (модель в ответе указывает название функции, из предложенных разработчиком в запросе, которую необходимо вызвать с параметрами) и VISION (теперь в API для o1 можно загружать фоточки для анализа).
- Представили новый тип промпта “Developers Messages” (в дополнении к System, User, Assistant промптам). Этот тип инструкции можно использовать для указания стиля ответа, формата, особых условий обработки, ограничения содержимого и других аспектов поведения модели.
- Рассказали о новом параметре в API “reasoning_effort”, который разработчики могут использовать, чтобы контролизовать длительность “размышлений” у модели. Более точные ответы, требуют больше “размышления”, но такие запросы и стоит будут дороже.
- Уронили цены на 60% для Realtime API (GPT-4o audio). Теперь добавлять в свои сервисы голосовых ассистентов с Advanced Voice Mode будет дешевле. А еще добавили новую модель GPT-4o mini, которая будет в 10 раз дешевле.
- А еще Realtime API работает с WebRTC, что позволит проще встраивать голосовых ассистентов на вебе. Опять же, чтобы разные компании наконец-то начали более активно встраивать такие штуки у себя на сайтах.
- Там что-то еще про файнтюнинг и новые SDK, но это вы лучше уже сами почитайте.
Ах да, доступ к o1 в API пока только у разрабочтиков с tier 5.
Презентация: https://www.youtube.com/watch?v=14leJ1fg4Pw&t=178s
Осталось 3 дня!
ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
☎️ День 10 в адвент-календаре OpenAI
Теперь можно позвонить на номер8-800-CHATGPT и записаться в МФЦ 1-800-CHATGPT и пообщаться с чатом, если вам скучно или хочется узнать рецепт свиных крыльев, а смартфона или компьютера нет под рукой.
Такой способ общения доступен только с US и CA номеров. А еще можно чатиться с GPT в ватсапе (режим доступен в тех странах, где доступен chatgpt) и пересылать ему открытки из одноклассников (он всегда поставит лайк и поддержит вас теплыми словами).
Для звонков доступно всего 15 минут общения в месяц. Но зато бесплатно!
Так и представляю ситуацию в новый год, вы набираете номер, а в ответ:
- “Ваш звонок очень важен для сверхинтеллекта, оставайтесь на линии ChatGPT, ваша очередь 115. Джингэл бэлс-джингэл бэлс…”
Теперь ChatGPT точно полетит в массы, ведь амбасадорами станут бабушки и дедушки, а они уж точно подсадят своих детей и внуков! Хорошая стратегия, Сэм!
Презентация: https://www.youtube.com/watch?v=LWa6OHeNK3s
ИИволюция
Теперь можно позвонить на номер
Такой способ общения доступен только с US и CA номеров. А еще можно чатиться с GPT в ватсапе (режим доступен в тех странах, где доступен chatgpt) и пересылать ему открытки из одноклассников (он всегда поставит лайк и поддержит вас теплыми словами).
Для звонков доступно всего 15 минут общения в месяц. Но зато бесплатно!
Так и представляю ситуацию в новый год, вы набираете номер, а в ответ:
- “Ваш звонок очень важен для сверхинтеллекта, оставайтесь на линии ChatGPT, ваша очередь 115. Джингэл бэлс-джингэл бэлс…”
Теперь ChatGPT точно полетит в массы, ведь амбасадорами станут бабушки и дедушки, а они уж точно подсадят своих детей и внуков! Хорошая стратегия, Сэм!
Презентация: https://www.youtube.com/watch?v=LWa6OHeNK3s
ИИволюция
Когда звонишь на номер 1-800-ChatGPT, а чатик почему-то каждый раз отвечает разными голосами и акцентами.
ИИволюция
ИИволюция
Так как o1 теперь полноценно представлена через API, и там есть параметр reasoning_effort, возник вопрос, а o1 pro это просто o1 с выкрученным reasoning_effort = high?
Но нет, OpenAI это опровергает. Говорят, что o1 pro это совершенно другая реализация ризонинга, а не просто reasoning_effort = high.
Получается у o1 pro значение ризонинга, что-то вроде reasoning_effort = hardzilla👀
ИИволюция
Но нет, OpenAI это опровергает. Говорят, что o1 pro это совершенно другая реализация ризонинга, а не просто reasoning_effort = high.
Получается у o1 pro значение ризонинга, что-то вроде reasoning_effort = hardzilla
ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Десктопное приложение, работа с контекстом широкого списка приложений + advanced voice mode для работы с контекстом выбранного окна.
- Теперь десктоп приложение поддерживает более широкий выбор IDE для разработки.
- Поддерживает новые виды приложений для работы с документами и заметками типа Apple Notes, Notion и др.
- И даже можно использовать Advanced Voice mode чтобы работать с контекстом выбранного окна.
- Поддержка o1 (а разве не было до этого?) и o1 pro.
Решил приколоться и запустил голосовой режим, выбрал окно XCode, указал голос Санта-Клауса и на любой вопрос о коде, получаю веселый ответ в стиле: “хо-хо-хо, сейчас я помогу тебе! Чтобы сделать Х хо-хо-хо, нужно сделать Y, хо-хо-хо”.
В предверии нового года самое то, чтобы поднять настроение. Пробуйте!
Презентация: https://www.youtube.com/watch?v=g_qxoznfa7E
ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Разработка с AI ассистентами как рулетка, 5 раз поможет, на 6 поможет довести вас до нервного срыва
ИИволюция
ИИволюция
День 12 в адвент-календаре OpenAI
Пардоньте, я тут немного выпал и не закончил адвент-календарь от OpenAI на выходных. Поэтому завершаю и перехожу к другим темам.
- Новая модель o3 (o2 нельзя, так как есть торговая марка).
- o3 cупер умная, долго размышляет, решает задачи на уровне доктора наук, разработка кода на уровне топ-сеньор разработчика.
- Показали так же модель o3-mini, которая быстрее и дешевле, идеально для разработки кода.
- Использование модели дороже чем o1 (но мы то знаем, что стоимость использования старших моделей постепенно падает).
- Обещают выпустить в первой половине 2025.
Презентация: https://www.youtube.com/live/SKBG1sqdyIU
На этом всё! Календарь окончен, но других новостей подкопилось, буду разгребать и рассказывать вам 🎄
ИИволюция
Пардоньте, я тут немного выпал и не закончил адвент-календарь от OpenAI на выходных. Поэтому завершаю и перехожу к другим темам.
- Новая модель o3 (o2 нельзя, так как есть торговая марка).
- o3 cупер умная, долго размышляет, решает задачи на уровне доктора наук, разработка кода на уровне топ-сеньор разработчика.
- Показали так же модель o3-mini, которая быстрее и дешевле, идеально для разработки кода.
- Использование модели дороже чем o1 (но мы то знаем, что стоимость использования старших моделей постепенно падает).
- Обещают выпустить в первой половине 2025.
Презентация: https://www.youtube.com/live/SKBG1sqdyIU
На этом всё! Календарь окончен, но других новостей подкопилось, буду разгребать и рассказывать вам 🎄
ИИволюция
Интересный пост к размышлению:
“Искусственный интеллект меняет представления о ценности различных профессий, считает Сэм Альтман.
Если ваша работа связана с работой за компьютером — например, программированием, дизайном или написанием текстов — ИИ теперь может выполнять многие из этих задач невероятно быстро. Это делает такие профессии менее востребованными.
ИИ проще освоить задачи, которые требуют в основном умственных усилий и знаний. Но профессии, где нужно физически присутствовать и работать руками — например, сантехники, электрики, хирурги или специалисты по логистике и доставке — остаются в безопасности. ИИ пока плохо справляется с физической работой.
Это создает любопытный переворот. Профессии, которые раньше считались престижными благодаря интеллектуальному труду, могут потерять свой особый статус, ведь ИИ способен выполнять их быстрее. В то же время профессии, требующие физического присутствия и навыков, становятся более ценными.
Когда Сэм говорит о «странных эффектах», он имеет в виду, как мы начинаем по-другому смотреть на работу, связанную с компьютерами. ИИ гораздо проще копировать и выполнять цифровую работу, чем решать реальные задачи, где нужно взаимодействовать с людьми или предметами.
Теперь вместо вопроса «насколько вы хороши в работе за компьютером?» все чаще задается вопрос «что вы можете сделать или починить своими руками?». Это меняет восприятие навыков.
Речь идет не только о профессиях, но и о том, как люди находят смысл в своей работе. По мере того как ИИ берет на себя больше интеллектуальных задач, которые раньше считались сложными и приносили удовлетворение, многие могут начать находить радость и удовлетворение в практической, физической деятельности.”
Не факт, что именно так будет, но пока мы движемся в этом направлении.
ИИволюция
“Искусственный интеллект меняет представления о ценности различных профессий, считает Сэм Альтман.
Если ваша работа связана с работой за компьютером — например, программированием, дизайном или написанием текстов — ИИ теперь может выполнять многие из этих задач невероятно быстро. Это делает такие профессии менее востребованными.
ИИ проще освоить задачи, которые требуют в основном умственных усилий и знаний. Но профессии, где нужно физически присутствовать и работать руками — например, сантехники, электрики, хирурги или специалисты по логистике и доставке — остаются в безопасности. ИИ пока плохо справляется с физической работой.
Это создает любопытный переворот. Профессии, которые раньше считались престижными благодаря интеллектуальному труду, могут потерять свой особый статус, ведь ИИ способен выполнять их быстрее. В то же время профессии, требующие физического присутствия и навыков, становятся более ценными.
Когда Сэм говорит о «странных эффектах», он имеет в виду, как мы начинаем по-другому смотреть на работу, связанную с компьютерами. ИИ гораздо проще копировать и выполнять цифровую работу, чем решать реальные задачи, где нужно взаимодействовать с людьми или предметами.
Теперь вместо вопроса «насколько вы хороши в работе за компьютером?» все чаще задается вопрос «что вы можете сделать или починить своими руками?». Это меняет восприятие навыков.
Речь идет не только о профессиях, но и о том, как люди находят смысл в своей работе. По мере того как ИИ берет на себя больше интеллектуальных задач, которые раньше считались сложными и приносили удовлетворение, многие могут начать находить радость и удовлетворение в практической, физической деятельности.”
Не факт, что именно так будет, но пока мы движемся в этом направлении.
ИИволюция
OpenAI подвезла свой небольшой курс по “правильному” промптингу o1
Забирайте себе на НГ праздники, будет чем заняться между салатиками: https://www.deeplearning.ai/short-courses/reasoning-with-o1/
ИИволюция
Забирайте себе на НГ праздники, будет чем заняться между салатиками: https://www.deeplearning.ai/short-courses/reasoning-with-o1/
ИИволюция
Forwarded from Data Secrets
Там обновленная o1 появилась на Livebench и просто порвала всех
Livebench примечателен тем, что он постоянно обновляется, минимизируя всевозможные лики и гарантируя, что задачи не устаревают и не становятся слишком простыми.
Так вот с появлением на борде o1 Gemini Exp 1206, Sonnet 3.5 v2 и предыдущие o1-mini и o1-preview остаются позади с большим отрывом как на главном замере, так и на, конечно, ризонинге. Сравните: о1-preview демонстрирует 67%, и была раньше безусловным лидером, а у полной o1 насчитали… аж 91.58%!
В кодинге прирост тоже есть, но не такой невероятный. Предыдущим лидером был Claude-3.6 Sonnet с 67%. Теперь он уступает o1, но всего на 2.5 процентных пункта. А по математике в лидерах все еще Gemini. Кстати, обратите внимание, как у обеих Gemini резко растут метрики с появлением второго промпта с подсказкой (последний столбец IF).
Livebench примечателен тем, что он постоянно обновляется, минимизируя всевозможные лики и гарантируя, что задачи не устаревают и не становятся слишком простыми.
Так вот с появлением на борде o1 Gemini Exp 1206, Sonnet 3.5 v2 и предыдущие o1-mini и o1-preview остаются позади с большим отрывом как на главном замере, так и на, конечно, ризонинге. Сравните: о1-preview демонстрирует 67%, и была раньше безусловным лидером, а у полной o1 насчитали… аж 91.58%!
В кодинге прирост тоже есть, но не такой невероятный. Предыдущим лидером был Claude-3.6 Sonnet с 67%. Теперь он уступает o1, но всего на 2.5 процентных пункта. А по математике в лидерах все еще Gemini. Кстати, обратите внимание, как у обеих Gemini резко растут метрики с появлением второго промпта с подсказкой (последний столбец IF).
Forwarded from Data Secrets
Зацените: решение моделью o3 одной задачи на бенчмарке ARC AGI стоило в среднем 3000$. Это значит, что просто чтобы прогнать тест полностью, OpenAI потратили более миллиона долларов.
Лица инвесторов представили?
Ладно, если серьезно: цены действительно будут, скорее всего, невероятно высокие. Юнит-экономика настолько мощного test time компьюта точно не сходится, да и было бы странно, если бы сразу сошлась. Не забываем, что мы живем внутри закона Мура: железо развивается, и цены неизбежно будут падать. Когда-нибудь o3 станет такой же доступной, как GPT-4o.
P.S. Почему все так много говорят именно про этот бенчмарк? Потому что долгое время он действительно считался своеобразной проверкой на AGI: предполагалось, что решить его сможет только система "по-человечески умная", то есть не та, которая просто выучила кучу фактов о мире, а та, которая может рассуждать, оперируя элементарными навыками. Задачи в бечмарке напоминают мини-головоломки из книжек для самых маленьких: в каждой задаче нужно угадать паттерн перестановки квадратиков в сетке. И действительно, тест формировался так, чтобы для его решения нужны были только те навыки, которые человек приобретает до 4 лет: объектность, базовая топология, элементарная целочисленная арифметика.
Лица инвесторов представили?
Ладно, если серьезно: цены действительно будут, скорее всего, невероятно высокие. Юнит-экономика настолько мощного test time компьюта точно не сходится, да и было бы странно, если бы сразу сошлась. Не забываем, что мы живем внутри закона Мура: железо развивается, и цены неизбежно будут падать. Когда-нибудь o3 станет такой же доступной, как GPT-4o.
P.S. Почему все так много говорят именно про этот бенчмарк? Потому что долгое время он действительно считался своеобразной проверкой на AGI: предполагалось, что решить его сможет только система "по-человечески умная", то есть не та, которая просто выучила кучу фактов о мире, а та, которая может рассуждать, оперируя элементарными навыками. Задачи в бечмарке напоминают мини-головоломки из книжек для самых маленьких: в каждой задаче нужно угадать паттерн перестановки квадратиков в сетке. И действительно, тест формировался так, чтобы для его решения нужны были только те навыки, которые человек приобретает до 4 лет: объектность, базовая топология, элементарная целочисленная арифметика.
Forwarded from Data Secrets
Один из пазлов бенчмарка ARC AGI, который o3 не смогла решить
Попробуйте ответить и вы: прямоугольник, на который указывает стрелка, должен остаться красным или стать синим?
Проверим, кто победит ИИ в решении задач для дошкольников🙂
Попробуйте ответить и вы: прямоугольник, на который указывает стрелка, должен остаться красным или стать синим?
Проверим, кто победит ИИ в решении задач для дошкольников
Please open Telegram to view this post
VIEW IN TELEGRAM
Желаю вам с радостью встретить Новый год! Пусть все желания и мечты исполняются.
Очень рад, что мы с вами встретились. Сколько еще всего впереди удивительного!
ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM