tgoop.com/junkyardmathml/189
Last Update:
ChatGPT-4.5 - новая LLM для повседневных задач.
Она эмпатичнее, креативнее и меньше глючит. По небольшому опыту использования, ощущение, что формулирует предложения действительно более человечно. Также можно вгружать файлы и включать режим поиска в сети, что приятно. Open AI заявляют, что улучшили интеграцию chain-of-thought reasoning. Техрепорт с бенчмаркингом и описанием здесь.
Safety аспект, ChatGPT-4.5 показывает лучшую устойчивость к jailbreaks атакам - техники промпта, заставляющие ЛЛМ генерировать социально-опасные (based) ответы.
По способностям решать какие-то содержательные задачи сильно хуже O1, на ARC бенчмарке тоже просадка.
На ней нельзя запускать пучки, тоже неприятно.
Для Pro-подписчиков за 200 долларов ChatGPT-4.5 уже доступа, за несколько месяцев использования плана Pro единственное полезное - это ранний доступ к новым моделям и режимам