LEVELS_OF_ABSTRACTION Telegram 74
большая новость в мире ИИ: openAI анонсировали модель o3, которая на голову выше всего что было раньше:

1) IQ модели вырос до 157, это умнее, чем 99.999% людей
2) бенчмарк ARC-AGI, который специально построен сложным для ЛЛМ и якобы оценивает нашу близость к AGI вырос до 87%
3) бенчмарк FrontierMath с задачами по математике олимпиадного уровня вырос с 2 до 25%
4) в рейтинге программистов ELO codeforce модель заняла 150 место, это 99.9 перцентиль
5) паблик релиз обещали в начале 2025

на этой волне Илон Маск написал завирусившийся твит:
вероятность с которой интеллект ИИ к 2030 году превысит суммарный интерллект ВСЕХ людей — 100%


что здесь важно:
- у нас заканчиваются бенчмарки 🙃
- один прогон модели через бенчмарк стоит ~$1500.
- по слухам, в AGI бенче иcпользовалась генерация 1000 ответов с выбором лучшего, то есть стоимость теста могла достигнуть миллиона $
- это все, конечно, очень много но
а) в мире много задач решение которых стоит и 1k, и 10к и 100к $. это не массовые применения, но это те применения, которые мы автоматизируем в Quist, так что есть о чем поволноваться
б) цена использования моделей падает очень быстро и эти числа уменьшатся в 100-1000 раз
- никто не сомневался что это случится, но также никто не ждал этого так быстро
- в будущем нужно готовиться к тому, что модели будут все дальше умнеть, а стоимость их использования будет все дальше падать. то есть если интеллект в том или ином виде — ваше конкурентное преимущество, очень советую заранее смоделировать ситуацию, в котором это преимущество исчезает

#AI #AI_safety @levels_of_abstraction
🤯5🔥1



tgoop.com/levels_of_abstraction/74
Create:
Last Update:

большая новость в мире ИИ: openAI анонсировали модель o3, которая на голову выше всего что было раньше:

1) IQ модели вырос до 157, это умнее, чем 99.999% людей
2) бенчмарк ARC-AGI, который специально построен сложным для ЛЛМ и якобы оценивает нашу близость к AGI вырос до 87%
3) бенчмарк FrontierMath с задачами по математике олимпиадного уровня вырос с 2 до 25%
4) в рейтинге программистов ELO codeforce модель заняла 150 место, это 99.9 перцентиль
5) паблик релиз обещали в начале 2025

на этой волне Илон Маск написал завирусившийся твит:
вероятность с которой интеллект ИИ к 2030 году превысит суммарный интерллект ВСЕХ людей — 100%


что здесь важно:
- у нас заканчиваются бенчмарки 🙃
- один прогон модели через бенчмарк стоит ~$1500.
- по слухам, в AGI бенче иcпользовалась генерация 1000 ответов с выбором лучшего, то есть стоимость теста могла достигнуть миллиона $
- это все, конечно, очень много но
а) в мире много задач решение которых стоит и 1k, и 10к и 100к $. это не массовые применения, но это те применения, которые мы автоматизируем в Quist, так что есть о чем поволноваться
б) цена использования моделей падает очень быстро и эти числа уменьшатся в 100-1000 раз
- никто не сомневался что это случится, но также никто не ждал этого так быстро
- в будущем нужно готовиться к тому, что модели будут все дальше умнеть, а стоимость их использования будет все дальше падать. то есть если интеллект в том или ином виде — ваше конкурентное преимущество, очень советую заранее смоделировать ситуацию, в котором это преимущество исчезает

#AI #AI_safety @levels_of_abstraction

BY уровни абстракции






Share with your friend now:
tgoop.com/levels_of_abstraction/74

View MORE
Open in Telegram


Telegram News

Date: |

Step-by-step tutorial on desktop: Each account can create up to 10 public channels When choosing the right name for your Telegram channel, use the language of your target audience. The name must sum up the essence of your channel in 1-3 words. If you’re planning to expand your Telegram audience, it makes sense to incorporate keywords into your name. More>> A vandalised bank during the 2019 protest. File photo: May James/HKFP.
from us


Telegram уровни абстракции
FROM American