LEVELS_OF_ABSTRACTION Telegram 75
большая новость в мире ИИ: openAI анонсировали модель o3, которая на голову выше всего что было раньше:

1) IQ модели вырос до 157, это умнее, чем 99.999% людей
2) бенчмарк ARC-AGI, который специально построен сложным для ЛЛМ и якобы оценивает нашу близость к AGI вырос до 87%
3) бенчмарк FrontierMath с задачами по математике олимпиадного уровня вырос с 2 до 25%
4) в рейтинге программистов ELO codeforce модель заняла 150 место, это 99.9 перцентиль
5) паблик релиз обещали в начале 2025

на этой волне Илон Маск написал завирусившийся твит:
вероятность с которой интеллект ИИ к 2030 году превысит суммарный интерллект ВСЕХ людей — 100%


что здесь важно:
- у нас заканчиваются бенчмарки 🙃
- один прогон модели через бенчмарк стоит ~$1500.
- по слухам, в AGI бенче иcпользовалась генерация 1000 ответов с выбором лучшего, то есть стоимость теста могла достигнуть миллиона $
- это все, конечно, очень много но
а) в мире много задач решение которых стоит и 1k, и 10к и 100к $. это не массовые применения, но это те применения, которые мы автоматизируем в Quist, так что есть о чем поволноваться
б) цена использования моделей падает очень быстро и эти числа уменьшатся в 100-1000 раз
- никто не сомневался что это случится, но также никто не ждал этого так быстро
- в будущем нужно готовиться к тому, что модели будут все дальше умнеть, а стоимость их использования будет все дальше падать. то есть если интеллект в том или ином виде — ваше конкурентное преимущество, очень советую заранее смоделировать ситуацию, в котором это преимущество исчезает

#AI #AI_safety @levels_of_abstraction
🤯5🔥1



tgoop.com/levels_of_abstraction/75
Create:
Last Update:

большая новость в мире ИИ: openAI анонсировали модель o3, которая на голову выше всего что было раньше:

1) IQ модели вырос до 157, это умнее, чем 99.999% людей
2) бенчмарк ARC-AGI, который специально построен сложным для ЛЛМ и якобы оценивает нашу близость к AGI вырос до 87%
3) бенчмарк FrontierMath с задачами по математике олимпиадного уровня вырос с 2 до 25%
4) в рейтинге программистов ELO codeforce модель заняла 150 место, это 99.9 перцентиль
5) паблик релиз обещали в начале 2025

на этой волне Илон Маск написал завирусившийся твит:
вероятность с которой интеллект ИИ к 2030 году превысит суммарный интерллект ВСЕХ людей — 100%


что здесь важно:
- у нас заканчиваются бенчмарки 🙃
- один прогон модели через бенчмарк стоит ~$1500.
- по слухам, в AGI бенче иcпользовалась генерация 1000 ответов с выбором лучшего, то есть стоимость теста могла достигнуть миллиона $
- это все, конечно, очень много но
а) в мире много задач решение которых стоит и 1k, и 10к и 100к $. это не массовые применения, но это те применения, которые мы автоматизируем в Quist, так что есть о чем поволноваться
б) цена использования моделей падает очень быстро и эти числа уменьшатся в 100-1000 раз
- никто не сомневался что это случится, но также никто не ждал этого так быстро
- в будущем нужно готовиться к тому, что модели будут все дальше умнеть, а стоимость их использования будет все дальше падать. то есть если интеллект в том или ином виде — ваше конкурентное преимущество, очень советую заранее смоделировать ситуацию, в котором это преимущество исчезает

#AI #AI_safety @levels_of_abstraction

BY уровни абстракции






Share with your friend now:
tgoop.com/levels_of_abstraction/75

View MORE
Open in Telegram


Telegram News

Date: |

With Bitcoin down 30% in the past week, some crypto traders have taken to Telegram to “voice” their feelings. So far, more than a dozen different members have contributed to the group, posting voice notes of themselves screaming, yelling, groaning, and wailing in various pitches and rhythms. It’s easy to create a Telegram channel via desktop app or mobile app (for Android and iOS): ‘Ban’ on Telegram Members can post their voice notes of themselves screaming. Interestingly, the group doesn’t allow to post anything else which might lead to an instant ban. As of now, there are more than 330 members in the group.
from us


Telegram уровни абстракции
FROM American