data.csv@data_csv P.1086

Notice: file_put_contents(): Write of 17804 bytes failed with errno=28 No space left on device in /var/www/tgoop/post.php on line 50
data.csv@data_csv P.1086

DATA_CSV Telegram 1086

Вижу много правильных мыслей, к которым пришёл и я.

OpenAI для иллюстрации результатов использовали Stacked Bar Chart. «Физический смысл» этого графика — сумма всех результатов. GPT-4 + GPT-4 (no vision) + GPT-3 в совокупности дают такой результат.

Но график не об этом. График о том, как каждая модель по отдельности справилась с экзаменами.
Теоретически, можно было показывать таким видом визуализации «прирост» функциональности, но оказалось, что есть даже один случай, когда модель GTP-4 справилась хуже, чем GTP-3.5.

Ещё плохо, что из исходного графика неясно, что за величина на нём показана. Я долго ломал голову, что за перцентили там изображены, и советовался с коллегами, как это интерпретировать.

Ну и ещё парочка побочных моментов — неудобное расположение подписей и вопрос, что происходит, если мы видим столбик только одного цвета.

Что сделал я:
1. Отметил все результаты точками
2. Чтобы можно было понять, где у моделей одинаковые результаты, каждую из них выделил разным размером круга.
3. Сделал человеческие подписи, из которых можно было бы понять контекст
4. Перевернул подписи на оси, чтобы было понятно их читать

Это всё быстро оформлено в связке Tableau + PowerPoint

🔥30❤7👍6👎1

www.tgoop.com/data_csv/1086

3.59K viewsАлексей Смагин, Mar 17, 2023 at 10:28

tgoop.com/data_csv/1086

Create: 2023-03-17
Last Update: 2025-07-27 03:37:58

Вижу много правильных мыслей, к которым пришёл и я.

OpenAI для иллюстрации результатов использовали Stacked Bar Chart. «Физический смысл» этого графика — сумма всех результатов. GPT-4 + GPT-4 (no vision) + GPT-3 в совокупности дают такой результат.

Но график не об этом. График о том, как каждая модель по отдельности справилась с экзаменами.
Теоретически, можно было показывать таким видом визуализации «прирост» функциональности, но оказалось, что есть даже один случай, когда модель GTP-4 справилась хуже, чем GTP-3.5.

Ещё плохо, что из исходного графика неясно, что за величина на нём показана. Я долго ломал голову, что за перцентили там изображены, и советовался с коллегами, как это интерпретировать.

Ну и ещё парочка побочных моментов — неудобное расположение подписей и вопрос, что происходит, если мы видим столбик только одного цвета.

Что сделал я:
1. Отметил все результаты точками
2. Чтобы можно было понять, где у моделей одинаковые результаты, каждую из них выделил разным размером круга.
3. Сделал человеческие подписи, из которых можно было бы понять контекст
4. Перевернул подписи на оси, чтобы было понятно их читать

Это всё быстро оформлено в связке Tableau + PowerPoint

BY data.csv

Share with your friend now:
tgoop.com/data_csv/1086

Open in Telegram

Telegram News

Date: 2025-07-27|

Developing social channels based on exchanging a single message isn’t exactly new, of course. Back in 2014, the “Yo” app was launched with the sole purpose of enabling users to send each other the greeting “Yo.” The court said the defendant had also incited people to commit public nuisance, with messages calling on them to take part in rallies and demonstrations including at Hong Kong International Airport, to block roads and to paralyse the public transportation system. Various forms of protest promoted on the messaging platform included general strikes, lunchtime protests and silent sit-ins. With the “Bear Market Screaming Therapy Group,” we’ve now transcended language. A vandalised bank during the 2019 protest. File photo: May James/HKFP. Avoid compound hashtags that consist of several words. If you have a hashtag like #marketingnewsinusa, split it into smaller hashtags: “#marketing, #news, #usa.
from us

Telegram data.csv
FROM American