tgoop.com/cpu_design/256
Create:
Last Update:
Last Update:
Hello SME
Да-да, снова ARM. На ресурсе по ссылке выше вы найдете краткое описание расширений Neon, Apple AMX и SME.
Наиболее интересной частью ресурса является раздел Microbenchmarks.
Тесты проводились на процессоре M4. Бенчмарки написаны так, чтобы избежать зависимостей между инструкциями.
Бенчмарки чипа M4 включали тестирование пиковой производительности и масштабируемости инструкций для FP32, FP16, BF16 и целочисленных данных (I8, I16) с использованием векторных операций (Neon, SVE), матричных расширений (SME, AMX) и инструкций загрузки/сохранения данных в ZA tile storage.
Исходники бенчмарков - scalable-analyses/sme
Buen Finde!