tgoop.com/cpu_design/320
Create:
Last Update:
Last Update:
An alternative design would have been to first convert from FP32 to BF16, rounding to odd, then use the instructions defined in the previous section to convert to OFP8. However, FP32 to OFP8 conversion is common enough to justify the direct conversion.
Интересный программный хак упомянули в сабсете векторных RISC-V инструкций для поддержки BF16 и операций преобразования для типов данных OFP8.
Чтобы избежать необходимости аппаратной реализации quad‑narrowing при конверсии FP32 в OFP8, можно использовать следующую последовательность из двух шагов, при этом сохраняя высокую точность операций конверсии:
1)
FP32 → BF16 с обязательным режимом округления rounding to odd.
2) BF16 → OFP8 с требуемым режимом округлени
я.
Дополнительные материалы по теме:
Черновик спецификации Zvfbfa доступен на GitHub.
Arm A64 Instruction Set Architecture: FCVTXN, FCVTXN2.
BY Записки CPU designer'a

Share with your friend now:
tgoop.com/cpu_design/320