Записки CPU designer'a@cpu

Записки CPU designer'a

An alternative design would have been to first convert from FP32 to BF16, rounding to odd, then use the instructions defined in the previous section to convert to OFP8. However, FP32 to OFP8 conversion is common enough to justify the direct conversion.

Интересный программный хак упомянули в сабсете векторных RISC-V инструкций для поддержки BF16 и операций преобразования для типов данных OFP8.

Чтобы избежать необходимости аппаратной реализации quad‑narrowing при конверсии FP32 в OFP8, можно использовать следующую последовательность из двух шагов, при этом сохраняя высокую точность операций конверсии:

1)

FP32 → BF16 с обязательным режимом округления rounding to odd.

2) BF16 → OFP8 с требуемым режимом округления.

Дополнительные материалы по теме:

Черновик спецификации Zvfbfa доступен на GitHub.

Arm A64 Instruction Set Architecture: FCVTXN, FCVTXN2.

GitHub

riscv-misc/isa/zvfbfa.adoc at main · aswaterman/riscv-misc

Contribute to aswaterman/riscv-misc development by creating an account on GitHub.

👍8✍3

www.tgoop.com/cpu_design/320

3.74K viewsMay 12 at 16:09

tgoop.com/cpu_design/320

Create: 2025-05-12
Last Update: 2025-10-23 15:44:45

An alternative design would have been to first convert from FP32 to BF16, rounding to odd, then use the instructions defined in the previous section to convert to OFP8. However, FP32 to OFP8 conversion is common enough to justify the direct conversion.

FP32 → BF16 с обязательным режимом округления rounding to odd.

BY Записки CPU designer'a

Share with your friend now:
tgoop.com/cpu_design/320

Telegram News

An alternative design would have been to first convert from FP32 to BF16