最近のGPUでは低精度演算が優先されて倍精度浮動小数点数の性能は前世代よりも下がったりしている。そこで低精度演算を組み合わせて高精度演算を実装する手法が注目されているらしい。
https://www.theregister.com/2026/01/18/nvidia_fp64_emulation/
尾崎スキームという手法があり、8ビット整数などの低い精度の数で64ビット浮動小数点数などの高い精度の数の行列積を計算できる。2000 × 2000以上などの大きなサイズでは通常より高速になることもある。実数として考えると誤差なしだが、IEEE 754としては負のゼロなどが絡むと同一ではない。前処理と後処理で高精度演算は必要。使用メモリ量は増える。
https://arxiv.org/abs/2504.08009
https://link.springer.com/chapter/10.1007/978-3-030-50743-5_12
実アプリケーションで高速化できるとは限らないらしい。また、メモリ速度がボトルネックとなる場合もあるらしい。
https://www.theregister.com/2026/01/18/nvidia_fp64_emulation/
尾崎スキームという手法があり、8ビット整数などの低い精度の数で64ビット浮動小数点数などの高い精度の数の行列積を計算できる。2000 × 2000以上などの大きなサイズでは通常より高速になることもある。実数として考えると誤差なしだが、IEEE 754としては負のゼロなどが絡むと同一ではない。前処理と後処理で高精度演算は必要。使用メモリ量は増える。
https://arxiv.org/abs/2504.08009
https://link.springer.com/chapter/10.1007/978-3-030-50743-5_12
実アプリケーションで高速化できるとは限らないらしい。また、メモリ速度がボトルネックとなる場合もあるらしい。
- replies
- 0
- announces
- 0
- likes
- 0