CUDA メモ
Windows で CUDA を使う
2016-10-29
CPU の FP16C を使って float (FP32) と half (FP16) を変換する方法
CPU が FP16C をサポートしていれば、下記の Intrinsics を使って float (FP32) と half (FP16) 間の変換ができる。
__m256 _mm256_cvtph_ps (__m128i a)
__m128i _mm256_cvtps_ph (__m256 a, int rounding)
https://software.intel.com/sites/landingpage/IntrinsicsGuide/#othertechs=FP16C
関連
CPU で float(FP32) 型から half(FP16) 型へ変換する(逆変換もあり)方法
Newer Posts
Older Posts
Home
Subscribe to:
Posts (Atom)