2016-10-29

CPU の FP16C を使って float (FP32) と half (FP16) を変換する方法

CPU が FP16C をサポートしていれば、下記の Intrinsics を使って float (FP32) と half (FP16) 間の変換ができる。
  • __m256 _mm256_cvtph_ps (__m128i a)
  • __m128i _mm256_cvtps_ph (__m256 a, int rounding)
https://software.intel.com/sites/landingpage/IntrinsicsGuide/#othertechs=FP16C

関連