3.10 NEON ベクトル化によるパフォーマンスの目標

多くのアプリケーションでは、ベクトル化によって最高のパフォーマンスを得るために調整を行う必要があります。多少のオーバーヘッドは常に存在するため、理論的な最大パフォーマンスは達成できません。

たとえば、NEON ユニットは、同時に 4 つの単精度浮動小数点を処理できます。つまり、浮動小数点アプリケーションの理論的な最大パフォーマンスは、ベクトル化されていない元のスカラコードの 4 倍です。
関連する概念
3.17 条件付き終了の非ベクトル化
3.16 ポインタおよび間接アドレス指定を含むループの非ベクトル化
3.15 ポインタを含むループのベクトル化
3.14 ベクタのスカラへの縮退
3.13 キャリーアラウンドスカラ変数とベクトル化
3.12 コードをベクトル化するときのデータの依存関係による競合
3.9 NEON ベクトル化によるパフォーマンスに影響を与える要因
関連する参考文書
8.192 --vectorize、--no_vectorize
3.11 ベクトル化のために推奨されるループ構造
非機密扱いPDF file icon PDF 版ARM DUI0472LJ
Copyright © 2010-2015 ARM.All rights reserved.