”
テンプレートで書いた畳み込み層1(テンプレートのソースコード)”の続き。
前回はテンプレートで書いた畳み込み層のC ソースコードを貼ったので、今回はその性能を確認してみよう。
ヘッダファイルはHLSストリームのものをそのまま使用することができるが、テストベンチは畳み込み層を汎用化したため画像のピクセルを任意精度固定小数点データ型に変換する必要がある。それをテストベンチに追加した。
最初に C シミュレーションを行った。結果を示す。

任意精度固定小数点データ型の計算結果を 2 つの実装間で比較した結果にエラーは無い。テンプレートの計算結果も正しそうだ。
C コードの合成を行った。結果を示す。

HLSストリームで実装した”
HLSストリーム・インターフェースの畳み込み層3(Windows 10 のVivado HLS 使用)”の合成結果とほとんど同じだった。大丈夫そうだ。
Instance の grp_conv_layer_template_fu_24 をクリックして、テンプレート内の合成結果を示す。

Export RTL を行った。
なお、Vivado synthesis, place and route にチェックを入れている。

合成時よりもLUT や FF の個数が少なくなったが、DSP の個数は合成時と同じだ。
CP achieved post-implementation は 8.510 ns で問題なさそうだ。
- 2018年05月07日 04:55 |
- DNN
-
| トラックバック:0
-
| コメント:0