”
テンプレートで書いた畳み込み層の ReLU 1(ソースコード)”の続き。
前回は、畳み込み層のReLUをテンプレートを作って作成し、そのソースコードを貼った。今回は、C シミュレーション、C コードの合成、Export RTL を行った。C/RTL 協調シミュレーションは省いた。
C シミュレーションを行った。結果を示す。

問題無い。ReLU は 0 以下を 0 にしているだけなので、特段の検証は必要ないだろう。
C コードの合成を行った。結果を示す。

Estmated は 6.77 ns で、Latency は 318 クロックだった。
リソース使用量は FF が 168 個、LUT が 393 個だった。
これは、”
HLSストリーム・インターフェースのReLU1”と比べると、すべての項目で上回っている。メインのコードはほとんど同じなのにテンプレートで書くと性能が良くなるのだろうか?
Detail の Instance の grp_relu_template_fu_24 をクリックして結果を見た。

C/RTL 協調シミュレーションは飛ばして、Export RTL を行った。
なお、Vivado synthesis, place and route にチェックを入れている。

いつもながら、LUT も FF も個数が合成時よりも減っている。
CP achieved post-implementation は 4.839 ns で、200 MHz でも動作しそうだ。
- 2018年05月09日 04:46 |
- DNN
-
| トラックバック:0
-
| コメント:0