CUTLASS 2.4 (Implicit GEMM convolution) (#147)

CUTLASS 2.4 (Implicit GEMM Convolution) Co-authored-by: Manish Gupta <manigupta@nvidia.com>, Haicheng Wu <haichengw@nvidia.com>, Dustyn Blasig <dblasig@nvidia.com>, Andrew Kerr <akerr@nvidia.com>
2020-11-19 21:25:25 -08:00
parent c2b80ad4e4
commit 6615010cd0
224 changed files with 43939 additions and 1061 deletions
--- a/examples/03_visualize_layout/visualize_layout.cpp
+++ b/examples/03_visualize_layout/visualize_layout.cpp
@ -32,6 +32,8 @@
 #include <iomanip>
 #include <memory>

+#include <cutlass/cutlass.h>
+
 #include "options.h"
 #include "register_layout.h"

@ -133,6 +135,8 @@ int main(int argc, char const *arg[]) {

  layout_it->second->print_csv(std::cout);

+  cudaFree(0); // Ensure CUDA is available.
+
  return 0;
 }