CUTLASS 2.10 (#615)

Co-authored-by: Aniket Shivam <ashivam@nvidia.com>
2022-09-03 15:48:46 -07:00
parent ca23ff7924
commit b72cbf957d
289 changed files with 43708 additions and 2513 deletions
--- a/media/docs/functionality.md
+++ b/media/docs/functionality.md
@ -2,6 +2,8 @@

 [README](/README.md#documentation) > **Functionality**

+# Functionality
+
 - N - Column Major Matrix
 - T - Row Major matrix
 - {N,T} x {N,T} - All combinations, i.e. NN, NT, TN, TT
@ -18,8 +20,6 @@
 - SpTensorOp - Use Sparse Tensor Core MMA
 - WmmaTensorOp - Use WMMA abstraction to use Tensor Core MMA

-# Functionality
-
 ## Device-level GEMM

 The following table summarizes device-level GEMM kernels in CUTLASS, organized by opcode class, data type, and layout.