Fix typos 2 (#842)

Co-authored-by: Haicheng Wu <57973641+hwu36@users.noreply.github.com>
2023-03-09 20:22:56 -08:00
parent c4f6b8c6bc
commit 7e370c9637
161 changed files with 310 additions and 309 deletions
--- a/examples/44_multi_gemm_ir_and_codegen/ir_gen/gen_threadblock.py
+++ b/examples/44_multi_gemm_ir_and_codegen/ir_gen/gen_threadblock.py
@ -86,14 +86,14 @@ class gen_default_b2b_mma:
                                                "OperatorClass", str(stage), "Operator")
        return gen_code

-    def gen_using_FusedAddBiasEpilouge(self):
+    def gen_using_FusedAddBiasEpilogue(self):
        gen_code = ""
        for i in range(self.b2b_num - 1):
-            code_using = helper.var_idx("using FusedAddBiasEpilouge", i)
-            epilouge_name = "typename cutlass::epilogue::threadblock::DefaultFusedBiasActEpilogueTensorOp"
+            code_using = helper.var_idx("using FusedAddBiasEpilogue", i)
+            epilogue_name = "typename cutlass::epilogue::threadblock::DefaultFusedBiasActEpilogueTensorOp"
            template_args = helper.var_idx("<ThreadblockShape", i) + helper.var_idx(",typename MmaCore", i) + helper.var_idx("::MmaPolicy::Operator, 1, EpilogueOutputOp", i) + ", 2>::Epilogue"

-            gen_code += code_using + " = " + epilouge_name + template_args + ";\n"
+            gen_code += code_using + " = " + epilogue_name + template_args + ";\n"

        return gen_code        
        
@ -161,12 +161,12 @@ class gen_default_b2b_mma:
        MmaPipelined_param_list += "ElementAccumulator0, layout::RowMajor, "

        for i in range(self.b2b_num - 1):
-            epilouge_name = "EpilogueOutputOp" + str(i)
-            MmaPipelined_param_list += epilouge_name + ", "
+            epilogue_name = "EpilogueOutputOp" + str(i)
+            MmaPipelined_param_list += epilogue_name + ", "

        for i in range(self.b2b_num - 1):
-            epilouge_name = "FusedAddBiasEpilouge" + str(i)
-            MmaPipelined_param_list += epilouge_name + ", "
+            epilogue_name = "FusedAddBiasEpilogue" + str(i)
+            MmaPipelined_param_list += epilogue_name + ", "

        for i in range(self.b2b_num):
            MmaPolicy = "typename MmaCore" + str(i) + "::MmaPolicy"
@ -198,7 +198,7 @@ class gen_default_b2b_mma:
        mmacore_codebody = self.gen_using_MmaCore(2)
        iterator_codebody = self.gen_using_Iterator()
        fragment_iterator_codebody = self.gen_fragment_iterator()
-        epilogue_iterator_codebody = self.gen_using_FusedAddBiasEpilouge()
+        epilogue_iterator_codebody = self.gen_using_FusedAddBiasEpilogue()
        threadBlockMma = self.gen_threadblockmma()
        specialized_code = mmacore_codebody + iterator_codebody + fragment_iterator_codebody + epilogue_iterator_codebody + threadBlockMma

@ -352,7 +352,7 @@ class gen_b2b_mme_pipelined:
    }\n\
 \n\
    // Issue loads during the first warp-level matrix multiply-add *AFTER* issuing \n\
-    // shared memory loads (which have the tighest latency requirement).\n\
+    // shared memory loads (which have the tightest latency requirement).\n\
 \n\
    //\n\
    // Mainloop\n\
@ -459,7 +459,7 @@ class gen_b2b_mme_pipelined:
    }\n\
 \n\
    // Issue loads during the first warp-level matrix multiply-add *AFTER* issuing \n\
-    // shared memory loads (which have the tighest latency requirement).\n\
+    // shared memory loads (which have the tightest latency requirement).\n\
    iterator_A.load(tb_frag_A);\n\
 \n\
    //\n\
@ -490,7 +490,7 @@ class gen_b2b_mme_pipelined:
          __syncthreads();\n\
 \n\
          // Issue loads during the first warp-level matrix multiply-add *AFTER* issuing \n\
-          // shared memory loads (which have the tighest latency requirement).\n\
+          // shared memory loads (which have the tightest latency requirement).\n\
          iterator_A.load(tb_frag_A);\n\
          \n\
          ++this->smem_iterator_B0_;\n\
@ -549,12 +549,12 @@ class gen_b2b_mme_pipelined:
                code = "// " + str(id + 1) + " Gemm" 
                code += "    /// Iterator to load a warp-scoped tile of A1 operand from intermediate accumulator tile\n"
                
-                code += "    " + helper.var_idx("FragmentC", id - 1) + helper.var_idx(" after_epilouge_accu", id - 1) + ";\n"
+                code += "    " + helper.var_idx("FragmentC", id - 1) + helper.var_idx(" after_epilogue_accu", id - 1) + ";\n"
                code += "    " + helper.var_idx("epilogue_", id - 1) + helper.var_idx("(output_op_", id - 1) + helper.var_idx(", accum", id - 1) \
-                               + helper.var_idx(", after_epilouge_accu", id - 1) + helper.var_idx(", iterator_C", id - 1) +");\n"
+                               + helper.var_idx(", after_epilogue_accu", id - 1) + helper.var_idx(", iterator_C", id - 1) +");\n"
                
                #    FragmentIteratorA1 warp_tile_iterator_A1_(accum0); 
-                code += "    " + helper.var_idx("FragmentIteratorA", id) + helper.var_idx(" warp_tile_iterator_A", id) +"_(" + helper.var_idx("after_epilouge_accu", id - 1) + ");\n"
+                code += "    " + helper.var_idx("FragmentIteratorA", id) + helper.var_idx(" warp_tile_iterator_A", id) +"_(" + helper.var_idx("after_epilogue_accu", id - 1) + ");\n"
                #    FragmentB1 tb_frag_B1;
                code += "    " +  helper.var_idx("FragmentB", id) + " " + helper.var_idx("tb_frag_B", id) + ";\n"
                #    tb_frag_B1.clear();
@ -990,7 +990,7 @@ class gen_threadblock:


        self.gen_b2b_mma_base = gen_b2b_mma_base(template_param, gen_class_name, b2b_num, cutlass_deps_root, project_root)
-        self.gen_b2b_mma_piplined = gen_b2b_mme_pipelined(template_param, gen_class_name, b2b_num, cutlass_deps_root, project_root)
+        self.gen_b2b_mma_pipelined = gen_b2b_mme_pipelined(template_param, gen_class_name, b2b_num, cutlass_deps_root, project_root)
        self.gen_default_b2b_mma = gen_default_b2b_mma(template_param, gen_class_name, b2b_num, cutlass_deps_root, project_root)


@ -1001,7 +1001,7 @@ class gen_threadblock:

        with open(self.file_dir + "b2b_mma_base.h", "w+") as f:
            f.write(base_code)        
-        pipeline_code = self.gen_b2b_mma_piplined.gen_code(first_use_1stage = first_use_1stage)
+        pipeline_code = self.gen_b2b_mma_pipelined.gen_code(first_use_1stage = first_use_1stage)
        print("[INFO]: Gen kernel code [b2b_mma_pipelined.h]output Dir: is ", self.file_dir)

        with open(self.file_dir + "b2b_mma_pipelined.h", "w+") as f:
--- a/examples/44_multi_gemm_ir_and_codegen/ir_gen/gen_verify.py
+++ b/examples/44_multi_gemm_ir_and_codegen/ir_gen/gen_verify.py
@ -45,7 +45,7 @@ class gen_verify:
        self.user_header_file = ""
        for header in user_header_file: 
            self.user_header_file += "#include \"" + header + "\"\n"
-        self.seperate_cutlass = gen_basic.gen_volta_turing_fuse_act_impl(fuse_gemm_info, gen_class_name, user_header_file, output_dir)
+        self.separate_cutlass = gen_basic.gen_volta_turing_fuse_act_impl(fuse_gemm_info, gen_class_name, user_header_file, output_dir)
        self.gen_params()
        self.output_dir = output_dir

@ -53,14 +53,14 @@ class gen_verify:
    def gen_code(self):
        code = ""
        code += self.user_header_file
-        code += self.seperate_cutlass.gen_using(False)  #False -> Turing, True -> Volta
+        code += self.separate_cutlass.gen_using(False)  #False -> Turing, True -> Volta

        code_body = ""
        for i in range(self.b2b_num):
            code_body += "    " + helper.var_idx("Gemm", i) + helper.var_idx(" gemm_op_", i) + ";\n"
            code_body += "    " + helper.var_idx("gemm_op_", i) + helper.var_idx(".initialize(Arguments_", i) + ", nullptr);\n"

-        code_body += self.seperate_cutlass.gen_run()
+        code_body += self.separate_cutlass.gen_run()

        code += ir.gen_func(self.name, self.params, code_body)
        helper.write_2_headfile("cutlass_verify.h", self.output_dir, code)
@ -87,6 +87,6 @@ class gen_verify:

    def gen_initialize():
        code = ""
-        initialize_code = self.seperate_cutlass.gen_initialize()
+        initialize_code = self.separate_cutlass.gen_initialize()

        code = ir.gen_func("initialize", [[]])
--- a/examples/44_multi_gemm_ir_and_codegen/ir_gen/helper.py
+++ b/examples/44_multi_gemm_ir_and_codegen/ir_gen/helper.py
@ -83,23 +83,23 @@ def list_2_string(input_list, ):
    return rtn_string


-def get_epilouge_info(layer_info):
+def get_epilogue_info(layer_info):
    return layer_info['epilogue']

 def get_epilogue_tp(layer_info):
-    epilogue_info = get_epilouge_info(layer_info)
+    epilogue_info = get_epilogue_info(layer_info)
    return epilogue_info['tp']

 def get_epilogue_add_bias_or_not(layer_info):
-    epilogue_info = get_epilouge_info(layer_info)
+    epilogue_info = get_epilogue_info(layer_info)
    return epilogue_info['bias']['addbias']

 def get_epilogue_add_bias_tp(layer_info):
-    epilogue_info = get_epilouge_info(layer_info)
+    epilogue_info = get_epilogue_info(layer_info)
    return epilogue_info['bias']['bias_tp']

 def get_epilogue_args(layer_info):
-    epilogue_info = get_epilouge_info(layer_info)
+    epilogue_info = get_epilogue_info(layer_info)
    return epilogue_info['args']

 def get_epilogue_bias_shape(layer_info):