subtitle
12
02
Triton-MLIR Triton-MLIR
Triton-MLIR: Memory Coalesce [toc] Memory Coalesce是一个通用优化手段并不局限于Triton,以CUDA中访存通常会以一个Warp为单位进行,如果同一个Warp内多个线程的访存操作是连续的,那
2023-12-02 Paranoid