Triton-MLIR: Memory Coalesce
[toc]
Memory
Coalesce是一个通用优化手段并不局限于Triton,以CUDA中访存通常会以一个Warp为单位进行,如果同一个Warp内多个线程的访存操作是连续的,那
2023-12-02