For the complete documentation index, see llms.txt. Markdown versions of all pages are available by appending .md to any URL (e.g. /max/get-started.md).

Mojo module

matmul_mma

MMA operators for AMD matmul kernels.

Structs: TiledMma: Stateless MMA computation on TileTensors (mirrors TiledTensorCore.mma). Pure computation, no register ownership. MmaOp: Register ownership + SMEM loading + schedule API. Wraps TiledMma for per-k-tile load_frag/mma dispatch. QuadrantMmaOp: Owns A/B/C register tiles in LOCAL, provides quadrant load/compute methods for ping-pong double-buffering schedule.

Data-movement primitives (TileLoaderLDS, _load_from_lds, load_lds_fragment) live in structured_kernels.amd_tile_io.

Structs

MmaOp: Register ownership + SMEM loading + schedule API for AMD matmul.
QuadrantMmaOp: MMA operator for AMD matmul ping-pong schedule.
TiledMma: Stateless MMA computation on TileTensors.

Structs​

Structs