For the complete documentation index, see llms.txt. Markdown versions of all pages are available by appending .md to any URL (e.g. /max/get-started.md).

Mojo module

fp4_utils

`comptime` values

`E2M1_TO_FLOAT32`

comptime E2M1_TO_FLOAT32 = SIMD(SIMD(0), SIMD(0.5), SIMD(1), SIMD(1.5), SIMD(2), SIMD(3), SIMD(4), SIMD(6), SIMD(-0.0), SIMD(-0.5), SIMD(-1), SIMD(-1.5), SIMD(-2), SIMD(-3), SIMD(-4), SIMD(-6), __list_literal__=NoneType(None))

`FP4_E2M1_MANTISSA_WIDTH`

comptime FP4_E2M1_MANTISSA_WIDTH = 1

`FP4_E2M1_MAX_EXPONENT`

comptime FP4_E2M1_MAX_EXPONENT = 2

`MXFP4_SF_DTYPE`

comptime MXFP4_SF_DTYPE = DType.float8_e8m0fnu

`MXFP4_SF_VECTOR_SIZE`

comptime MXFP4_SF_VECTOR_SIZE = 32

`MXFP8_SF_DTYPE`

comptime MXFP8_SF_DTYPE = DType.float8_e8m0fnu

`MXFP8_SF_VECTOR_SIZE`

comptime MXFP8_SF_VECTOR_SIZE = 32

`NVFP4_SF_DTYPE`

comptime NVFP4_SF_DTYPE = DType.float8_e4m3fn

`NVFP4_SF_VECTOR_SIZE`

comptime NVFP4_SF_VECTOR_SIZE = 16

`SF_ATOM_K`

comptime SF_ATOM_K = 4

`SF_ATOM_M`

comptime SF_ATOM_M = Tuple(32, 4)

`SF_K_GROUP_SIZE`

comptime SF_K_GROUP_SIZE[SF_VECTOR_SIZE: Int] = (4 * SF_VECTOR_SIZE)

Parameters

SF_VECTOR_SIZE (Int):

`SF_MN_GROUP_SIZE`

comptime SF_MN_GROUP_SIZE = ((load_from_mem SF_ATOM_M.__getitem_param__[0]()) * (load_from_mem SF_ATOM_M.__getitem_param__[1]()))

Functions

cast_f4e2m1x2_to_fp16x2:
cast_float_to_fp4e2m1_amd:
cast_fp32_to_fp4e2m1:
cast_fp_to_fp4e2m1:
cast_uint_to_fp4e2m1:
compute_mxfp4_even_scale: Computes the OCP MXFP4 E8M0 scale using even-mode rounding.
convert_ref_scales_to_mxfp8_format:
get_batched_scale_factor:
get_scale_factor:
get_scaling_kind:
set_batched_scale_factor:
set_scale_factor:

comptime values​

E2M1_TO_FLOAT32​

FP4_E2M1_MANTISSA_WIDTH​

FP4_E2M1_MAX_EXPONENT​

MXFP4_SF_DTYPE​

MXFP4_SF_VECTOR_SIZE​

MXFP8_SF_DTYPE​

MXFP8_SF_VECTOR_SIZE​

NVFP4_SF_DTYPE​

NVFP4_SF_VECTOR_SIZE​

SF_ATOM_K​

SF_ATOM_M​

SF_K_GROUP_SIZE​

Parameters​

SF_MN_GROUP_SIZE​

Functions​