For the complete documentation index, see llms.txt. Markdown versions of all pages are available by appending .md to any URL (e.g. /max/get-started.md).

Python class

MHAMaskVariant

`MHAMaskVariant`

class max.nn.attention.MHAMaskVariant(value, names=<not given>, *values, module=None, qualname=None, type=None, start=1, boundary=None)

source

Bases: str, Enum

Defines the integer mask variant codes used by multihead attention kernels.

`CAUSAL_MASK`

CAUSAL_MASK = '0'

source

`CHUNKED_CAUSAL_MASK`

CHUNKED_CAUSAL_MASK = '3'

source

`NULL_MASK`

NULL_MASK = '2'

source

`SLIDING_WINDOW_CAUSAL_MASK`

SLIDING_WINDOW_CAUSAL_MASK = '4'

source

`SLIDING_WINDOW_NONCAUSAL_MASK`

SLIDING_WINDOW_NONCAUSAL_MASK = '5'

source

MHAMaskVariant​

CAUSAL_MASK​

CHUNKED_CAUSAL_MASK​

NULL_MASK​

SLIDING_WINDOW_CAUSAL_MASK​

SLIDING_WINDOW_NONCAUSAL_MASK​

`MHAMaskVariant`

`CAUSAL_MASK`

`CHUNKED_CAUSAL_MASK`

`NULL_MASK`

`SLIDING_WINDOW_CAUSAL_MASK`

`SLIDING_WINDOW_NONCAUSAL_MASK`