For the complete documentation index, see llms.txt. Markdown versions of all pages are available by appending .md to any URL (e.g. /max/get-started.md).

Python function

ragged_token_merger

`ragged_token_merger()`

max.pipelines.speculative.ragged_token_merger(device)

source

Builds a graph that merges prompt and draft tokens into a single ragged sequence.

Parameters:: device (DeviceRef) – Device for the graph inputs and merge op.
Returns:: A graph that takes prompt tokens, prompt row offsets, and draft tokens and outputs merged tokens and merged row offsets.
Return type:: Graph

ragged_token_merger()​

`ragged_token_merger()`