Python module

registry

`estimate_kv_cache_size()`

max.kv_cache.registry.estimate_kv_cache_size(params, max_batch_size, max_seq_len, available_cache_memory)

Parameters:

Return type:

int

max.kv_cache.registry.infer_optimal_batch_size(params, max_seq_len, available_cache_memory, devices, **kwargs)

Parameters:

Return type:

int

max.kv_cache.registry.load_kv_manager(params, max_batch_size, max_seq_len, session, available_cache_memory)

Loads a single KV cache manager from the given params.

Parameters:

Return type:

PagedKVCacheManager

max.kv_cache.registry.load_kv_managers(params, max_batch_size, max_seq_len, session, available_cache_memory)

Loads (potentially multiple) KV cache managers from the given params.

Parameters:

Return type:

list[PagedKVCacheManager]