Mojo module

info

Contains information about GPU architectures and their capabilities.

This module provides detailed specifications for various GPU models including NVIDIA and AMD GPUs. It includes information about compute capabilities, memory specifications, thread organization, and performance characteristics.

Aliases

`A10`

alias A10 = GPUInfo("A10", Vendor(2), "cuda", "ampere", 8.5999999999999996, "sm_86", 72, 32, 1536, 32, 64, 2048, 32, 102400, 65536, 256, "warp", 255, 65536, 16, 128, 4, 1024)

`A100`

alias A100 = GPUInfo("A100", Vendor(2), "cuda", "ampere", 8, "sm_80", 108, 32, 2048, 32, 64, 2048, 32, 167936, 65536, 256, "warp", 255, 65536, 32, 128, 4, 1024)

`B100`

alias B100 = GPUInfo("B100", Vendor(2), "cuda", "blackwell", 10, "sm_100a", 132, 32, -1, 32, 64, 1536, 32, 262144, 65536, 256, "warp", 255, 65536, 32, 128, 4, 1024)

`B200`

alias B200 = GPUInfo("B200", Vendor(2), "cuda", "blackwell", 10, "sm_100a", 148, 32, -1, 32, 64, 2048, 32, 233472, 65536, 256, "warp", 255, 65536, 32, 128, 4, 1024)

`H100`

alias H100 = GPUInfo("H100", Vendor(2), "cuda", "hopper", 9, "sm_90a", 132, 32, 2048, 32, 64, 2048, 32, 233472, 65536, 256, "warp", 255, 65536, 32, 128, 4, 1024)

`L4`

alias L4 = GPUInfo("L4", Vendor(2), "cuda", "ada", 8.9000000000000004, "sm_89", 58, 32, 1536, 32, 64, 2048, 32, 102400, 65536, 256, "warp", 255, 65536, 24, 128, 4, 1024)

`MI300X`

alias MI300X = GPUInfo("MI300X", Vendor(1), "hip", "gfx942", 9.4000000000000003, "CDNA3", 304, 64, 2048, 64, 32, 2048, 2, 65536, 65536, 256, "warp", 255, 65536, 2, 128, 4, 1024)

`NoGPU`

alias NoGPU = GPUInfo("NoGPU", Vendor(0), "none", "no_gpu", 0, "", 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, "none", 0, 0, 0, 0, 0, 0)

`OrinNano`

alias OrinNano = GPUInfo("Orin Nano", Vendor(2), "cuda", "ampere", 8.6999999999999993, "sm_87", 8, 32, 1536, 32, 64, 2048, 32, 167936, 65536, 256, "warp", 255, 65536, 16, 128, 4, 1024)

`Radeon7600`

alias Radeon7600 = GPUInfo("Radeon 7600", Vendor(1), "hip", "gfx1102", 11, "RDNA3", 32, 32, 1024, 32, 32, 1024, 2, 32768, 32768, 256, "warp", 255, 32768, 2, 128, 4, 1024)

`Radeon7800`

alias Radeon7800 = GPUInfo("Radeon 7800/7700", Vendor(1), "hip", "gfx1101", 11, "RDNA3", 60, 32, 1024, 32, 32, 1024, 2, 32768, 32768, 256, "warp", 255, 32768, 2, 128, 4, 1024)

`Radeon780m`

alias Radeon780m = GPUInfo("Radeon 780M", Vendor(1), "hip", "gfx1103", 11, "RDNA3", 12, 32, 1024, 32, 32, 1024, 2, 32768, 32768, 256, "warp", 255, 32768, 2, 128, 4, 1024)

`Radeon7900`

alias Radeon7900 = GPUInfo("Radeon 7900", Vendor(1), "hip", "gfx1100", 11, "RDNA3", 96, 32, 1024, 32, 32, 1024, 2, 32768, 32768, 256, "warp", 255, 32768, 2, 128, 4, 1024)

`Radeon9060`

alias Radeon9060 = GPUInfo("Radeon 9060", Vendor(1), "hip", "gfx1200", 12, "RDNA4", 32, 32, 1024, 32, 32, 1024, 2, 32768, 32768, 256, "warp", 255, 32768, 2, 128, 4, 1024)

`Radeon9070`

alias Radeon9070 = GPUInfo("Radeon 9070", Vendor(1), "hip", "gfx1201", 12, "RDNA4", 64, 32, 1024, 32, 32, 1024, 2, 32768, 32768, 256, "warp", 255, 32768, 2, 128, 4, 1024)

`RTX2060`

alias RTX2060 = GPUInfo("RTX2060", Vendor(2), "cuda", "turing", 7.5, "sm_75", 30, 32, 2048, 32, 64, 2048, 16, 65536, 65536, 256, "warp", 255, 32768, 16, 32, 4, 1024)

`RTX3090`

alias RTX3090 = GPUInfo("NVIDIA GeForce RTX 3090", Vendor(2), "cuda", "ampere", 8.5999999999999996, "sm_86", 82, 32, -1, 32, 64, 1536, 16, 102400, 65536, 256, "warp", 255, 65536, 16, 128, 4, 1024)

`RTX4090`

alias RTX4090 = GPUInfo("RTX4090", Vendor(2), "cuda", "ada lovelace", 8.9000000000000004, "sm_89", 128, 32, -1, 32, 64, 1536, 24, 102400, 65536, 256, "warp", 255, 65536, 24, 128, 4, 1024)

`RTX4090m`

alias RTX4090m = GPUInfo("RTX4090m", Vendor(2), "cuda", "ada lovelace", 8.9000000000000004, "sm_89", 76, 32, -1, 32, 64, 1536, 24, 102400, 65536, 256, "warp", 255, 65536, 24, 128, 4, 1024)

`RTX5090`

alias RTX5090 = GPUInfo("RTX5090", Vendor(2), "cuda", "blackwell", 12, "sm_120a", 170, 32, -1, 32, 64, 1536, 32, 59392, 65536, 256, "warp", 255, 65536, 32, 128, 4, 1024)

Structs

GPUInfo: Comprehensive information about a GPU architecture.
Vendor: Represents GPU vendors.

Functions

is_cpu: Checks if the target is a CPU (compile-time version).
is_gpu: Checks if the target is a GPU (compile-time version).
is_valid_target: Checks if the target is valid (compile-time version).

Aliases​

A10​

A100​

B100​

B200​

H100​

L4​

MI300X​

NoGPU​

OrinNano​

Radeon7600​

Radeon7800​

Radeon780m​

Radeon7900​

Radeon9060​

Radeon9070​

RTX2060​

RTX3090​

RTX4090​

RTX4090m​

RTX5090​

Structs​

Functions​