Очолювана Джимом Келлером чіпна компанія Tenstorrent випустила свій процесор Wormhole нового покоління для робочих навантажень ШІ, який, як очікується, запропонує хорошу продуктивність за доступною ціною.Зараз компанія пропонує дві додаткові карти PCIe, які можуть вмістити один або два процесори Wormhole, а також робочі станції TT-LoudBox і TT-QuietBox для розробників програмного забезпечення. Усі сьогоднішні оголошення спрямовані на розробників, а не на тих, хто використовує плати Wormhole для комерційних навантажень.
«Завжди приємно отримувати більше наших продуктів у руки розробників. Системи розробки випусків із використанням наших карт Wormhole™ можуть допомогти розробникам масштабувати та розробляти багаточіпове програмне забезпечення ШІ», — сказав Джим Келлер, генеральний директор Tenstorrent.На додаток до цього запуску, ми раді бачити прогрес, який ми робимо з записом і підключенням нашого продукту другого покоління, Blackhole».
Кожен процесор Wormhole містить 72 ядра Tensix (п’ять з яких підтримують ядра RISC-V у різних форматах даних) і 108 МБ SRAM, що забезпечує 262 FP8 TFLOPS на частоті 1 ГГц із проектною тепловою потужністю 160 Вт. Однокристальна карта Wormhole n150 оснащена 12 ГБ відеопам'яті GDDR6 і має пропускну здатність 288 ГБ/с.
Процесори Wormhole забезпечують гнучку масштабованість для задоволення різноманітних потреб робочого навантаження. У стандартній установці робочої станції з чотирма картами Wormhole n300 процесори можуть бути об’єднані в один блок, який відображається в програмному забезпеченні як уніфікована широка мережа ядра Tensix. Ця конфігурація дозволяє прискорювачу обробляти однакове робоче навантаження, розподіляючи його між чотирма розробниками або запускаючи до восьми різних моделей ШІ одночасно. Ключовою особливістю цієї масштабованості є те, що вона може працювати локально без необхідності віртуалізації. У середовищі центру обробки даних процесори Wormhole використовуватимуть PCIe для розширення всередині машини або Ethernet для зовнішнього розширення.
Що стосується продуктивності, однокристальна карта Tenstorrent Wormhole n150 (72 ядра Tensix, частота 1 ГГц, 108 МБ SRAM, 12 ГБ GDDR6, пропускна здатність 288 ГБ/с) досягла 262 FP8 TFLOPS при 160 Вт, тоді як двочіпова плата Wormhole n300 (128 ядер Tensix, частота 1 ГГц, 192 МБ SRAM, сукупна 24 ГБ GDDR6, пропускна здатність 576 ГБ/с) забезпечує до 466 FP8 TFLOPS при 300 Вт.
Щоб розмістити 300 Вт із 466 FP8 TFLOPS у контексті, ми порівняємо це з тим, що пропонує лідер ринку штучного інтелекту Nvidia з такою тепловою потужністю. Nvidia A100 не підтримує FP8, але підтримує INT8 з максимальною продуктивністю 624 TOPS (1248 TOPS при розрідженні). Для порівняння, H100 від Nvidia підтримує FP8 і досягає максимальної продуктивності 1670 TFLOPS при 300 Вт (3341 TFLOPS при розрідженні), що значно відрізняється від Wormhole n300 від Tenstorrent.
Однак є одна серйозна проблема. Wormhole n150 від Tenstorrent продається за 999 доларів, тоді як n300 продається за 1399 доларів. Для порівняння, одна відеокарта Nvidia H100 продається за 30 000 доларів, залежно від кількості. Звичайно, ми не знаємо, чи можуть чотири чи вісім процесорів Wormhole справді забезпечити продуктивність одного H300, але їх TDP становить 600 Вт і 1200 Вт відповідно.
На додаток до карт Tenstorrent пропонує готові робочі станції для розробників, включаючи 4 карти n300 у доступнішому TT-LoudBox на основі Xeon з активним охолодженням і вдосконаленому TT-QuietBox з функцією рідинного охолодження Xiaolong на основі EPYC).
Час публікації: 29 липня 2024 р