Компанія-виробник мікросхем Tenstorrent під керівництвом Джима Келлера випустила свій процесор Wormhole наступного покоління для робочих навантажень штучного інтелекту, який, як очікується, запропонує хорошу продуктивність за доступною ціною.Наразі компанія пропонує дві додаткові карти PCIe, які можуть вмістити один або два процесори Wormhole, а також робочі станції TT-LoudBox та TT-QuietBox для розробників програмного забезпечення. Усі сьогоднішні анонси спрямовані на розробників, а не на тих, хто використовує плати Wormhole для комерційних навантажень.
«Завжди приємно отримувати більше наших продуктів від розробників. Системи розробки релізів з використанням наших карт Wormhole™ можуть допомогти розробникам масштабувати та розробляти багаточипове програмне забезпечення для штучного інтелекту», — сказав Джим Келлер, генеральний директор Tenstorrent.Окрім цього запуску, ми раді бачити прогрес, якого ми досягаємо з випуском стрічки та запуском нашого продукту другого покоління, Blackhole.

Кожен процесор Wormhole містить 72 ядра Tensix (п'ять з яких підтримують ядра RISC-V у різних форматах даних) та 108 МБ SRAM, що забезпечує продуктивність 262 FP8 TFLOPS на частоті 1 ГГц з тепловим навантаженням 160 Вт. Одночіпова карта Wormhole n150 оснащена 12 ГБ відеопам'яті GDDR6 та має пропускну здатність 288 ГБ/с.
Процесори Wormhole забезпечують гнучку масштабованість для задоволення різноманітних потреб робочих навантажень. У стандартній конфігурації робочої станції з чотирма картами Wormhole n300 процесори можна об'єднати в один блок, який відображається в програмному забезпеченні як єдина, широка мережа ядра Tensix. Така конфігурація дозволяє прискорювачу обробляти одне й те саме робоче навантаження, розділяти його між чотирма розробниками або запускати до восьми різних моделей штучного інтелекту одночасно. Ключовою особливістю такої масштабованості є те, що він може працювати локально без необхідності віртуалізації. У середовищі центру обробки даних процесори Wormhole використовуватимуть PCIe для розширення всередині машини або Ethernet для зовнішнього розширення.
Що стосується продуктивності, одночіпова плата Wormhole n150 від Tenstorrent (72 ядра Tensix, частота 1 ГГц, 108 МБ SRAM, 12 ГБ GDDR6, пропускна здатність 288 ГБ/с) досягла 262 FP8 TFLOPS при споживанні 160 Вт, тоді як двочіпова плата Wormhole n300 (128 ядер Tensix, частота 1 ГГц, 192 МБ SRAM, сукупно 24 ГБ GDDR6, пропускна здатність 576 ГБ/с) забезпечує до 466 FP8 TFLOPS при споживанні 300 Вт.
Щоб зрозуміти контекст 300 Вт і 466 FP8 TFLOPS, порівняємо це з тим, що пропонує лідер ринку штучного інтелекту Nvidia з такою тепловою потужністю. Nvidia A100 не підтримує FP8, але підтримує INT8, з піковою продуктивністю 624 TOPS (1248 TOPS при розрідженому режимі). Для порівняння, Nvidia H100 підтримує FP8 і досягає пікової продуктивності 1670 TFLOPS при 300 Вт (3341 TFLOPS при розрідженому режимі), що суттєво відрізняється від Wormhole n300 від Tenstorrent.
Однак є одна серйозна проблема. Wormhole n150 від Tenstorrent продається за 999 доларів, тоді як n300 — за 1399 доларів. Для порівняння, одна відеокарта Nvidia H100 коштує 30 000 доларів, залежно від кількості. Звичайно, ми не знаємо, чи чотири чи вісім процесорів Wormhole можуть забезпечити продуктивність одного H300, але їхній TDP становить 600 Вт і 1200 Вт відповідно.
Окрім відеокарт, Tenstorrent пропонує попередньо зібрані робочі станції для розробників, включаючи 4 відеокарти n300 у більш доступній версії TT-LoudBox на базі Xeon з активним охолодженням та вдосконаленій TT-QuietBox на базі EPYC (Xiaolong) з функцією рідинного охолодження.
Час публікації: 29 липня 2024 р.