За даними Jinshi на 3 березня, недавно група Lenovo оголосила про вперше в галузі самостійне розгортання великої моделі DeepSeek-R1/V3 671B на сервері Lenovo WAT7780 G3, здатному забезпечити плавний досвід для 100 паралельних користувачів з об’ємом пам’яті менше 1TGB (фактично 768GB). За даними Lenovo, система витримала стандартне тестування на 512 токенів, підтримуючи стабільний вихід 10 токенів в секунду для 100 паралельних користувачів і скорочуючи час відповіді першого токену до 30 секунд.
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до
Застереження.