Інженер OpenAI Клайв Чан Оскаржує Рекомендації щодо Апаратного Забезпечення V4, Посилаючись на Помилки та Невизначеність Порівняно з V3

Повідомлення Gate News, 24 квітня — інженер OpenAI Клайв Чан висунув детальні заперечення до розділу з рекомендаціями щодо апаратного забезпечення у технічному звіті V4, назвавши його “дивовижно посереднім і таким, що схильний до помилок” порівняно з відомою версією V3. Апаратні рекомендації V3, які включали сесії Q&A, що стали найпопулярнішою темою для обговорення на академічній конференції ISCA, пропонували конкретні рекомендації, узгоджені з галузевими стандартами інтерконекту. Натомість V4 є значно більш невизначеним.

Чан системно оскаржив три ключові рекомендації. Щодо споживання електроенергії, у звіті стверджується, що оптимізація програмного забезпечення дозволяє чипам одночасно працювати на повну потужність для обчислень, зберігання та зв’язку, і рекомендується виробникам чипів залишати додатковий запас потужності. Чан вважає це контрпродуктивним: загальна потужність чипа обмежена фізичними обмеженнями процесу, тож резервування більшого запасу потужності лише знижує робочу частоту, зрештою зменшуючи обчислювальну продуктивність. Щодо передавання даних між GPU, у звіті пропонується модель pull — коли GPU активно отримують дані — замість моделі push, посилаючись на високу накладну вартість сповіщень у операціях push. Чан заперечує це, стверджуючи, що pull насправді повільніший і що були б кращими покращені можливості мережевих адаптерів. Однак вони можуть обговорювати різні рівні проблеми: звіт говорить про накладні витрати механізму сповіщень, тоді як Чан має на увазі саму затримку передавання.

Щодо функцій активації, у звіті рекомендується замінити SwiGLU на простіші функції, щоб зменшити обчислювальне навантаження. Чан не бачить у цьому жодної користі, зазначаючи, що Sonic MoE вже продемонстрував оптимальну продуктивність із використанням SwiGLU. Чан припускає, що DeepSeek може мати “навмисно ослабив цей розділ.”

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Xpeng і Xiaomi очолюють поштовх у бортовий ШІ на Пекінському автосалоні

Повідомлення Gate News, 24 квітня — Китайські автовиробники показали передові вбудовані в авто системи ШІ на Пекінському автосалоні 24 квітня, оскільки країна прискорює свою стратегію AI Plus та прагне більшої незалежності від іноземних напівпровідників. Xpeng продемонструвала голосокероване паркування, яке дозволяє водіям «

GateNews26хв. тому

Колишній інженер Seed у ByteDance: ітерації AI у ByteDance тривають шість місяців проти трьох у Google

Повідомлення Gate News, 24 квітня — Чжан Чі, колишній інженер команди Seed у ByteDance та нинішній доцент Пекінського університету, розповів у подкасті "Into Asia", що ByteDance потрібно приблизно шість місяців, щоб завершити один повний цикл тренування великих мовних моделей (pretraining

GateNews42хв. тому

Naver запускає бета-версію AI Tab, коли Google Gemini виходить на ринок пошуку Південної Кореї

Повідомлення Gate News, 24 квітня — Naver оголосила про старт закритої бета-версії AI Tab, її нової функції розмовного пошуку, після запуску Google Gemini у Chrome в Південній Кореї. AI Tab з’явиться поруч із наявними вкладками пошуку Naver, надаючи користувачам окремий простір для розмовних

GateNews1год тому

Індія: найм у сфері AI-інжинірингу стрімко зростає на 59,5%, виходить за межі технопарків

AI Labor Market Report 2026 від LinkedIn, опублікований 24 квітня, виявив, що найм AI-інженерів в Індії зріс на 59,5% у річному обчисленні, що стало найшвидшими темпами серед ринків, досліджених платформою. Зростання було зумовлено тим, що попит поширився за межі усталених технологічних центрів. Міста, зокрема

CryptoFrontier1год тому

Commonwealth Bank Скорочує 120 Робочих Місць На Тлі Розширення ШІ

Commonwealth Bank of Australia оголосив, що скоротить приблизно 120 робочих місць, оскільки найбільший у країні банк переглядає посади та розширює використання штучного інтелекту, повідомляє Bloomberg. Скорочення включають 43 посади в Bankwest у Західній Австралії, причому шість позицій зазнають впливу автоматизації. Це a

CryptoFrontier1год тому

Cursor розкриває причину тренування XAI: обчислювальні потужності були затиснуті, SpaceX додатково має 60 мільярдів доларів на опціони на придбання

Оголошення Anysphere стверджує, що Cursor буде навчати нову модель разом із xAI на основі інфраструктури Colossus, щоб подолати вузьке місце з обчислювальною потужністю; SpaceX запропонувала опціон на придбання на 60 мільярдів доларів США (можна здійснити повне придбання протягом 2026 року), а якщо ні — сплатити приблизно 10 мільярдів доларів США як компенсацію за співпрацю. Обидві угоди відбуваються одночасно, змінюючи те, хто зможе навчати Cursor і хто зможе викупити Cursor; Cursor досі дозволяє багатьом бекендам моделей, але в довгостроковій перспективі все залежить від того, чи здійснить SpaceX своє право на придбання.

ChainNewsAbmedia2год тому
Прокоментувати
0/400
Немає коментарів