Нещодавно я ознайомився з тестовим звітом одного з провідних проектів мережі зберігання даних, і одне число майже засліпило мене.
Система заявляє загальну ємність понад 5PB, але медіана зберігання на один вузол становить лише 1.18TB. Я швидко порахував — 105 вузлів, медіана 1.18TB, разом це приблизно 124TB. А де ж решта 4876TB?
Після перевірки зрозумів, що ці 5PB — це "теоретична загальна ємність", тобто сумарний обсяг зберігання, заявлений вузлами. Це нагадує тренажерний зал, де загальна вартість обладнання — 5 мільйонів, але одночасно реальною користю користуються лише 12%. Якщо дивитися так, то "плавання" вузлів перевищує 80%. Мережа ще далека від справжнього етапу стрес-тестування.
Ще більш болюче — це питання використання. Галузеві аналітики відзначили один феномен: у звітах дуже активно показується "загальна ємність", але щодо реальних показників "використаної/обіцяної ємності" обходять стороною. За нинішньої конфігурації 105 вузлів, щоб досягти реальної 5PB зберігання, кожен вузол має обробляти в середньому 47.6TB даних — це в 40 разів більше за нинішню медіану навантаження. За таких умов чи зможе мережа зберегти низьку затримку? Це велике питання.
Ще більш вражаюче — під час 60-денного тесту обсяг метаданих (221.5GB) і фактичних даних (1.18TB) мають співвідношення приблизно 1:5.3. У дослідженні згадувалося, що для системи з 1000 вузлами метадані можуть бути фіксованими — 64KB на вузол. Якщо у системі з’явиться багато дрібних файлів, ця "метадані-накрутка" з’їсть значну частину корисного простору, і вартість зросте в кілька разів.
Загалом, цей проект демонструє технічний потенціал мережі зберігання, але "загальна ємність" — це як нафарбувати мережу. Який справжній рівень використання та ефективності? Звіт майстерно уникає цього питання. Якщо хтось використовує "загальну ємність" для оцінки проекту, то, мабуть, там дуже багато води, яку потрібно ретельно вичавити.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
17 лайків
Нагородити
17
6
Репост
Поділіться
Прокоментувати
0/400
TopBuyerBottomSeller
· 01-21 07:45
Зачекайте, ці дані настільки химерні, 5PB заявлено, а фактично лише 124TB? Кажучи просто, це обман.
---
Це ж просто гра з цифрами, теоретичні 5PB звучать дуже вражаюче, але фактичне використання таке слабке.
---
Я хочу запитати: за цим темпом коли справді зможемо витримати тиск у 5PB, чи залишимося назавжди на стадії презентацій?
---
Що стосується пропорції метаданих, це дійсно цікаво: накопичення дрібних файлів одразу ж підвищує витрати, і про цей ризик проект точно знав.
---
Що стосується рівня "прохолоджування" вузлів понад 80%, чому раптом ніхто не обговорює це? Оцінка завищена.
---
І ще хтось слідує за трендом і бере участь — справжня вигода від інформаційної нерівності.
---
Обхід реальних показників у звіті — досить хитрий хід, головне, щоб цифри виглядали гарно, хто буде рахувати детально?
---
Чи реальною є потреба у 47.6TB навантаження на вузли з урахуванням існуючого обладнання? Це справжнє питання.
---
Ще один проект мрій, де головне — гарна "загальна ємність".
Переглянути оригіналвідповісти на0
CounterIndicator
· 01-20 10:54
Я — братан з індикаторів зворотного зв’язку, ось моя коментар:
---
5PB — номінальні цифри, насправді лише 124TB, це зовсім не дрібниця.
---
Знову ця стара гра "теоретичної ємності", цифри роздуваються до небес, але в реальних даних все зменшується у рази.
---
80% рівень "прохолодності"? Метод порівняння з тренажерним залом — просто геніально, ха-ха, це поширена проблема зберігаючих мереж.
---
Медіана 1.18TB проти 47.6TB — зараз я справді не вірю у низьку затримку.
---
Податок на метадані — це справжня пастка, багато маленьких файлів — витрати злітають у небо, у звіті проекту це просто ігнорується.
---
Наратив про загальну ємність — чистий самозакоханий трюк, справжнє розуміння використання показує, наскільки глибока ця вода.
---
105 вузлів для підтримки 5PB? Я цього логіки не розумію.
---
Звіт уникає говорити про "зайняту ємність", що там за графіки?
---
Здається, є потенціал, але при оцінці потрібно знизити ціну у десять разів, щоб ризикнути.
---
Пропорція метаданих 1:5.3, з великими файлами ще нормально, але для малих файлів ціна може зрости у кілька разів, про цю пастку ніхто не говорить.
5PB теоретичних зусиль, фактично 124TB... ця цифра просто неймовірна
---
80% водіння вузлами, це ще називається мережею? смішно
---
Розповіді на основі "загальної ємності", справді може вибухнути при використанні
---
Податок на метадані одразу ж руйнує все, дивимося на купи малих файлів
---
47.6TB навантаження у 40 разів... не кажучи вже про низьку затримку, якщо взагалі працює — це вже добре
---
Ще один проект PPT, дані можуть брехати, але рахувати не вміють
---
Ця логіка така сама, як заповненість тренажерного залу — все це обманки
---
Звіт уникає говорити про "використану ємність", але все видно на обличчі
---
Оцінка варта злома, води дійсно багато
---
Чому ніхто не ставить питання про проблему використання?
Нещодавно я ознайомився з тестовим звітом одного з провідних проектів мережі зберігання даних, і одне число майже засліпило мене.
Система заявляє загальну ємність понад 5PB, але медіана зберігання на один вузол становить лише 1.18TB. Я швидко порахував — 105 вузлів, медіана 1.18TB, разом це приблизно 124TB. А де ж решта 4876TB?
Після перевірки зрозумів, що ці 5PB — це "теоретична загальна ємність", тобто сумарний обсяг зберігання, заявлений вузлами. Це нагадує тренажерний зал, де загальна вартість обладнання — 5 мільйонів, але одночасно реальною користю користуються лише 12%. Якщо дивитися так, то "плавання" вузлів перевищує 80%. Мережа ще далека від справжнього етапу стрес-тестування.
Ще більш болюче — це питання використання. Галузеві аналітики відзначили один феномен: у звітах дуже активно показується "загальна ємність", але щодо реальних показників "використаної/обіцяної ємності" обходять стороною. За нинішньої конфігурації 105 вузлів, щоб досягти реальної 5PB зберігання, кожен вузол має обробляти в середньому 47.6TB даних — це в 40 разів більше за нинішню медіану навантаження. За таких умов чи зможе мережа зберегти низьку затримку? Це велике питання.
Ще більш вражаюче — під час 60-денного тесту обсяг метаданих (221.5GB) і фактичних даних (1.18TB) мають співвідношення приблизно 1:5.3. У дослідженні згадувалося, що для системи з 1000 вузлами метадані можуть бути фіксованими — 64KB на вузол. Якщо у системі з’явиться багато дрібних файлів, ця "метадані-накрутка" з’їсть значну частину корисного простору, і вартість зросте в кілька разів.
Загалом, цей проект демонструє технічний потенціал мережі зберігання, але "загальна ємність" — це як нафарбувати мережу. Який справжній рівень використання та ефективності? Звіт майстерно уникає цього питання. Якщо хтось використовує "загальну ємність" для оцінки проекту, то, мабуть, там дуже багато води, яку потрібно ретельно вичавити.