Візіонер за успіхом Sora: Біл Піблз та елітна команда з генерації відео OpenAI

Коли OpenAI презентувала Sora на початку 2024 року, це викликало справжній резонанс у галузі штучного інтелекту. За цим революційним моделлю генерації відео стоїть ретельно сформована команда з 13 виняткових дослідників, з Біллом Піблсом, який виступає одним із ключових архітекторів проекту. Розуміння складу та експертизи цієї команди відкриває, як OpenAI зібрала різноманітний талант — включно з трьома китайськими дослідниками, PhD з MIT та Берклі, а також випускником Пекінського університету — для досягнення того, що багато вважали неможливим.

Білл Піблс: Архітектор технології моделювання світу Sora

Білл Піблс співкерівник ініціативи Sora в OpenAI, де його дослідження зосереджені на генерації відео та технологіях моделювання світу. Його академічний шлях вражає: він здобув докторський ступінь у відомому Центрі досліджень штучного інтелекту Берклі під керівництвом Алюоші Ефроса, того самого наставника, який керував Тімом Бруксом, іншим співкерівником проекту Sora. Під час навчання в MIT Піблс працював з Антоніо Торралба, що встановило зв’язки з однією з провідних інституцій у галузі інформатики.

Перед створенням Sora він здобув цінний досвід у провідних технологічних компаніях. Він проходив стажування в FAIR (лабораторії досліджень штучного інтелекту Meta), Adobe Research та NVIDIA, засвоюючи передові знання у галузі генеративного моделювання та обчислювальної ефективності. Особливо важливий внесок він зробив під час роботи в FAIR, співпрацюючи з професором Ся Сайнінгом, який тепер працює в NYU, над фундаментальною статтею “Масштабовані дифузійні моделі з трансформерами”. Ця робота фактично заклала архітектурний фундамент, на якому згодом базувалася Sora — важливий крок у перетворенні теорії у практичний масштабний генератор відео.

Шлях від Берклі до Sora не був миттєвим. Після здобуття докторського ступеня Піблс приєднався до OpenAI і присвятив себе проекту з неймовірною відданістю. За повідомленнями, основна команда працювала понад рік на виснажливому темпі перед випуском Sora, що демонструє необхідність високої інтенсивності для розширення меж можливого у відео, згенерованому штучним інтелектом. Це прагнення, у поєднанні з глибоким розумінням масштабування дифузійних моделей і архітектур трансформерів, зробило його незамінним у перетворенні академічної теорії у робочу систему, здатну створювати цілісні, реалістичні відео.

Створення дослідницької бази: шлях від Берклі до OpenAI

Концентрація випускників Центру досліджень штучного інтелекту Берклі у команді Sora не є випадковістю. І Піблс, і його співкерівник Тім Брукс навчалися під керівництвом Алюоші Ефроса, що свідчить про цілеспрямований підбір кадрів із дослідницького центру, відомого своїми досягненнями у генеративному моделюванні. Ця стратегія — залучення дослідницьких мереж і перевірених талантів — відображає спосіб формування елітних команд у галузі штучного інтелекту в сучасних конкурентних умовах.

Тім Брукс, партнер Піблса по Sora, має доповнюючі сильні сторони. Його дослідження довгий час зосереджені на розробці масштабних моделей, здатних імітувати реальний світ. Перед його нинішньою роллю провідного дослідника у DALL·E 3 він працював у Google над AI для камер Pixel і в NVIDIA над моделями генерації відео. Цей досвід у різних сферах — від споживчого AI до досліджень — дав йому цінну перспективу щодо комерційної життєздатності згенерованого відео, а не лише його теоретичної вражаючості.

Більш широка екосистема: талант із різних дисциплін

Крім двох співкерівників, команда з 13 осіб демонструє стратегію OpenAI щодо поєднання глибокої експертизи у AI з додатковими навичками. Коннор Холмс, який нещодавно перейшов із Microsoft, має спеціальні знання у сфері ефективності систем під час інференсу та тренування, що важливо для вирішення практичних інженерних задач масштабування таких великих моделей. Його досвід охоплює великі мовні моделі (LLMs), енкодери у стилі BERT, рекурентні нейронні мережі та UNets — технічний набір інструментів, необхідних для інфраструктури, що підтримує Sora.

Міжнародний склад команди відображає глобальний характер талантів у галузі AI. Серед трьох китайських дослідників, що працюють над Sora, — Лі Цзін, який має ступінь бакалавра з Пекінського університету та PhD з фізики з MIT. Його досвід у мультимодальному навчанні та генеративних моделях, удосконалений під час постдокторських досліджень у FAIR разом із Янном Лекуном, додає цінного погляду на те, як різні модальності даних взаємодіють у генеративних системах. Його ранні внески у DALL·E 3 підготували його до роботи з додатковою складністю відеогенерації.

Він Депюе — приклад зростаючого феномену у дослідженнях AI: винятковий талант, який обходить традиційні обмеження. Народжений після 2000 року, він одразу після випуску приєднався до OpenAI як штатний дослідник, що демонструє, що академічні заслуги важливіші за формальні кваліфікації. Його раннє заснування стартапу під час школи свідчить про нестандартне мислення, яке процвітає у дослідницьких середовищах, таких як OpenAI.

Від академії до виробництва: команда Sora

Кілька членів команди, зокрема Девід Шнурр, мають десятки років практичного досвіду. Шнурр, ветеран AI, допоміг створити базову архітектуру Alexa ще у Graphiq перед її придбанням Amazon, а потім працював у Uber, привносячи досвід реального застосування у виклики OpenAI. Такі фахівці гарантують, що Sora створювалася не лише для академічних показників, а й для реального застосування.

Команда також включала спеціалістів у комп’ютерному зорі та дифузійних моделях, таких як Ерик Лухман, чиї дослідження зосереджені саме на ефективних, передових алгоритмах AI. Джо Тейлор, раніше активний у команді ChatGPT, відповідав за інтерфейс користувача та дизайн — нагадування, що навіть проривні системи AI потребують ретельного опрацювання взаємодії з людьми.

Рікі Ванг, який провів роки у Meta перед приєднанням до OpenAI у січні 2024, є прикладом зростаючої мобільності топ-талантів між конкурентами у галузі AI. Його освіта у Берклі відповідає академічному походженню багатьох ключових членів команди, що свідчить про активний набір OpenAI із провідних інституцій, відомих виробництвом AI-талантів.

Найбільш вражаючим є Адитія Рамешт, який керував розробкою DALL·E 3 і тепер відповідає за реалізацію Sora, незважаючи на те, що має лише ступінь бакалавра з Нью-Йоркського університету. Його кар’єра — прямий найм у OpenAI після випуску — ілюструє, що компанія цінує доведену здатність понад формальні кваліфікації, хоча й зазвичай команда з мінімальним рівнем освіти навчалася у таких фігур, як Ян Лекун.

Висновок: шаблон для команд у дослідженнях AI

Білл Піблс і широка команда Sora демонструють, як прориви у галузі штучного інтелекту виникають у результаті цілеспрямованого формування з додаткових експертних знань. Поєднуючи провідних дослідників із Центру досліджень штучного інтелекту Берклі, залучаючи міжнародний талант (у тому числі трьох китайських учених), інтегруючи інженерів, орієнтованих на виробництво, і відкриваючи шлях для нестандартних кар’єрних шляхів, OpenAI створила умови для досягнення Sora. У міру розвитку галузі штучного інтелекту ця модель формування команд — балансуючи академічну строгость із практичним досвідом, традиційні кваліфікації з доведеними здатностями — слугує шаблоном для того, як організації можуть просувати технологічний прогрес.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити