Автор: Ю Лили; Источник: Dark Waves****
Среди 7 крупных стартапов в Китае DeepSeek (深度求索) наименее заметен, но всегда запоминается своими неожиданными способами.
Год назад это произошло неожиданно, источником этого был квантовый частный фонд, стоящий за ним, единственная компания вне крупных заводов, имеющая запасы в 10 000 чипов A100, а год спустя источником стала именно она, вызвавшая китайскую ценовую войну за большие модели.
В мае, когда искусственный интеллект бомбил нас бесконечно, DeepSeek стал знаменитым. Причина этого заключается в их опубликованной открытой модели под названием DeepSeek V2, которая обеспечивает беспрецедентное соотношение цены и качества: стоимость вывода была снижена до 1 юаня на миллион токенов, что примерно эквивалентно 1/7 Llama3 70B и 1/70 GPT-4 Turbo.
DeepSeek быстро получил прозвище “AI версия Pinduoduo”, в то же время такие гиганты как ByteDance, Tencent, Baidu, Alibaba не могли удержаться и начали снижать цены. Так началась грандиозная ценовая война за китайские большие модели.
** Дым на самом деле скрывает тот факт, что в отличие от многих крупных заводов, которые сжигают деньги для субсидирования, DeepSeek является прибыльным. **
За этим стоит полный инноваций архитектуры модели DeepSeek. Он предлагает новую многоступенчатую скрытую механизм внимания (MLA), который снижает использование видеопамяти до 5%-13% по сравнению с механизмом MHA, который ранее использовался наиболее часто. К тому же, уникальная структура DeepSeekMoESparse также сокращает объем вычислений до минимума, что в конечном итоге приводит к снижению затрат.
В Долине Кремния DeepSeek называют “тайной силой из Востока”. Главный аналитик SemiAnalysis считает, что статья о DeepSeek V2 “может быть лучшей в этом году”. Бывший сотрудник OpenAI Эндрю Карр считает, что статья “полна удивительной мудрости” и применил её настройки обучения к своей модели. Бывший руководитель политики в OpenAI и соучредитель Anthropic Джек Кларк считает, что DeepSeek “нанял группу загадочных гений” и также считает, что китайские модели “станут силой, которую нельзя игнорировать, как беспилотники и электромобили”.
Во вторжении ИИ, в основном связанном с историей из Силиконовой долины, это редкое явление. Многие представители отрасли сообщили нам, что такая сильная реакция исходит от инноваций на уровне архитектуры, которые являются редкими экспериментами для китайских компаний, занимающихся большими моделями, и даже для глобальных открытых баз больших моделей. Один исследователь ИИ заявил, что архитектура Attention была предложена много лет назад и практически не подвергалась успешным изменениям, не говоря уже о масштабной проверке. «Это даже может быть мыслью, которая при принятии решения будет отсечена, потому что большинство людей не имеют доверия», - сказал он.
С другой стороны, китайские крупные модели редко занимались инновациями на уровне архитектуры, потому что немногие люди активно пытались разрушить такой стереотип: США лучше в технологических инновациях от 0 до 1, а Китай лучше в инновациях от 1 до 10 в применении. Кроме того, такое поведение очень неэффективно - новое поколение моделей появится через несколько месяцев, и китайские компании должны просто следовать за этим и хорошо применять. Инновации в структуре модели означают, что нет пути, по которому можно пойти, и придется пережить множество неудач, что потребует огромных временных и экономических затрат.
DeepSeek явно является попутчиком. В шуме убеждений о том, что большие модели обязательно сведутся к общему, а следование - это более умный путь, DeepSeek ценит ценность, накопленную на “извилистом пути”, и считает, что китайские предприниматели, работающие с большими моделями, помимо инноваций в области приложений, также могут присоединиться к глобальному потоку технологических инноваций.
Многие из решений DeepSeek отличаются от других. До сих пор это единственная китайская компания среди 7 крупных стартапов, которая отказалась от стратегии «и то, и другое», и до сих пор сосредоточена на исследованиях и технологиях, не имеет приложений toC, является единственной компанией, которая не полностью рассматривает коммерциализацию, упорно выбирает открытый путь и даже не привлекала инвестиции. Это часто делает его забытым за игровым столом, но с другой стороны, пользователи часто распространяют его в сообществе, как «водопроводную воду».
Как DeepSeek был создан? Мы взяли интервью у малоизвестного основателя DeepSeek Лян Вэнфэня.
Основатель, родившийся в 80-х годах, который изучал технологии задолго до DeepSeek, продолжает сохранять свой низкий профиль со всеми исследователями, каждый день «читая статьи, пиша код, участвуя в дискуссиях группы». Он начал изучать технологии еще в эпоху головоломок.
И у многих основателей квантовых фондов был опыт работы за рубежом в хедж-фондах, в отличие от многих, Лян Вэнфэн был всегда связан с местным рынком, и еще в юности учился в Университете Чжэцзян, на факультете электронной инженерии по направлению искусственного интеллекта.
Несколько представителей отрасли и исследователи DeepSeek рассказали нам, что Лян Вэнфэн - это очень редкий в современном китайском сообществе искусственного интеллекта человек, который обладает “мощными инженерными способностями в области инфраструктуры и исследовательскими способностями моделирования, способный мобилизовать ресурсы”, “способный давать точные суждения из высокого уровня и в то же время превосходить линейных исследователей в деталях”, он обладает “ужасной способностью к обучению”, и в то же время “полностью не похож на босса, а больше на гика”.
Это редкое интервью. В этом интервью этот технологический идеалист предлагает особый голос, который сейчас редок в китайской научно-технической сфере: он редко ставит “моральные ценности” выше “экономических интересов” и напоминает нам о инерции времени, делая “оригинальную инновацию” приоритетом.
Год назад, когда только начинался DeepSeek, мы впервые пообщались с Лян Вэньфэнем: «Безумный кубик: путь к большой модели невидимого AI-гиганта». Если тогда фраза «Необходимо сумасшедше обнимать амбиции и быть безумно искренним» была красивым лозунгом, то сейчас она становится действием.
Вот разговор
「Темное течение」: После выпуска модели DeepSeek V2 быстро началась кровавая битва цен на большие модели, кто-то сказал, что вы - акула в этой отрасли.
Liang Wenfeng: мы не намерены стать сомом, мы просто случайно стали сомом.
‘Течение’: это результат вас удивляет?
Liang Wenfeng: Очень неожиданно. Не ожидал, что цена вызовет такую реакцию у людей. Мы просто следуем своему темпу и устанавливаем цены, основываясь на расчете затрат. Наш принцип - не давать деньги, и не получать суперприбыль. Эта цена немного выше затрат и имеет небольшую прибыль.
“Темное течение”: через 5 дней последует умная карта AI, затем следуют байты, Алибаба, Baidu, Tencent и другие крупные заводы.
Лян Вэньфэн: Zhipu AI — это продукт начального уровня, а модели того же уровня, что и мы, все еще очень дорогие. Bytes действительно были первыми, кто последовал за ними. Флагманская модель была снижена до той же цены, что и мы, что побудило других крупных производителей снижать цены один за другим. Потому что модельная стоимость крупных заводов намного выше нашей, мы не ожидали, что кто-то потеряет деньги на это, и в итоге это стало логикой сжигания денег и субсидий в эпоху интернета.
「暗涌」:с виду кажется, что снижение цен очень похоже на охоту за пользователями, как это часто бывает в интернет-эпоху.
Liáng Wénfēng: Похищение пользователей не является нашей основной целью. Мы снижаем цены, с одной стороны, потому что стоимость снижается в процессе исследования структуры следующего поколения модели, а с другой стороны, мы считаем, что как API, так и ИИ должны быть универсальными и доступными каждому.
**“Темное течение”: Раньше большинство китайских компаний просто копировали структуру Llama этого поколения для создания приложений. Почему вы решили начать с модельной структуры?
梁文锋:Если наша цель - создание приложения, то использование структуры Llama и разработка быстрого продукта также являются разумным выбором. Но наша цель - AGI, что означает, что нам нужно исследовать новые структуры моделей, чтобы при ограниченных ресурсах достичь более мощной модельной способности. Это одно из базовых исследований, которые нужно провести для масштабирования до более крупных моделей. Помимо структуры модели, мы также провели множество других исследований, включая методы построения данных, а также то, как сделать модель более похожей на человека, и все это отражено в наших выпущенных моделях. Кроме того, структура Llama, вероятно, имеет разрыв в два поколения с передовым зарубежным уровнем как по эффективности обучения, так и по стоимости вывода.
「Аномальные волны」: Откуда берется это дифференциальное давление?
Лян Вэнфэн:Во-первых, эффективность тренировок имеет разрыв. Мы оцениваем, что лучший уровень в стране и лучший за рубежом могут иметь разрыв в модельной структуре и динамике тренировок, возможно, в два раза, и только на это мы должны затратить в два раза больше вычислительной мощности, чтобы достичь того же результата. Кроме того, эффективность данных также может иметь разрыв в два раза, то есть нам нужно использовать в два раза больше тренировочных данных и вычислительной мощности, чтобы достичь того же результата. Всего это потребует в 4 раза больше вычислительной мощности. Мы должны делать именно это, постоянно уменьшая эти разрывы.
** “Подводное течение”: Большинство китайских компаний предпочитают иметь как модели, так и приложения, почему DeepSeek предпочитает заниматься только исследованиями и разведкой? **
Лян Вэньфэн: Потому что мы считаем, что самое важное сейчас – это участвовать в волне глобальных инноваций. За последние много лет китайские компании привыкли к чужим технологическим новинкам, и мы использовали их для монетизации приложений, но это не само собой разумеющееся. В этой волне наша отправная точка — не воспользоваться возможностью получить прибыль, а выйти на передовые технологии, чтобы способствовать развитию всей экосистемы.
«暗潮»: Инерционное понимание, которое Интернет и мобильный интернет оставили у большинства людей в эпоху, где Соединенные Штаты специализируются на технических инновациях, а Китай более специализируется на приложениях.
Liang Wenfeng: Мы считаем, что с развитием экономики Китай должен постепенно стать участником, а не просто ехать на чужом паровозе. В течение последних тридцати лет мы практически не участвовали в реальных технологических инновациях. Мы уже привыкли, что закон Мура свершается сам по себе, и через 18 месяцев у нас появляются лучшее аппаратное и программное обеспечение. Закон масштабирования также рассматривается таким образом.
Однако на самом деле это было создано поколениями трудолюбивых западных технических сообществ, просто потому, что мы не были вовлечены в этот процесс, и мы игнорировали его существование.
“暗涌”: Почему DeepSeek V2 удивил многих людей в Силиконовой долине?
Лиан Вэньфэн: Среди многочисленных инноваций, которые происходят каждый день в США, это очень обычное явление. Они удивлены тем, что это китайская компания, которая, будучи инновационным участником, присоединилась к их игре. В конце концов, большинство китайских компаний привыкли следовать за другими, а не инновировать.
「暗涌」:Однако в китайском контексте такой выбор слишком роскошен. Большие модели - это игра с большими вложениями, не все компании могут позволить себе только исследования и инновации, не задумываясь о коммерциализации в первую очередь.
Лян Вэньфэн: Стоимость инноваций, безусловно, не низкая, и инерция прошлого также связана с прошлыми национальными условиями. Но теперь вы видите, что будь то размер экономики Китая или прибыли крупных компаний, таких как Byte и Tencent, они не являются низкими в мире. Чего нам не хватает в инновациях, так это определенно не капитала, а недостатка уверенности и незнания того, как организовать высокую плотность талантов для достижения эффективных инноваций.
「暗涌」: Почему китайские компании, включая крупные заводы, которым не хватает денег, так легко ставят коммерциализацию вперёд?
Лян Вэньфэн: За последние 30 лет мы делали упор только на зарабатывание денег и пренебрегали инновациями. Инновации не являются полностью бизнес-ориентированными, они также требуют любознательности и творческого подхода. Мы просто связаны инерцией прошлого, но она также поэтапна.
**「暗涌」: но в конце концов вы - коммерческая организация, а не благотворительное научно-исследовательское учреждение, выбирая инновации и делая их доступными через открытый исходный код, как вы собираетесь создать конкурентное преимущество? Например, инновации в архитектуре MLA в мае быстро скопируют другие компании, не так ли?
Лян Вэнфэн : Перед **переворачивающей технологией, укрепленные стенами, образованные путем закрытия, недолговечны. Даже если OpenAI закроет свой источник, это не помешает другим его догнать. Поэтому мы вкладываем ценность в нашу команду, наши коллеги растут в этом процессе, накапливая много ноу-хау, формируя организацию и культуру, способную к инновациям - вот наша укрепленная стена.
Открытый исходный код, публикация научных статей, по сути, ничего не утрачивает. Для технических специалистов иметь подписчиков - это очень гордящее дело. Фактически, открытый исходный код больше похож на культурное поведение, а не на коммерческое. Действительно, это дополнительная честь. Компания, делающая это, также будет обладать культурным влечением.
**「暗涌」:как вы относитесь к таким маркетинговым убеждениям, как у Чжу Сяоху?
Лян Вэньфэн: Чжу Сяоху самостоятелен, но его стиль игры больше подходит для компаний, которые быстро зарабатывают деньги, и вы видите, что самые прибыльные компании в Соединенных Штатах — это высокотехнологичные компании, которые накопили много денег.
«Темное приливное движение»: Однако, создание больших моделей, простое техническое превосходство также трудно достичь абсолютного преимущества, что же ты ставишь на то, что больше?
Лиан Вэнфэн: Мы видим, что китайская искусственный интеллект никогда не может оставаться в позиции последователя. Мы часто говорим, что разница между китайским искусственным интеллектом и американским составляет один-два года, но на самом деле это разница между оригинальностью и имитацией. Если это не изменится, Китай всегда будет только последователем, поэтому некоторое исследование также неизбежно.
Лидерство Nvidia - это не только усилия одной компании, это результат совместных усилий западного технологического сообщества и промышленности. Они могут видеть тенденции следующего поколения технологий и имеют карту пути. Развитие искусственного интеллекта в Китае также требует такой экосистемы. Многие китайские производители микросхем не могут развиваться из-за отсутствия соответствующего технологического сообщества, и у них есть только вторичная информация, поэтому Китаю необходимо иметь людей на переднем крае технологий.
「暗涌」:У DeepSeek сейчас есть идеалистическая атмосфера OpenAI в его ранние годы, и он также является открытым. Будете ли вы в будущем переходить на закрытый исходный код? OpenAI и Mistral уже прошли путь от открытого до закрытого исходного кода.
梁文锋:Мы не будем закрывать исходный код. Мы считаем, что важнее всего иметь мощную технологическую экосистему в первую очередь.
「暗涌」: у вас есть план финансирования? По информации СМИ, Fantom планирует выделиться и выйти на отдельное публичное предложение акций (IPO) от DeepSeek, американская стартап-компания в области искусственного интеллекта (AI), в конечном итоге также неизбежно будет связана с крупными компаниями.
梁文锋:в ближайшем будущем у нас нет планов по привлечению финансирования, наша проблема никогда не заключалась в деньгах, а в запрете на высокопроизводительные микросхемы.
«Темный поток»: многие считают, что создание искусственного общего интеллекта (AGI) и квантовое моделирование - это две абсолютно разные вещи. Квантовое моделирование может быть сделано секретно, в то время как AGI, возможно, требует более активного и взаимодействия и союзов, чтобы увеличить ваши вложения.
梁文锋:Больше вложений не всегда приводит к большему количеству инноваций. Иначе крупные заводы могли бы забрать все инновации.
**«潮汐»: вы сейчас не делаете приложение, потому что у вас нет операционной генетики?
Liang Wenfeng: Мы считаем, что текущий этап - это взрывной период технологических инноваций, а не приложений. В долгосрочной перспективе мы хотим создать экосистему, в которой отрасль будет непосредственно использовать нашу технологию и продукцию, мы будем отвечать только за базовые модели и передовые инновации, а затем другие компании будут строить бизнес toB и toC на основе DeepSeek. Если мы сможем создать полную вертикальную индустрию, то нам не нужно будет делать свои собственные приложения. Конечно, если это потребуется, мы сможем сделать приложения без проблем, но исследования и технические инновации всегда будут нашим первым приоритетом.
**「Аномальные потоки」: но почему выбирают DeepSeek вместо крупных фабрик при выборе API?
Liang Wenfeng: Возможно, будущий мир будет характеризоваться специализацией и делением труда, основные большие модели требуют постоянного инновационного развития, крупные предприятия имеют свои границы возможностей и не всегда подходят.
「暗涌」: Технология действительно может сократить разрыв? Вы сами говорили, что абсолютных технических секретов не существует.
Лян Вэнфэн: Технологии не имеют секретов, но их переосмысление требует времени и затрат. Графические карты Nvidia, теоретически, не имеют никаких технических секретов и легко копируются. Однако перестройка команды и догоняние следующего поколения технологий требует времени, поэтому реальный защитный барьер все еще довольно широк.
「暗涌」: после вашего снижения цен байт первым последовал за вами, что означает, что они все еще чувствуют какую-то угрозу. Как вы смотрите на новое решение конкуренции между стартапами и большими фирмами?
Лиан Вэньфэн: Честно говоря, нам не очень-то важно это дело, мы просто сделали это. Предоставление облачных услуг не является нашей основной целью. Наша цель - достижение ИИ общего назначения (AGI).
На данный момент не видно никаких новых решений, но крупные компании также не имеют явного преимущества. У крупных компаний уже есть готовые пользователи, но их денежные потоки также являются их грузом и могут сделать их объектом постоянной угрозы.
「暗涌」: Как вы смотрите на итоги 6 крупных модельных стартапов, кроме DeepSeek?
Лиан Вэньфэн: Может быть, останется 2-3 компании. В настоящее время все еще находятся в стадии сжигания денег, поэтому те, кто имеет четкое самоопределение и может более точно управлять, имеют больше шансов выжить. Другие компании могут переродиться. Ценные вещи не исчезнут в дыму, но изменят свой способ.
«Тёмное волнение»: в эпоху кубика Рубика, отношение к конкуренции оценивается как «я делаю, как мне нравится», редко обращается внимание на горизонтальное сравнение. Что является отправной точкой вашего мышления о конкуренции?
** Liang Wenfeng **: Что я часто задаюсь вопросом, это может ли что-то повысить эффективность функционирования общества и можете ли вы найти свою специализацию в цепочке промышленного деления. Если конечная цель - повысить общественную эффективность, то это имеет смысл. Многие из них являются этапными, и слишком много внимания, неизбежно, приводит к замешательству.
**«暗涌»: Джек Кларк, бывший руководитель по политике в OpenAI и сооснователь Anthropic, считает, что DeepSeek нанял «группу таинственных гениев», чтобы создать DeepSeek v2. Кто составляет эту группу?
Лян Вэньфэн:здесь нет никаких выдающихся талантов, все они либо выпускники топовых университетов, стажеры аспирантуры или аспирантуры, или молодые люди, которые только недавно закончили учебу.
«Аньюн»: Многие крупные компании-производители моделей настаивают на привлечении специалистов из-за границы, многие считают, что топ-50 экспертов в этой области могут не работать в китайских компаниях, откуда вы берете своих сотрудников?
** Liang Wenfeng **: В модели V2 нет людей, вернувшихся из-за границы, все они местные. Возможно, первые 50 лучших специалистов не находятся в Китае, но, возможно, мы сможем самостоятельно создать таких людей.
「暗涌」:Как произошел этот инновационный шаг MLA? Говорят, что идея возникла из личного интереса молодого исследователя?
Лиан Вэнфэн:После того, как он подвел итоги некоторых основных изменений в архитектуре внимания, он внезапно придумал альтернативное решение. Однако между идеей и внедрением прошло долгое время. Мы собрали команду и потратили несколько месяцев, чтобы его реализовать.
«Темное течение»: Зарождение такого разлетающегося вдохновения тесно связано с архитектурой вашей полностью инновационной организации. В эпоху Магического квадрата вы редко назначали цели или задачи сверху вниз. Но в случае искусственного общего интеллекта, этот фронтовой поиск, полный неопределенности, не приводит ли к увеличению управленческих действий?
Лян Вэньфэн: DeepSeek также осуществляется снизу вверх. Кроме того, мы обычно не предварительно разделяем обязанности, а действуем естественным образом. У каждого человека есть уникальный опыт роста и собственные идеи, и нет необходимости их принуждать. В процессе исследования, когда он сталкивается с проблемами, сам приглашает людей на обсуждение. Однако, когда идея проявляет потенциал, мы также можем сверху вниз распределять ресурсы.
**“Темные потоки”: Говорят, что DeepSeek очень гибко настраивает карты и людей.
Лян Вэнфэн:У нас нет ограничений на использование карт и перемещение людей. Если у вас есть идеи, каждый может в любое время использовать карты в тренировочном кластере без необходимости получения одобрения. В то же время, поскольку нет иерархии и междепартаментальных ограничений, также можно гибко использовать всех заинтересованных людей.
**“Темное течение”: это также зависит от того, насколько тщательно вы выбираете людей, которых привлекает страстное управление. Я слышал, что вы очень хорошо умеете выявлять таланты в деталях, что позволяет отобрать людей, выдающихся в нестандартных критериях оценки."
梁文锋:наше стандарт отбора сотрудников всегда был любовь и любопытство, поэтому у многих людей есть необычный опыт, что очень интересно. У многих людей желание заниматься исследованиями далеко превышает интерес к деньгам.
**«潜流»: трансформатор родился в AI Lab Google, а ChatGPT родился в OpenAI. Как ты думаешь, в чем разница между ценностью инноваций, порождаемых крупным корпорацией AILab и стартап-компанией?
Liáng Wénfēng: Независимо от того, будь то лаборатория Google, OpenAI или AI Lab крупных китайских компаний, все это очень ценно. И то, что в итоге это сделал OpenAI, тоже имеет историческую случайность.
「暗涌」: Насколько велика роль случая в инновациях? Я заметил, что вы разместили комнаты для встреч слева и справа от центрального коридора с дверями, которые можно легко открыть. Ваши коллеги говорят, что это оставляет место для случайностей. История создания transfomer - это история о том, как человек, случайно оказавшийся на правильном месте, услышал о проекте и присоединился к нему, что в конечном итоге превратилось в универсальный фреймворк.
梁文锋:Я считаю, что инновации в первую очередь - это вопрос убеждений. Почему в Кремниевой долине так много духа инноваций? Во-первых, это отвага. Когда появился Chatgpt, во всей стране на дело передовых инноваций было недостаток уверенности, от инвесторов до крупных заводов, все считали, что разрыв слишком велик, лучше заниматься приложениями. Но для инноваций в первую очередь нужна уверенность. Такая уверенность обычно более очевидна у молодежи.
「暗涌」:Но вы не участвуете в финансировании, редко выступаете на публике, и, безусловно, ваше общественное влияние не такое значительное, как у компаний, активно привлекающих финансирование. Как вы можете гарантировать, что DeepSeek - это предпочтение для тех, кто занимается созданием крупных моделей?
Лян Вэньфэн: Потому что мы делаем самое сложное. ** Самая большая привлекательность для лучших талантов, безусловно, заключается в решении самых сложных мировых проблем. На самом деле, лучшие таланты в Китае недооценены. Из-за того, что на уровне общества в целом так мало хардкорных инноваций, у них нет шансов быть идентифицированными. Мы делаем самые сложные вещи, и это им нравится.
「暗涌」: В прошлом объявлении OpenAI не появился GPT5, и многие считают, что это является замедлением технологической кривой, и многие начали оспаривать Закон масштабирования. Как вы на это смотрите?
Лян Вэньфэн: Мы склонны быть оптимистичными, и вся отрасль, похоже, соответствует ожиданиям. OpenAI также не является богом, и невозможно всегда быть впереди.
「Прилив»: Как долго, по вашему мнению, потребуется для реализации AGI, до выпуска DeepSeek V2, вы выпустили кодовое поколение и математическую модель, также переключились с плотной модели на MOE, поэтому какие у вас точки на карте AGI?
梁文锋:возможно, через 2, 5 или 10 лет, в любом случае это произойдет при нашей жизни. Что касается дорожной карты, даже внутри нашей компании нет единого мнения. Однако мы действительно делаем ставку на три направления. Первое - математика и код, второе - мультимодальность, третье - сам язык. Математика и код - это естественная испытательная площадка AGI, немного похожая на игру в Го, это закрытая, верифицируемая система, которая может достичь очень высокого уровня интеллекта через самообучение. С другой стороны, возможно, мультимодальность, участие в реальном мире человека, также необходимо для AGI. Мы сохраняем открытыми все возможности.
**「暗涌」:ваше представление о том, каков конечный облик большой модели?
Liang Wenfeng: Будут компании, которые будут предоставлять базовые модели и базовые услуги, а также длинные цепочки профессионального деления труда, чтобы удовлетворить разнообразные потребности всего общества.
「暗涌」: В течение последнего года в Китае произошло много изменений в области стартапов с использованием крупномасштабных моделей, например, в начале прошлого года активная участница Ван Хуэвэнь вышла из игры, а позднее присоединившиеся компании начали проявлять дифференциацию.
梁文锋:Уэнь Вэньвэнь сам понес все потери, чтобы другие могли уйти невредимыми. Он сделал выбор, который был наименее выгоден ему, но выгоден всем нам, поэтому он очень щедрый человек, и я очень его уважаю.
「暗涌」: где сейчас ваше внимание больше всего?
Лян Вэньфэн: Основное внимание уделяется исследованию следующего поколения крупных моделей. Еще много нерешенных проблем.
“暗涌”: другие крупные стартапы, занимающиеся созданием моделей, настаивают и на, ведь технологии не обеспечивают постоянное превосходство, и важно успеть воспользоваться временным окном, чтобы преимущество технологии превратить в продукт. DeepSeek решает сосредоточиться на исследовании моделей, потому что ему не хватает возможностей моделей?
Лиан Вэнфэн: Все трюки - это продукт предыдущего поколения, они не обязательно будут работать в будущем. Обсуждать модель доходов в области искусственного интеллекта, используя бизнес-логику интернета, - это как обсуждать General Electric и Coca-Cola во время становления Ма Хуатэн, что, скорее всего, является поиском меча в воде.
** “Undercurrent”: В прошлом у High-Flyer были сильные гены технологий и инноваций, и их рост был относительно плавным, вот почему вы оптимистичны? **
Лян Вэньфэн: До некоторой степени Магический квадрат увеличивает наше доверие в технологически-ориентированные инновации, но это не всегда было простым. Мы прошли длительный период накопления опыта. Внешний мир видит лишь часть Магического квадрата с 2015 года, но на самом деле мы занимаемся этим уже 16 лет.
«Подводное течение»: Возвращаясь к теме оригинальных инноваций. Теперь, когда экономика начинает падать, а капитал входит в холодный цикл, не привнесет ли это еще больше запретов на первоначальные инновации? **
Liang Wenfeng: Я думаю, что это не обязательно. Реструктуризация китайской промышленности будет больше зависеть от инноваций в области твердотельных технологий. Когда многие люди понимают, что прежние легкие деньги, вероятно, пришли в эпоху удачи, они будут более склонны заниматься настоящими инновациями.
«Подъем волн»: Так что вы тоже оптимистично относитесь к этому?
Лян Вэнфэн: Я вырос в 80-х годах в маленьком городе провинции Гуандун. Мой отец - учитель начальных классов. В 90-е годы в Гуандуне было много возможностей заработать деньги, и тогда многие родители приходили ко мне домой и считали, что учеба бесполезна. Но сейчас, возвращаясь назад, убеждения изменились. Потому что заработать деньги стало сложнее, даже возможности работать таксистом может и не быть. Время одного поколения изменилось****
В будущем будет все больше и больше твердых инноваций. Сейчас это может быть не так легко понять, потому что общество в целом нуждается в обучении фактами. Когда люди, занимающиеся твердыми инновациями, достигнут успеха, коллективное мышление изменится. Нам просто нужно еще много фактов и процесс.