06:25
فريق ByteDance Seed يطلق Seed3D 2.0 بدقة هندسية محسّنة وتوليد للمواد
رسالة أخبار Gate في 23 أبريل — أطلقت فرقة البذور لدى ByteDance Seed3D 2.0، وهو نموذج نص إلى ثلاثي الأبعاد (text-to-3D) يقوم بتوليد أصول ثلاثية الأبعاد مزخرفة انطلاقًا من صورة واحدة. يركّز التحديث على الدقة الهندسية والواقعية في المواد، حيث أصبح الـ API متاحًا الآن على Volcano Ark.
تستخدم التوليدات الهندسية استراتيجية مرحلتين من الإجمالي إلى التفصيلي (Coarse-to-Fine): نموذج DiT عالي المعلمات يُنشئ أولاً طوبولوجيا على مستوى تقريبي، ثم يستعيد الحواف الحادة والأسطح الدقيقة. كما يستخدم توليد المواد بنية MoE Mixture of Experts لتعزيز تفاصيل عالية الدقة، مع دمج VLM Vision Language Model priors لتحسين ثبات تفكيك المواد تحت ظروف إضاءة غير معروفة، مع إخراج خرائط PBR كاملة متوافقة مع مسارات العرض القياسية.
أجرى ستون مُقيِّمًا لديهم خبرة في نمذجة ثلاثية الأبعاد مقارنات عمياء عبر نحو 200 حالة اختبار، حيث تمت مقارنة Seed3D 2.0 مقابل Hunyuan3D-2.5/3.1 وTripo 3.0 وRodin Gen2 وHiTem v2.0 والإصدار السابق Seed3D 1.0. تراوحت معدلات تفضيل التوليد الهندسي بين 65.1% و98.3%، بينما تجاوزت معدلات تفضيل الأصول ثلاثية الأبعاد المزخرفة 69% في جميع المقارنات.
بالنسبة للتطبيقات اللاحقة، يمكن لـ Seed3D 2.0 تفكيك الأصول ثلاثية الأبعاد إلى مكوّنات مستقلة مع معلومات مشتركة، وإخراجها بتنسيق URDF متوافق مع Isaac Sim ومحركات محاكاة أخرى لسيناريوهات التفاعل الديناميكي مثل الإمساك الروبوتي. وعلى مستوى المشهد، يدعم إدخال النص أو صورًا متعددة الزوايا أو الفيديو، مع دمج عدة أصول لتوليد مشاهد كاملة.
المزيد