ByteDance และ Alibaba เปิดตัวโมเดลสร้างภาพ AI ใหม่ เร่งศึกแข่งขัน Google บนเวทีโลก

บริษัทเทคโนโลยียักษ์ใหญ่ของจีนอย่าง ByteDance และ Alibaba Cloud เดินหน้าเร่งเกมในสมรภูมิ AI ระดับโลก ด้วยการเปิดตัวโมเดลสร้างภาพ (Image Generation Model) รุ่นใหม่ ที่ถูกออกแบบมาเพื่อแข่งขันกับเครื่องมือจากฝั่งสหรัฐฯ อย่าง Google Nano Banana Pro โดยตรง สะท้อนให้เห็นถึงการแข่งขันที่ร้อนแรงขึ้นเรื่อย ๆ ระหว่างจีนและสหรัฐอเมริกาในด้านเทคโนโลยีปัญญาประดิษฐ์เชิงสร้างสรรค์ (Creative AI)

ทั้งสองบริษัทมุ่งเน้นไปที่การเพิ่มประสิทธิภาพของโมเดล ลดต้นทุนการใช้งาน และขยายโอกาสให้กับทั้งภาคธุรกิจและครีเอเตอร์รายบุคคลที่ต้องการใช้ AI ในการสร้างสรรค์งานภาพคุณภาพสูง


ByteDance เปิดตัว Seedream 5.0 เน้นความเข้าใจพรอมต์ขั้นสูง

ByteDance เปิดตัวโมเดล Seedream 5.0 ซึ่งขณะนี้เปิดให้ทดสอบในรูปแบบเบต้า ผ่านแพลตฟอร์ม Jimeng ในประเทศจีน และบน CapCut สำหรับผู้ใช้งานทั่วโลก

บริษัทระบุว่า Seedream 5.0 ได้รับการพัฒนาให้มีความสามารถด้าน “การให้เหตุผล” (Reasoning) ที่ดีขึ้น และเข้าใจคำสั่งที่ซับซ้อนได้แม่นยำกว่าเดิม โดยเฉพาะพรอมต์ที่มีรายละเอียดหลายชั้นหรือมีเงื่อนไขเฉพาะ

หนึ่งในจุดเด่นสำคัญคือ ความสามารถในการแก้ไขเฉพาะจุด (Selective Editing) ผู้ใช้สามารถปรับเปลี่ยนบางองค์ประกอบของภาพได้ โดยไม่ต้องสร้างภาพใหม่ทั้งหมด ตัวอย่างเช่น ในการทดสอบหนึ่ง ผู้ใช้สร้างภาพฉาก “คืนหิมะตก” และสามารถสลับสถานะไฟเปิด-ปิดภายในภาพได้ โดยที่องค์ประกอบอื่นยังคงเดิม ช่วยลดเวลาและเพิ่มความยืดหยุ่นในการออกแบบ

การเปิดตัว Seedream 5.0 ยังเกิดขึ้นต่อเนื่องจากความสำเร็จของ Seedance 2.0 โมเดลวิดีโอ AI ของบริษัท ที่เน้นการสร้างวิดีโอเสมือนจริงคุณภาพสูง ซึ่งแสดงให้เห็นถึงยุทธศาสตร์ของ ByteDance ในการครอบคลุมทั้งภาพนิ่งและวิดีโอด้วยเทคโนโลยี AI


Alibaba Cloud เปิดตัว Qwen-Image 2.0 รวมสร้างและแก้ไขในระบบเดียว

ฝั่ง Alibaba Cloud เปิดตัว Qwen-Image 2.0 ซึ่งเป็นโมเดลแบบรวมศูนย์ที่ผสานทั้งการสร้างภาพและการแก้ไขไว้ในระบบเดียว รองรับพรอมต์ยาวได้สูงสุดประมาณ 1,000 โทเค็น และสามารถสร้างภาพความละเอียดระดับ 2K (2048×2048 พิกเซล)

โมเดลนี้โดดเด่นด้านการจัดการเลย์เอาต์แบบมีโครงสร้าง เช่น งานออกแบบหลายพาเนล (multi-panel design) การคงความสอดคล้องของตัวละครในหลายฉาก และการจัดวางองค์ประกอบที่ซับซ้อน

อีกหนึ่งจุดแข็งคือความสามารถในการเรนเดอร์ข้อความภาษาจีนและตัวอักษรลายมือ (calligraphy) ที่ซับซ้อนได้อย่างแม่นยำ ซึ่งถือเป็นข้อได้เปรียบเชิงภูมิภาค และช่วยให้ตอบโจทย์ตลาดจีนได้อย่างมีประสิทธิภาพ


เปรียบเทียบจุดเด่นกับ Google Nano Banana Pro

เมื่อเทียบกับ Google Nano Banana Pro ซึ่งพัฒนาบนพื้นฐานของ Gemini 3 Pro Image จะพบว่าทั้งสามโมเดลต่างมุ่งเน้นไปที่การผสาน “การสร้าง + การแก้ไข” ไว้ในระบบเดียว

คุณสมบัติByteDance Seedream 5.0Alibaba Qwen-Image 2.0Google Nano Banana Pro
ฟังก์ชันหลักสร้างภาพ + แก้ไขเฉพาะจุดสร้างและแก้ไขในโมเดลเดียวสร้างภาพ + แก้ไขขั้นสูง
ความละเอียดรองรับ 2K และ 4KNative 2Kสูงสุด 4K
รองรับพรอมต์ยาวเน้นความเข้าใจพรอมต์ละเอียดสูงสุด ~1K โทเค็นไม่มีการระบุขีดจำกัดชัดเจน
การเรนเดอร์ข้อความสร้างข้อความอ่านได้ในภาพเด่นด้านตัวอักษรจีนและเลย์เอาต์รองรับหลายภาษา
การเปิดให้ใช้งานJimeng (จีน), CapCut (ทั่วโลก)แพลตฟอร์ม QwenGemini apps และ Google AI tools

สงคราม AI จีน-สหรัฐกำลังเข้าสู่เฟสใหม่

การเปิดตัวครั้งนี้สะท้อนให้เห็นว่า จีนไม่ได้มุ่งเน้นเฉพาะ AI ด้านอุตสาหกรรมหรือโครงสร้างพื้นฐานเท่านั้น แต่กำลังรุกเข้าสู่ตลาด Creative AI ระดับผู้บริโภคและองค์กรทั่วโลก อย่างจริงจัง

การแข่งขันไม่ได้อยู่แค่เรื่องคุณภาพโมเดล แต่รวมถึง:

  • ต้นทุนการใช้งาน

  • ความเร็วในการประมวลผล

  • ความสามารถด้านการแก้ไขแบบยืดหยุ่น

  • การรองรับภาษาท้องถิ่น

  • ระบบนิเวศแพลตฟอร์ม (Ecosystem Integration)

ผู้เชี่ยวชาญมองว่า หากบริษัทจีนสามารถรักษาระดับคุณภาพและควบคุมต้นทุนได้ต่ำกว่าคู่แข่งจากสหรัฐฯ ก็อาจกลายเป็นปัจจัยสำคัญที่พลิกสมดุลตลาด AI เชิงสร้างสรรค์ในอนาคต

ที่มา gizmochina