ByteDance และ Alibaba เปิดตัวโมเดลสร้างภาพ AI ใหม่ เร่งศึกแข่งขัน Google บนเวทีโลก

3 ชั่วโมงที่แล้ว 1 ครั้ง โดย baikhao

ByteDance และ Alibaba Cloud เปิดตัวโมเดลสร้างภาพ AI รุ่นใหม่ Seedream 5.0 และ Qwen-Image 2.0 ท้าชน Google Nano Banana Pro ชูจุดเด่นด้านความละเอียดสูง การแก้ไขภาพแบบเลือกจุด และรองรับพรอมต์ยาว สะท้อนการแข่งขัน AI จีน-สหรัฐที่ทวีความเข้มข้นบนเวทีโลก

ByteDance และ Alibaba เปิดตัวโมเดลสร้างภาพ AI ใหม่ เร่งศึกแข่งขัน Google บนเวทีโลก

บริษัทเทคโนโลยียักษ์ใหญ่ของจีนอย่าง ByteDance และ Alibaba Cloud เดินหน้าเร่งเกมในสมรภูมิ AI ระดับโลก ด้วยการเปิดตัวโมเดลสร้างภาพ (Image Generation Model) รุ่นใหม่ ที่ถูกออกแบบมาเพื่อแข่งขันกับเครื่องมือจากฝั่งสหรัฐฯ อย่าง Google Nano Banana Pro โดยตรง สะท้อนให้เห็นถึงการแข่งขันที่ร้อนแรงขึ้นเรื่อย ๆ ระหว่างจีนและสหรัฐอเมริกาในด้านเทคโนโลยีปัญญาประดิษฐ์เชิงสร้างสรรค์ (Creative AI)

ทั้งสองบริษัทมุ่งเน้นไปที่การเพิ่มประสิทธิภาพของโมเดล ลดต้นทุนการใช้งาน และขยายโอกาสให้กับทั้งภาคธุรกิจและครีเอเตอร์รายบุคคลที่ต้องการใช้ AI ในการสร้างสรรค์งานภาพคุณภาพสูง

ByteDance เปิดตัว Seedream 5.0 เน้นความเข้าใจพรอมต์ขั้นสูง

ByteDance เปิดตัวโมเดล Seedream 5.0 ซึ่งขณะนี้เปิดให้ทดสอบในรูปแบบเบต้า ผ่านแพลตฟอร์ม Jimeng ในประเทศจีน และบน CapCut สำหรับผู้ใช้งานทั่วโลก

บริษัทระบุว่า Seedream 5.0 ได้รับการพัฒนาให้มีความสามารถด้าน “การให้เหตุผล” (Reasoning) ที่ดีขึ้น และเข้าใจคำสั่งที่ซับซ้อนได้แม่นยำกว่าเดิม โดยเฉพาะพรอมต์ที่มีรายละเอียดหลายชั้นหรือมีเงื่อนไขเฉพาะ

หนึ่งในจุดเด่นสำคัญคือ ความสามารถในการแก้ไขเฉพาะจุด (Selective Editing) ผู้ใช้สามารถปรับเปลี่ยนบางองค์ประกอบของภาพได้ โดยไม่ต้องสร้างภาพใหม่ทั้งหมด ตัวอย่างเช่น ในการทดสอบหนึ่ง ผู้ใช้สร้างภาพฉาก “คืนหิมะตก” และสามารถสลับสถานะไฟเปิด-ปิดภายในภาพได้ โดยที่องค์ประกอบอื่นยังคงเดิม ช่วยลดเวลาและเพิ่มความยืดหยุ่นในการออกแบบ

การเปิดตัว Seedream 5.0 ยังเกิดขึ้นต่อเนื่องจากความสำเร็จของ Seedance 2.0 โมเดลวิดีโอ AI ของบริษัท ที่เน้นการสร้างวิดีโอเสมือนจริงคุณภาพสูง ซึ่งแสดงให้เห็นถึงยุทธศาสตร์ของ ByteDance ในการครอบคลุมทั้งภาพนิ่งและวิดีโอด้วยเทคโนโลยี AI

Alibaba Cloud เปิดตัว Qwen-Image 2.0 รวมสร้างและแก้ไขในระบบเดียว

ฝั่ง Alibaba Cloud เปิดตัว Qwen-Image 2.0 ซึ่งเป็นโมเดลแบบรวมศูนย์ที่ผสานทั้งการสร้างภาพและการแก้ไขไว้ในระบบเดียว รองรับพรอมต์ยาวได้สูงสุดประมาณ 1,000 โทเค็น และสามารถสร้างภาพความละเอียดระดับ 2K (2048×2048 พิกเซล)

โมเดลนี้โดดเด่นด้านการจัดการเลย์เอาต์แบบมีโครงสร้าง เช่น งานออกแบบหลายพาเนล (multi-panel design) การคงความสอดคล้องของตัวละครในหลายฉาก และการจัดวางองค์ประกอบที่ซับซ้อน

อีกหนึ่งจุดแข็งคือความสามารถในการเรนเดอร์ข้อความภาษาจีนและตัวอักษรลายมือ (calligraphy) ที่ซับซ้อนได้อย่างแม่นยำ ซึ่งถือเป็นข้อได้เปรียบเชิงภูมิภาค และช่วยให้ตอบโจทย์ตลาดจีนได้อย่างมีประสิทธิภาพ

เปรียบเทียบจุดเด่นกับ Google Nano Banana Pro

เมื่อเทียบกับ Google Nano Banana Pro ซึ่งพัฒนาบนพื้นฐานของ Gemini 3 Pro Image จะพบว่าทั้งสามโมเดลต่างมุ่งเน้นไปที่การผสาน “การสร้าง + การแก้ไข” ไว้ในระบบเดียว

คุณสมบัติ	ByteDance Seedream 5.0	Alibaba Qwen-Image 2.0	Google Nano Banana Pro
ฟังก์ชันหลัก	สร้างภาพ + แก้ไขเฉพาะจุด	สร้างและแก้ไขในโมเดลเดียว	สร้างภาพ + แก้ไขขั้นสูง
ความละเอียด	รองรับ 2K และ 4K	Native 2K	สูงสุด 4K
รองรับพรอมต์ยาว	เน้นความเข้าใจพรอมต์ละเอียด	สูงสุด ~1K โทเค็น	ไม่มีการระบุขีดจำกัดชัดเจน
การเรนเดอร์ข้อความ	สร้างข้อความอ่านได้ในภาพ	เด่นด้านตัวอักษรจีนและเลย์เอาต์	รองรับหลายภาษา
การเปิดให้ใช้งาน	Jimeng (จีน), CapCut (ทั่วโลก)	แพลตฟอร์ม Qwen	Gemini apps และ Google AI tools

สงคราม AI จีน-สหรัฐกำลังเข้าสู่เฟสใหม่

การเปิดตัวครั้งนี้สะท้อนให้เห็นว่า จีนไม่ได้มุ่งเน้นเฉพาะ AI ด้านอุตสาหกรรมหรือโครงสร้างพื้นฐานเท่านั้น แต่กำลังรุกเข้าสู่ตลาด Creative AI ระดับผู้บริโภคและองค์กรทั่วโลก อย่างจริงจัง

การแข่งขันไม่ได้อยู่แค่เรื่องคุณภาพโมเดล แต่รวมถึง:

ต้นทุนการใช้งาน
ความเร็วในการประมวลผล
ความสามารถด้านการแก้ไขแบบยืดหยุ่น
การรองรับภาษาท้องถิ่น
ระบบนิเวศแพลตฟอร์ม (Ecosystem Integration)

ผู้เชี่ยวชาญมองว่า หากบริษัทจีนสามารถรักษาระดับคุณภาพและควบคุมต้นทุนได้ต่ำกว่าคู่แข่งจากสหรัฐฯ ก็อาจกลายเป็นปัจจัยสำคัญที่พลิกสมดุลตลาด AI เชิงสร้างสรรค์ในอนาคต

ที่มา gizmochina