ByteDance และ Alibaba เปิดตัวโมเดลสร้างภาพ AI ใหม่ เร่งศึกแข่งขัน Google บนเวทีโลก
บริษัทเทคโนโลยียักษ์ใหญ่ของจีนอย่าง ByteDance และ Alibaba Cloud เดินหน้าเร่งเกมในสมรภูมิ AI ระดับโลก ด้วยการเปิดตัวโมเดลสร้างภาพ (Image Generation Model) รุ่นใหม่ ที่ถูกออกแบบมาเพื่อแข่งขันกับเครื่องมือจากฝั่งสหรัฐฯ อย่าง Google Nano Banana Pro โดยตรง สะท้อนให้เห็นถึงการแข่งขันที่ร้อนแรงขึ้นเรื่อย ๆ ระหว่างจีนและสหรัฐอเมริกาในด้านเทคโนโลยีปัญญาประดิษฐ์เชิงสร้างสรรค์ (Creative AI)
ทั้งสองบริษัทมุ่งเน้นไปที่การเพิ่มประสิทธิภาพของโมเดล ลดต้นทุนการใช้งาน และขยายโอกาสให้กับทั้งภาคธุรกิจและครีเอเตอร์รายบุคคลที่ต้องการใช้ AI ในการสร้างสรรค์งานภาพคุณภาพสูง
ByteDance เปิดตัว Seedream 5.0 เน้นความเข้าใจพรอมต์ขั้นสูง
ByteDance เปิดตัวโมเดล Seedream 5.0 ซึ่งขณะนี้เปิดให้ทดสอบในรูปแบบเบต้า ผ่านแพลตฟอร์ม Jimeng ในประเทศจีน และบน CapCut สำหรับผู้ใช้งานทั่วโลก
บริษัทระบุว่า Seedream 5.0 ได้รับการพัฒนาให้มีความสามารถด้าน “การให้เหตุผล” (Reasoning) ที่ดีขึ้น และเข้าใจคำสั่งที่ซับซ้อนได้แม่นยำกว่าเดิม โดยเฉพาะพรอมต์ที่มีรายละเอียดหลายชั้นหรือมีเงื่อนไขเฉพาะ
หนึ่งในจุดเด่นสำคัญคือ ความสามารถในการแก้ไขเฉพาะจุด (Selective Editing) ผู้ใช้สามารถปรับเปลี่ยนบางองค์ประกอบของภาพได้ โดยไม่ต้องสร้างภาพใหม่ทั้งหมด ตัวอย่างเช่น ในการทดสอบหนึ่ง ผู้ใช้สร้างภาพฉาก “คืนหิมะตก” และสามารถสลับสถานะไฟเปิด-ปิดภายในภาพได้ โดยที่องค์ประกอบอื่นยังคงเดิม ช่วยลดเวลาและเพิ่มความยืดหยุ่นในการออกแบบ
การเปิดตัว Seedream 5.0 ยังเกิดขึ้นต่อเนื่องจากความสำเร็จของ Seedance 2.0 โมเดลวิดีโอ AI ของบริษัท ที่เน้นการสร้างวิดีโอเสมือนจริงคุณภาพสูง ซึ่งแสดงให้เห็นถึงยุทธศาสตร์ของ ByteDance ในการครอบคลุมทั้งภาพนิ่งและวิดีโอด้วยเทคโนโลยี AI
Alibaba Cloud เปิดตัว Qwen-Image 2.0 รวมสร้างและแก้ไขในระบบเดียว
ฝั่ง Alibaba Cloud เปิดตัว Qwen-Image 2.0 ซึ่งเป็นโมเดลแบบรวมศูนย์ที่ผสานทั้งการสร้างภาพและการแก้ไขไว้ในระบบเดียว รองรับพรอมต์ยาวได้สูงสุดประมาณ 1,000 โทเค็น และสามารถสร้างภาพความละเอียดระดับ 2K (2048×2048 พิกเซล)
โมเดลนี้โดดเด่นด้านการจัดการเลย์เอาต์แบบมีโครงสร้าง เช่น งานออกแบบหลายพาเนล (multi-panel design) การคงความสอดคล้องของตัวละครในหลายฉาก และการจัดวางองค์ประกอบที่ซับซ้อน
อีกหนึ่งจุดแข็งคือความสามารถในการเรนเดอร์ข้อความภาษาจีนและตัวอักษรลายมือ (calligraphy) ที่ซับซ้อนได้อย่างแม่นยำ ซึ่งถือเป็นข้อได้เปรียบเชิงภูมิภาค และช่วยให้ตอบโจทย์ตลาดจีนได้อย่างมีประสิทธิภาพ
เปรียบเทียบจุดเด่นกับ Google Nano Banana Pro
เมื่อเทียบกับ Google Nano Banana Pro ซึ่งพัฒนาบนพื้นฐานของ Gemini 3 Pro Image จะพบว่าทั้งสามโมเดลต่างมุ่งเน้นไปที่การผสาน “การสร้าง + การแก้ไข” ไว้ในระบบเดียว
| คุณสมบัติ | ByteDance Seedream 5.0 | Alibaba Qwen-Image 2.0 | Google Nano Banana Pro |
|---|---|---|---|
| ฟังก์ชันหลัก | สร้างภาพ + แก้ไขเฉพาะจุด | สร้างและแก้ไขในโมเดลเดียว | สร้างภาพ + แก้ไขขั้นสูง |
| ความละเอียด | รองรับ 2K และ 4K | Native 2K | สูงสุด 4K |
| รองรับพรอมต์ยาว | เน้นความเข้าใจพรอมต์ละเอียด | สูงสุด ~1K โทเค็น | ไม่มีการระบุขีดจำกัดชัดเจน |
| การเรนเดอร์ข้อความ | สร้างข้อความอ่านได้ในภาพ | เด่นด้านตัวอักษรจีนและเลย์เอาต์ | รองรับหลายภาษา |
| การเปิดให้ใช้งาน | Jimeng (จีน), CapCut (ทั่วโลก) | แพลตฟอร์ม Qwen | Gemini apps และ Google AI tools |
สงคราม AI จีน-สหรัฐกำลังเข้าสู่เฟสใหม่
การเปิดตัวครั้งนี้สะท้อนให้เห็นว่า จีนไม่ได้มุ่งเน้นเฉพาะ AI ด้านอุตสาหกรรมหรือโครงสร้างพื้นฐานเท่านั้น แต่กำลังรุกเข้าสู่ตลาด Creative AI ระดับผู้บริโภคและองค์กรทั่วโลก อย่างจริงจัง
การแข่งขันไม่ได้อยู่แค่เรื่องคุณภาพโมเดล แต่รวมถึง:
ต้นทุนการใช้งาน
ความเร็วในการประมวลผล
ความสามารถด้านการแก้ไขแบบยืดหยุ่น
การรองรับภาษาท้องถิ่น
ระบบนิเวศแพลตฟอร์ม (Ecosystem Integration)
ผู้เชี่ยวชาญมองว่า หากบริษัทจีนสามารถรักษาระดับคุณภาพและควบคุมต้นทุนได้ต่ำกว่าคู่แข่งจากสหรัฐฯ ก็อาจกลายเป็นปัจจัยสำคัญที่พลิกสมดุลตลาด AI เชิงสร้างสรรค์ในอนาคต
ที่มา gizmochina