อาลีบาบา เปิดตัว Qwen3-Coder โมเดลเขียนโค้ด AI ล้ำสมัย

อาลีบาบา เปิดตัว Qwen3-Coder โมเดลเขียนโค้ด AI ล้ำสมัย

อาลีบาบา เปิดตัว Qwen3-Coder โมเดลเขียนโค้ด AI ล้ำสมัย

อาลีบาบา เปิดตัว Qwen3-Coder โมเดลเขียนโค้ด agentic AI ของบริษัทฯ ที่ล้ำหน้าที่สุดในปัจจุบัน Qwen3-Coder ออกแบบมาเพื่อใช้ในการพัฒนาซอฟต์แวร์ที่ต้องการประสิทธิภาพสูง มีความสามารถเป็นเลิศในการเขียนโค้ด agentic AI ไม่ว่าจะเป็นการสร้างโค้ดใหม่และการจัดการกับเวิร์กโฟลว์ในการเขียนโค้ดที่ซับซ้อน ไปจนถึงการหาและแก้ไขข้อบกพร่อง (debugging) ชุดของซอร์สโค้ด (codebase) ทั้งหมด

Qwen3-Coder-480B-A35B-Instruct เป็นโมเดลโอเพ่นซอร์สที่สร้างบนสถาปัตยกรรม Mixture-of-Experts (MoE) มีพารามิเตอร์ทั้งหมด 480 พันล้านพารามิเตอร์ แต่เปิดใช้งาน 35 พันล้านพารามิเตอร์ต่อโทเค็น มอบประสิทธิภาพโดยไม่ลดทอนสมรรถนะ โมเดลนี้มีผลลัพธ์ที่แข่งขันได้กับโมเดลที่ล้ำสมัย (state-of-the-art: SOTA) ชั้นนำอื่น ๆ ในการวัดประสิทธิภาพสำคัญต่าง ๆ ในด้านการเขียนโค้ด agentic, การใช้เบราว์เซอร์ และ การใช้เครื่องมือ

นอกจากนี้ อาลีบาบายังได้เปิดโอเพ่นซอร์ส Qwen Code ซึ่งเป็นเครื่องมือ command-line interface (CLI) ทรงประสิทธิภาพที่ช่วยให้นักพัฒนาซอฟต์แวร์มอบหมายงานด้านวิศวกรรมให้กับ AI ด้วยการใช้ภาษาธรรมชาติ Qwen Code ได้รับการปรับให้เหมาะสมด้วยพรอมต์ที่กำหนดเอง (custom prompts) และโปรโตคอลการปฏิสัมพันธ์ต่าง ๆ ซึ่งเป็นการปลดล็อกศักยภาพทั้งหมดของ Qwen3-Coder ให้กับการเขียนโปรแกรม agentic ในโลกจริงได้อย่างเต็มรูปแบบ โมเดลนี้ยังรองรับการทำงานร่วมกับ Claude Code interface ซึ่งช่วยให้นักพัฒนาซอฟต์แวร์เขียนโค้ดได้ง่ายขึ้น

Qwen3-Coder ได้รับการเทรนกับชุดข้อมูลโค้ดและข้อมูลข้อความทั่วไปอย่างครอบคลุม และได้รับการออกแบบมาสำหรับการเขียนโค้ด agentic ได้อย่างทรงประสิทธิภาพ โดยปกติโมเดลนี้รองรับหน้าต่างบริบท (context window) ได้ 256K โทเค็น และสามารถขยายได้สูงสุด 1 ล้านโทเค็น ช่วยให้สามารถประมวลผล codebases ขนาดใหญ่ได้ในการสนทนาโต้ตอบเดียว (single session) 

ประสิทธิภาพทั้งหมดที่เหนือกว่านี้ไม่เพียงเกิดจากการปรับขนาดข้ามโทเค็น, ความยาวบริบท และข้อมูลสังเคราะห์ (synthetic data) ระหว่างการเทรนล่วงหน้าเท่านั้น แต่ยังมาจากเทคนิคที่เป็นนวัตกรรมต่าง ๆ ภายหลังการเทรน เช่น การเรียนรู้ของ agent ที่เกิดจากการเรียนรู้แบบลองผิดลองถูกในระยะยาว (long-horizon reinforcement learning: agent RL) 

ความล้ำหน้านี้ช่วยให้โมเดลสามารถแก้ปัญหาที่ซับซ้อนในโลกจริง ผ่านการปฏิสัมพันธ์โต้ตอบแบบหลายขั้นกับเครื่องมือภายนอกต่าง ๆ ส่งผลให้ Qwen3-Coder บรรลุผลทดสอบสมรรถนะ SOTA ในกลุ่มโมเดลโอเพ่นซอร์สจาก SWE-Bench Verified (เกณฑ์มาตรฐานสำหรับการประเมินความสามารถของโมเดล AI ต่าง ๆ ในการแก้ปัญหาซอฟต์แวร์ในโลกการใช้งานจริง) แม้จะไม่มีการปรับเวลาทดสอบหรือปรับขนาดการอนุมานก็ตาม

การเขียนโค้ด agentic AI กำลังพลิกโฉมการพัฒนาซอฟต์แวร์ ด้วยการทำให้เวิร์กโฟลว์การเขียนโปรแกรมมีความอิสระที่จะทำได้ด้วยตนเอง มีประสิทธิภาพ และเข้าถึงได้มากขึ้น การเปิดโอเพ่นซอร์สความสามารถในการเขียนโค้ด agentic ที่มีสมรรถนะสูง และความเข้ากันได้อย่างไม่ติดขัดกับเครื่องมือและอินเทอร์เฟซต่าง ๆ ที่นักพัฒนาซอฟต์แวร์นิยมใช้ ส่งให้ Qwen3-Coder เป็นเครื่องมือทรงคุณค่าสำหรับนักพัฒนาซอฟต์แวร์ทั่วโลก

 

โมเดล Qwen3-Coder-480B-A35B-Instruct พร้อมใช้งานแล้วบน Hugging Face และ GitHub นอกจากนี้นักพัฒนาซอฟต์แวร์ยังสามารถเข้าใช้โมเดลนี้บน Qwen Chat หรือผ่าน APIs ที่คุ้มค่าใช้จ่ายบน Model Studio ซึ่งเป็นแพลตฟอร์มการพัฒนา generative AI ของอาลีบาบา

โมเดลการเขียนโค้ดที่ใช้ Qwen มียอดดาวน์โหลดทะลุ 20 ล้านครั้งทั่วโลก Tongyi Lingma ผู้ช่วยเขียนโค้ดที่ขับเคลื่อนโดย Qwen จะได้รับการอัปเกรดความสามารถด้าน agentic ของ Qwen3-Coder เร็ว ๆ นี้ และนับตั้งแต่เปิดตัวเมื่อเดือนมิถุนายน 2567 ฟีเจอร์ “AI Programmer” ของ Tongyi Lingma ที่นำเสนอการเติมโค้ดให้สมบูรณ์, การเพิ่มประสิทธิภาพให้เหมาะสม, สนับสนุนการดีบัก, การค้นหาตัวอย่าง และการสร้างการทดสอบ batch unit ได้สร้างโค้ดมาแล้วมากกว่า 3 พันล้านบรรทัด

Empowering Thailand’s Digital Future with AI and Cloud Innovation

เสริมศักยภาพอนาคตดิจิทัลของไทย ด้วยนวัตกรรม AI และ Cloud

Empowering Thailand’s Digital Future with AI and Cloud Innovation

By Sean Yuan, Vice President of International Business and General Manager of Thailand, Indonesia, Japan, the Philippines, and South Pacific Region at Alibaba Cloud Intelligence
By Sean Yuan, Vice President of International Business and General Manager of Thailand, Indonesia, Japan, the Philippines, and South Pacific Region at Alibaba Cloud Intelligence

Thailand’s digital economy continues to evolve rapidly, driven by government initiatives, private-sector innovation, and a growing demand for advanced cloud and AI solutions. Businesses are embracing digital tools to boost efficiency, enhance customer experiences, and unlock new opportunities, making cloud adoption and AI integration critical components of the country’s economic transformation.

The Thai government is prioritizing three strategic pillars to position the country as a regional AI hub: cultivating AI-ready talents, advancing digital infrastructure, and accelerating AI adoption across key industries. Specifically, it aims to train 10 million AI users, 90,000 professionals, and 50,000 developers within two years, alongside investments in cloud systems, data centers, and open-source AI platforms to enable scalable, cost-effective solutions.

A government study reveals that while under 20% of Thai organizations have implemented AI, over 70% plan to do so, highlighting immense growth potential. This momentum aligns with Thailand’s public cloud market, projected to grow at a 23.68% CAGR from 2025 to 2030, reaching US$8.51 billion by 2030. Infrastructure as a Service (IaaS) will lead this expansion, expected to hit US$ 950.23 million by 2025.

Building Foundations for Growth

To support the nation’s digital ambitions, we launched our second data center in Thailand with richer solutions earlier this year, strengthening our commitment to secure, high-performance cloud solutions tailored for Thai businesses. This infrastructure empowers businesses to deploy AI, big data analytics, and industry-specific applications without compromising latency, compliance, or scalability.

Beyond infrastructure, we’re collaborating with Thailand’s Digital Economy Promotion Agency (depa) and universities to nurture talent through training programs, AI competitions, and e-learning platforms. A standout initiative is “Eye for Thailand”,  our first AI-powered video contest, where participants used tools like Alibaba’s video-generation model Wan2.1 to blend tradition with innovation.

The two-month contest attracted over 200 applicants nationwide, from developers to marketers, culminating in a demo day where finalists showcased creativity and technical skills. Prize winners exemplified how AI can revolutionize storytelling, underscoring the public’s growing engagement with emerging technologies.

Expanding Regional and Global Impact

Southeast Asia remains pivotal for cloud adoption. Alongside Thailand’s new data center, we expanded infrastructure in Mexico, South Korea, and Malaysia, with the Philippines slated for October. Our global network now spans 89 availability zones across 29 regions, delivering scalable, low-latency cloud services.

Proven expertise in complex migrations was demonstrated in Indonesia, where we supported Indonesia’s largest digital ecosystem GoTo Group’s seamless transition of its financial services infrastructure to our cloud, achieving zero downtime for millions of users. Post-migration, GoTo migrated its core business data platform, leveraging Alibaba Cloud’s MaxCompute to enhance operational agility and cost efficiency, migrating tens of petabytes of data without disruption over a six-month period. Such projects highlight our capacity to deliver resilient, large-scale transformations across sectors.

Democratizing AI with Open-Source Innovation

As AI adoption accelerates, open-source models are key to inclusivity. Our latest large language model, Qwen3, has surpassed 12.5 million global downloads. The Qwen3 series, from lightweight 0.6B-parameter models to advanced Mixture-of-Experts architectures, enables developers to build AI solutions in healthcare, education, and smart devices.

Its broad language support including Thai and vibrant open-source community set it apart. On platforms like Hugging Face, developers have created over 130,000 derivative models—a testament to Qwen’s versatility. By open-sourcing these tools, we empower startups, researchers, and developers to drive AI innovations.

Towards a Collaborative Future

Thailand’s digital transformation accelerates, with cloud technology, AI adoption, and skills development as pivotal priorities. At Alibaba Cloud, we remain committed to advancing this journey through reliable infrastructure, accessible AI tools, and talent empowerment.

As we deepen our presence in Thailand and Southeast Asia, we strive to be a trusted partner in shaping the region’s digital future, where innovation meets inclusivity, and ambition meets execution. Together, we can unlock boundless opportunities for the Thailand’s businesses, communities, and the next generation of digital talents.

เสริมศักยภาพอนาคตดิจิทัลของไทย ด้วยนวัตกรรม AI และ Cloud

เสริมศักยภาพอนาคตดิจิทัลของไทย ด้วยนวัตกรรม AI และ Cloud

เสริมศักยภาพอนาคตดิจิทัลของไทย ด้วยนวัตกรรม AI และ Cloud

บทความโดย นายฌอน หยวน รองประธานฝ่ายธุรกิจระหว่างประเทศและผู้จัดการทั่วไปประจำประเทศไทย อินโดนีเซีย ญี่ปุ่น ฟิลิปปินส์ และภูมิภาคแปซิฟิกใต้ อาลีบาบา คลาวด์ อินเทลลิเจนซ์
บทความโดย นายฌอน หยวน รองประธานฝ่ายธุรกิจระหว่างประเทศและผู้จัดการทั่วไปประจำประเทศไทย อินโดนีเซีย ญี่ปุ่น ฟิลิปปินส์ และภูมิภาคแปซิฟิกใต้ อาลีบาบา คลาวด์ อินเทลลิเจนซ์

เศรษฐกิจดิจิทัลของไทยมีการพัฒนาอย่างรวดเร็ว จากแรงหนุนของภาครัฐ ภาคเอกชน และความต้องการคลาวด์และ AI ประสิทธิภาพสูงที่เพิ่มมากขึ้น องค์กรธุรกิจต่างนำเครื่องมือดิจิทัลหลากหลายไปใช้เพื่อเพิ่มประสิทธิภาพการดำเนินงาน เพิ่มประสบการณ์ที่ยอดเยี่ยมให้ลูกค้า และเปิดประตูสู่โอาสใหม่ ๆ ทางธุรกิจ ส่งผลให้คลาวด์และ AI กลายเป็นองค์ประกอบสำคัญของการเปลี่ยนผ่านทางเศรษฐกิจของประเทศ

รัฐบาลไทยให้ความสำคัญกับการขับเคลื่อนประเทศให้เป็นศูนย์กลาง AI ของภูมิภาคผ่านยุทธศาสตร์สามประการคือ การปลูกฝังผู้มีความสามารถด้าน AI, การพัฒนาโครงสร้างพื้นฐานดิจิทัลให้มีประสิทธิภาพสูง และ เร่งการนำ AI ไปใช้ในอุตสาหกรรมหลักต่าง ๆ ให้ได้อย่างรวดเร็ว มีการตั้งเป้าที่จะฝึกอบรมผู้ใช้ AI จำนวน 10 ล้านราย, มืออาชีพด้าน AI จำนวน 90,000 ราย และ นักพัฒนาด้าน AI จำนวน 50,000 ราย ภายในสองปี ควบคู่กับการลงทุนด้านระบบคลาวด์ ดาต้าเซ็นเตอร์ และแพลตฟอร์ม open-source AI เพื่อใช้โซลูชันที่ปรับขนาดได้และคุ้มค่าการลงทุน

ผลการศึกษาของภาครัฐเผยให้เห็นว่า องค์กรไทยนำ AI มาใช้แล้วไม่ถึง 20% ในขณะที่องค์กรมากกว่า 70% มีแผนที่จะนำมาใช้ ซึ่งแสดงให้เห็นถึงศักยภาพการเติบโตที่ยังมีอีกมาก ความเคลื่อนไหวต่อเนื่องนี้สอดคล้องกับความเคลื่อนไหวของตลาดพับลิคคลาวด์ของประเทศไทย ซึ่งคาดไว้ว่าจะเติบโตที่ 23.68% CAGR ในช่วงปี พ.ศ. 2568 ถึง 2573 และมีมูลค่าถึง 8.51 พันล้านเหรียญสหรัฐฯ ภายในปี พ.ศ. 2573 โดย Infrastructure as a Service (IaaS) ที่คาดว่าจะมีมูลค่าสูงถึง 950.23 ล้านเหรียญสหรัฐฯ ในปี 2568 จะเป็นโซลูชันนำในการตอบสนองการขยายตัวดังกล่าว

สร้างรากฐานรองรับการเติบโต

อาลีบาบา ได้เปิดดาต้าเซ็นเตอร์แห่งที่สองในประเทศไทย ที่มาพร้อมโซลูชันต่าง ๆ มากมาย เมื่อต้นปีนี้ เพื่อสนับสนุนเป้าหมายด้านดิจิทัลของประเทศ โดยโครงสร้างพื้นฐานดาต้าเซ็นเตอร์นี้จะช่วยให้ธุรกิจใช้ AI, วิเคราะห์บิ๊กดาต้า, และใช้แอปพลิเคชันเฉพาะทางของแต่ละอุตสาหกรรมได้โดยไม่ต้องกังวลเรื่องเวลาในการตอบสนอง การปฏิบัติตามกฎระเบียบ หรือความสามารถในการปรับขนาดการใช้งาน

นอกจากด้านโครงสร้างพื้นฐานแล้ว อาลีบาบา คลาวด์ ยังได้ร่วมมือกับสำนักงานส่งเสริมเศรษฐกิจดิจิทัล (depa) และมหาวิทยาลัยต่าง ๆ เพื่อบ่มเพาะผู้มีความสามารถผ่านโปรแกรมอบรม, การแข่งขันด้าน AI, และแพลตฟอร์มอี-เลิร์นนิงต่าง ๆ โครงการที่โดดเด่น เช่น “Eye for Thailand” ซึ่งเป็นการจัดการประกวดวิดีโอที่ใช้ AI ในการสร้างสรรค์รายการแรกของอาลีบาบา คลาวด์ โดยให้ผู้เข้าร่วมแข่งขันใช้ Wan2.1 ซึ่งเป็นโมเดลการที่ใช้สร้างวิดีโอของ ทำการผสมผสานแนวคิดสร้างสรรค์ของคนไทยเข้ากับนวัตกรรม สร้างวิดีโอสั้นส่งเข้าประกวด

มีผู้สนใจสมัครเข้าร่วมการแข่งขันจากหลากหลายวงการมากกว่า 200 รายทั่วประเทศ ไม่ว่าจะเป็นนักพัฒนาซอฟต์แวร์ไปจนถึงนักการตลาด การแข่งขันปิดท้ายด้วยการให้ผู้เข้ารอบสุดท้ายได้แสดงความคิดสร้างสรรค์และทักษะทางเทคนิคในวัน demo day ผู้ชนะรางวัลต่าง ๆ เป็นตัวอย่างที่แสดงให้เห็นว่า AI สามารถปฏิวัติการเล่าเรื่องได้อย่างไร และเป็นการย้ำให้เห็นว่าสาธารณชนมีส่วนร่วมกับเทคโนโลยีเกิดใหม่มากขึ้น 

ขยายประสิทธิภาพในระดับภูมิภาคและระดับโลก

เอเชียตะวันออกเฉียงใต้ ยังคงเป็นศูนย์กลางสำคัญในการใช้คลาวด์ นอกจากดาต้าเซ็นเตอร์ใหม่ในประเทศไทยแล้ว บริษัทฯ ยังได้ขยายบริการด้านโครงสร้างพื้นฐานในแม็กซิโก เกาหลีใต้ และมาเลเซีย และจะขยายไปยังฟิลิปปินส์ในเดือนตุลาคม ปัจจุบันเครือข่ายทั่วโลกของบริษัทฯ ครอบคลุม availability zones 15 แห่งใน 29 ภูมิภาค ให้บริการคลาวด์ที่ปรับขนาดได้และมีการตอบสนองที่รวดเร็ว (low-latency)

ความเชี่ยวชาญด้านการย้ายเวิร์กโหลดที่มีความซับซ้อน ที่ได้รับการพิสูจน์แล้วในประเทศอินโดนีเซีย โดยอาลีบาบา คลาวด์ ได้สนับสนุนระบบนิเวศดิจิทัลที่ใหญ่ที่สุดของประเทศ ให้ GoTo Group สามารถเปลี่ยนผ่านโครงสร้างพื้นฐานบริการด้านการเงินของบริษัทฯ ไปไว้บนคลาวด์ของอาลีบาบา คลาวด์ ส่งผลให้สามารถให้บริการผู้ใช้หลายล้านคนได้โดยไม่เกิดการหยุดชะงัก (zero downtime) หลังจากย้ายไปอยู่บนอาลีบาบา คลาวด์ GoTo ย้ายแพลตฟอร์มข้อมูลสำคัญทางธุรกิจโดยใช้ประโยชน์จาก MaxCompute ของอาลีบาบา คลาวด์ เพื่อเพิ่มความคล่องตัวในการดำเนินงานและความคุ้มค่าในการลงทุน มีการย้ายข้อมูลหลายสิบเพตะไบต์โดยไม่มีการหยุดชะงักตลอดระยะเวลาหกเดือน โครงการดังกล่าวเน้นให้เห็นความสามารถของบริษัทฯ ในการให้บริการการทรานส์ฟอร์มขนาดใหญ่ที่ยืดหยุ่นให้กับทุกภาคส่วน

ใคร ๆ ก็ใช้ AI ได้อย่างมีประสิทธิภาพด้วยนวัตกรรมโอเพ่นซอร์ส

โมเดลโอเพ่นซอร์สคือกุญแจสำคัญสู่การมีส่วนร่วมในเวลาที่มีการนำ AI มาใช้อย่างรวดเร็ว Qwen3 ซึ่งเป็นโมเดลภาษาขนาดใหญ่รุ่นล่าสุดของอาลีบาบา มียอดดาวน์โหลดทั่วโลกทะลุ 12.5 ล้านครั้ง นอกจากนี้ Qwen3 series ไม่ว่าจะเป็นโมเดลที่มีพารามิเตอร์ขนาดเล็ก 0.6B ไปจนถึงสถาปัตยกรรม  Mixture-of-Experts ประสิทธิภาพสูง ยังช่วยให้นักพัฒนาซอฟต์แวร์สร้างโซลูชัน AI เพื่อใช้ในอุตสาหกรรมการดูแลสุขภาพ ภาคการศึกษา และอุปกรณ์อัจฉริยะต่าง ๆ

Qwen สามารถรองรับภาษาที่หลากหลายซึ่งรวมถึงภาษาไทย อีกทั้งชุมชนโอเพ่นซอร์สที่ไม่หยุดนิ่ง ทำให้เกิดความแตกต่าง ทั้งนี้ นักพัฒนาซอฟต์แวร์ได้สร้างโมเดลอนุพันธ์ (derivative model) มากกว่า 130,000 โมเดลบนแพลตฟอร์มต่าง ๆ เช่น Hugging Face ซึ่งเป็นข้อพิสูจน์ความเก่งกาจของ Qwen การเปิดโอเพ่นซอร์สเครื่องมือเหล่านี้ เป็นการเสริมแกร่งให้สตาร์ทอัพ นักวิจัย และนักพัฒนาซอฟต์แวร์ ให้สามารถขับเคลื่อนนวัตกรรมด้าน AI ต่าง ๆ ได้

เดินหน้าสู่อนาคตแห่งความร่วมมือ

การใช้คลาวด์ การใช้ AI และการพัฒนาทักษะ มีความสำคัญในลำดับต้น ๆ ที่จะทำให้การเปลี่ยนผ่านสู่ดิจิทัลของประเทศทำได้อย่างรวดเร็ว อาลีบาบา คลาวด์ ยังคงมุ่งมั่นที่จะพัฒนาแนวทางเพื่อตอบสนองความต้องการนี้ ผ่านโครงสร้างพื้นฐานที่เชื่อถือได้ เครื่องมือ AI ที่เข้าถึงได้ และการเสริมศักยภาพบุคลากรที่มีความสามารถ

ขณะที่เราขยายฐานการดำเนินงานในประเทศไทยและเอเชียตะวันออกเฉียงใต้ เรามุ่งมั่นที่จะเป็นพันธมิตรที่เชื่อถือได้ในการกำหนดอนาคตดิจิทัลของภูมิภาค ที่ซึ่งนวัตกรรมผสานรวมกับการมีส่วนร่วม และความมุ่งมั่นผสานรวมลงมือปฏิบัติจริง เมื่อร่วมมือกัน เราจะสามารถปลดล็อกโอกาสอันไร้ขีดจำกัดให้กับธุรกิจ ชุมชน และบุคลากรดิจิทัลรุ่นใหม่ของประเทศไทย

Alibaba Introduces Open-Source Model for Video Creation and Editing

อาลีบาบา เปิด โอเพ่นซอร์สโมเดลสำหรับการรังสรรค์และตัดต่อวิดีโอ

Alibaba Introduces Open-Source Model for Video Creation and Editing

All-in-one AI model, Wan2.1-VACE, designed to transform the video creation industry

Alibaba has unveiled Wan 2.1-VACE (Video All-in-one Creation and Editing), its latest open-source model for video creation and editing. This innovative tool combines multiple video processing functions into a single model, to streamline the video creation process, boosting efficiency and productivity.

As part of Alibaba’s video generation large model – the Wan2.1 series – VACE is the first open-source model in the industry to provide a unified solution for various video generation and editing tasks.

Wan2.1-VACE supports video generation with multi-modal inputs spanning text, image, and video while offering creators comprehensive video editing capabilities. These editing features include referencing images or frames, video repainting, modifying selected areas of the video and spatio-temporal extension, all of which enable the flexible combination of various tasks to enhance creativity.

With this advanced tool, users can generate video containing specific interacting subjects based on image samples and bring static images to life by adding natural movement effects. They can also enjoy advanced video repainting functions such as pose transfer, motion control, depth control, and recolorization.

The model also supports adding, modification or deletion to selective specific areas of a video without affecting the surroundings. It also allows for the extension of video boundaries while intelligently filling in content to enrich the visual experience.

As an all-in-one AI model, Wan2.1-VACE delivers unparalleled versatility, enabling users to seamlessly combine multiple functions and unlock innovative potential. Users can turn a static image into video while controlling the movement of objects by specifying the motion trajectory. They can seamlessly replace characters or objects with specified references, animate referenced characters, control poses, and expand a vertical image horizontally to create a horizontal video while adding new elements through referencing.

Innovative Technologies

Wan2.1-VACE leverages several innovative technologies, to take into account the needs of different video editing tasks during construction and design. Its unified interface, called Video Condition Unit (VCU), supports unified processing of multimodal inputs such as text, images, video, and masks.

The model employs a Context Adapter structure that injects various task concepts using formalized representations of temporal and spatial dimensions. This innovative design enables it to flexibly manage a wide range of video synthesis tasks.

Thanks to advancements in model architecture, Wan2.1-VACE can be widely applied in the rapid production of social media short videos, content creation for advertising and marketing, post-production and special effects processing in film and television, and for educational training video generation.

Training video foundation models requires immense computing resources and vast amounts of high-quality training data. Open access helps lower the barrier for more businesses to leverage AI, enabling them to create high-quality visual content tailored to their needs, quickly and cost-effectively.

Alibaba is open-sourcing the Wan2.1-VACE model in two versions; a 14-billion(B)-parameter and a 1.3-billion(B)-parameter. The models are available to download for free on Hugging Face and GitHub, as well as Alibaba Cloud’s open-source community, ModelScope.

As one of the earliest major global tech companies to open source its self-developed large-scale AI models, Alibaba open sourced four Wan2.1 models in February 2025 and, last month, a video generation model that supports video creation with start and end frames. To date, the models have attracted over 3.3 million downloads on Hugging Face and ModelScope.

อาลีบาบา เปิดตัวโอเพ่นซอร์สโมเดลสำหรับการรังสรรค์และตัดต่อวิดีโอ

อาลีบาบา เปิด โอเพ่นซอร์สโมเดลสำหรับการรังสรรค์และตัดต่อวิดีโอ

อาลีบาบา เปิดตัวโอเพ่นซอร์สโมเดลสำหรับการรังสรรค์และตัดต่อวิดีโอ

Wan2.1-VACE เป็นโมเดล AI ครบวงจรที่ออกแบบมาเพื่อพลิกโฉมวงการสร้างสรรค์วิดีโอ

อาลีบาบา เปิดตัว Wan 2.1-VACE (Video All-in-one Creation and Editing) ซึ่งเป็นโมเดลโอเพ่นซอร์สที่ใช้รังสรรค์และตัดต่อวิดีโอโมเดลล่าสุดของอาลีบาบา เครื่องมือล้ำสมัยนี้ ผสานรวมฟังก์ชันการประมวลผลวิดีโอหลากหลายฟังก์ชันไว้ในโมเดลหนึ่งเดียว เพื่อปรับปรุงกระบวนการสร้างวิดีโอให้มีประสิทธิภาพและประสิทธิผลมากขึ้น

VACE เป็นโมเดลโอเพ่นซอร์สโมเดลแรกในอุตสาหกรรมที่มอบโซลูชันในการสร้างวิดีโอหลากหลายและโซลูชันสำหรับการตัดต่อวิดีโออย่างครบวงจร VACE เป็นส่วนหนึ่งของ Wan2.1 series ซึ่งเป็นโมเดลขนาดใหญ่ที่ใช้ในการสร้างวิดีโอของอาลีบาบา

Wan2.1-VACE รองรับการสร้างวิดีโอจากอินพุตหลายรูปแบบ ไม่ว่าจะเป็น ข้อความ รูปภาพ และวิดีโอ ทั้งยังช่วยให้ผู้สร้างสรรค์วิดีโอสามารถตัดต่อวิดีโอได้อย่างครบวงจร ฟีเจอร์ด้านการตัดต่อเหล่านี้ รวมถึง ฟีเจอร์การอ้างอิงภาพหรือเฟรม การปรับวิดีโอใหม่ (video repainting) การแก้ไขวิดีโอบางส่วนที่เลือกไว้ และการขยายพื้นที่และเวลา ซึ่งช่วยให้สามารถผสมผสานการทำงานต่าง ๆ ได้อย่างยืดหยุ่นคล่องตัว ทำให้เกิดความคิดสร้างสรรค์เพิ่มขึ้น

เครื่องมือล้ำสมัยนี้ช่วยให้ผู้ใช้สามารถสร้างวิดีโอที่มีเนื้อหาการปฏิสัมพันธ์อย่างเฉพาะเจาะจงตามตัวอย่างภาพต่าง ๆ และทำให้ภาพนิ่งมีชีวิตชีวาด้วยการเพิ่มเอฟเฟกต์เคลื่อนไหวที่เป็นธรรมชาติ สนุกสนานกับการใช้สุดยอดฟังก์ชัน video repainting ต่าง ๆ เช่น การสร้างภาพโดยใช้ท่าทางที่ต้องการโดยนำมาจากภาพอีกภาพหนึ่งของบุคคลนั้นที่มีการแสดงท่าทางที่ต้องการ (pose transfer) การควบคุมการเคลื่อนไหว (motion control) การควบคุมระยะชัดลึก (depth control) และการให้สีใหม่ (recolorization)

โมเดลนี้ยังรองรับการเพิ่ม แก้ไข หรือลบเนื้อหาส่วนที่เลือก โดยไม่กระทบต่อเนื้อหาที่แวดล้อมอยู่ และยังสามารถขยายขอบเขตวิดีโอ (video boundaries) ในขณะที่มีการใส่เนื้อหาอย่างชาญฉลาดเพื่อเพิ่มประสบการณ์การรับชม

Wan2.1-VACE เป็นโมเดล AI ครบวงจร ที่มีความสามารถรอบตัวแบบไม่มีใครเทียบได้ ช่วยให้ผู้ใช้รวมฟังก์ชันหลากหลายไว้ด้วยกันได้อย่างราบรื่น และปลดล็อกศักยภาพในการสร้างสรรค์สิ่งใหม่ ผู้ใช้สามารถเปลี่ยนภาพนิ่งให้เป็นวิดีโอ โดยสามารถควบคุมการเคลื่อนไหวของวัตถุต่าง ๆ ได้ด้วยการระบุเส้นทางการเคลื่อนที่ (motion trajectory) สามารถแทนที่บุคลิก/ลักษณะ (characters) หรือวัตถุต่าง ๆ (objects) ด้วยการอ้างอิงที่ระบุไว้ (specified references), สร้างภาพเคลื่อนไหวให้กับ characters ที่อ้างอิงไว้, ควบคุมท่าทาง และ ทำภาพแนวตั้งให้เป็นแนวนอน เพื่อสร้างวิดีโอแนวนอน ในขณะที่เพิ่มองค์ประกอบใหม่ ๆ ผ่านการอ้างอิง

เทคโนโลยีต่าง ๆ ที่เป็นนวัตกรรม

Wan2.1-VACE ใช้เทคโนโลยีใหม่ ๆ หลายอย่าง โดยคำนึงถึงความต้องการของงานตัดต่อวิดีโอที่แตกต่างกันที่เกิดขึ้นในระหว่างการคิดค้นโครงสร้างและการออกแบบ อินเทอร์เฟซครบวงจรที่เรียกว่า Video Condition Unit (VCU) รองรับการประมวลผลอินพุตต่อเนื่องหลายรูปแบบได้อย่างครบถ้วนผ่านอินเทอร์เฟซเดียว ไม่ว่าจะเป็นข้อความ ภาพ วิดีโอ และมาสก์ต่าง ๆ

โมเดลนี้ใช้โครงสร้าง Context Adapter ที่แทรกคอนเซปต์งานต่าง ๆ ด้วยการใช้การแสดงมิติทางเวลาและเชิงพื้นที่อย่างมีแบบแผน ซึ่งช่วยให้โมเดลสามารถจัดการงานการสังเคราะห์วิดีโอหลากหลายได้อย่างยืดหยุ่น

ความก้าวหน้าด้านสถาปัตยกรรมโมเดล ช่วยให้สามารถนำ Wan2.1-VACE ไปใช้อย่างกว้างขวาง เช่น ใช้ผลิตวิดีโอสั้นบนโซเชียลได้อย่างรวดเร็ว, สร้างคอนเทนต์เพื่อการโฆษณาและการตลาด, นำไปใช้ในกระบวนการ post-production และการประมวลผลเอฟเฟกต์พิเศษในวงการภาพยนต์และโทรทัศน์ และใช้ในการสร้างวิดีโอเพื่อการอบรมทางการศึกษา

โมเดลพื้นฐานของวิดีโอเพื่อการฝึกอบรม ต้องใช้ทรัพยากรด้านการประมวลผลปริมาณมหาศาล และต้องใช้ข้อมูลที่ใช้ฝึกอบรมที่มีคุณภาพสูงจำนวนมาก การเปิดให้สามารถเข้าใช้โมเดลได้แบบระบบเปิด ช่วยลดอุปสรรคในการใช้ประโยชน์จาก AI ให้กับธุรกิจต่าง ๆ ได้มากขึ้น ช่วยให้ธุรกิจสามารถสร้างคอนเทนต์ที่อยู่ในรูปแบบของรูปภาพและวิดีโอ (visual content) คุณภาพสูงที่ปรับให้ตรงตามความต้องการเฉพาะของตนได้อย่างรวดเร็วและคุ้มค่าใช้จ่าย

อาลีบาบา ได้เปิดโอเพ่นซอร์สโมเดล Wan2.1-VACE สองเวอร์ชัน คือ ขนาด 14-billion(B)-parameter และ ขนาด1.3-billion(B)-parameter โดยเปิดให้ดาวน์โหลดฟรีบน Hugging Face, GitHub และบน ModelScope ซึ่งเป็นคอมมิวนิตี้ด้านโอเพ่นซอร์สของอาลีบาบา คลาวด์

อาลีบาบา เป็นบริษัทเทคโนโลยีรายใหญ่ระดับโลกรายแรก ๆ ที่เปิดโอเพ่นซอร์สโมเดล AI ขนาดใหญ่ที่พัฒนาขึ้นเอง โดยได้เปิดโอเพ่นซอร์สโมเดล Wan2.1 ไปแล้วสี่โมเดลเมื่อเดือนกุมภาพันธ์ พ.ศ.2568 และเมื่อเดือนที่ผ่านมาได้เปิดโอเพ่นซอร์สโมเดลสร้างวิดีโอที่รองรับการสร้างวิดีโอด้วยเฟรมเริ่มต้นและเฟรมสิ้นสุด ปัจจุบันโมเดลที่กล่าวมานี้มียอดดาวน์โหลดแล้วมากกว่า 3.3 ล้านครั้งบน Hugging Face และ ModelScope