Alibaba Unveils Cutting-Edge AI Coding Model Qwen3-Coder

อาลีบาบา เปิดตัว Qwen3-Coder โมเดลเขียนโค้ด AI ล้ำสมัย

Alibaba Unveils Cutting-Edge AI Coding Model Qwen3-Coder

Alibaba has launched Qwen3-Coder, its most advanced agentic AI coding model to date. Designed for high-performance software development, Qwen3-Coder excels in agentic AI coding tasks, from generating new codes and managing complex coding workflows to debugging across entire codebases.

Built on a Mixture-of-Experts (MoE) architecture, this open-sourced model Qwen3-Coder-480B-A35B-Instruct, which has a total of 480 billion parameters but activates 35 billion parameters per token, delivers efficiency without sacrificing performance. The model achieves competitive results against leading state-of-the-art (SOTA) models across key benchmarks in agentic coding, browser use, and tool use.

Additionally, Alibaba is open-sourcing Qwen Code, a powerful command-line interface (CLI) tool that enables developers to delegate engineering tasks to AI using natural language. Optimized with custom prompts and interaction protocols, Qwen Code unlocks the full potential of Qwen3-Coder for real-world agentic programming. The model also supports integration with the Claude Code interface, making it even easier for developers to execute their coding tasks.

Trained on an extensive dataset of codes and general text data, Qwen3-Coder is engineered for robust agentic coding. It natively supports a context window of 256K tokens, extendable up to 1 million tokens, enabling it to process vast codebases in a single session. Its superior performance stems not only from scaling across tokens, context length, and synthetic data during pre-training, but also from innovative post-training techniques such as long-horizon reinforcement learning (agent RL). This advancement allows the model to solve complex, real-world problems through multi-step interactions with external tools. As a result, Qwen3-Coder achieves SOTA performance among open-source models on SWE-Bench Verified (a benchmark for evaluating AI models’ ability to solve real-world software issues), even without test-time or inference scaling. 

Agentic AI coding is transforming software development by enabling more autonomous, efficient, and accessible programming workflows. With its open-source availability, strong agentic coding capabilities, and seamless compatibility with popular developer tools and interfaces, Qwen3-Coder is positioned as a valuable tool for global developers in software development.

The Qwen3-Coder-480B-A35B-Instruct model is now available on Hugging Face and GitHub. Developers can also access the model on Qwen Chat or via cost-effective APIs through Model Studio, Alibaba’s generative AI development platform.

Qwen-based coding models have already surpassed 20 million downloads globally. Tongyi Lingma, Alibaba Cloud’s Qwen-powered coding assistant, will soon be upgraded with Qwen3-Coder’s enhanced agentic capabilities. Since its launch in June 2024, Tongyi Lingma’s “AI Programmer” feature—offering code completion, optimization, debugging support, snippet search, and batch unit test generation—has generated over 3 billion lines of code.

อาลีบาบา เปิดตัว Qwen3-Coder โมเดลเขียนโค้ด AI ล้ำสมัย

อาลีบาบา เปิดตัว Qwen3-Coder โมเดลเขียนโค้ด AI ล้ำสมัย

อาลีบาบา เปิดตัว Qwen3-Coder โมเดลเขียนโค้ด AI ล้ำสมัย

อาลีบาบา เปิดตัว Qwen3-Coder โมเดลเขียนโค้ด agentic AI ของบริษัทฯ ที่ล้ำหน้าที่สุดในปัจจุบัน Qwen3-Coder ออกแบบมาเพื่อใช้ในการพัฒนาซอฟต์แวร์ที่ต้องการประสิทธิภาพสูง มีความสามารถเป็นเลิศในการเขียนโค้ด agentic AI ไม่ว่าจะเป็นการสร้างโค้ดใหม่และการจัดการกับเวิร์กโฟลว์ในการเขียนโค้ดที่ซับซ้อน ไปจนถึงการหาและแก้ไขข้อบกพร่อง (debugging) ชุดของซอร์สโค้ด (codebase) ทั้งหมด

Qwen3-Coder-480B-A35B-Instruct เป็นโมเดลโอเพ่นซอร์สที่สร้างบนสถาปัตยกรรม Mixture-of-Experts (MoE) มีพารามิเตอร์ทั้งหมด 480 พันล้านพารามิเตอร์ แต่เปิดใช้งาน 35 พันล้านพารามิเตอร์ต่อโทเค็น มอบประสิทธิภาพโดยไม่ลดทอนสมรรถนะ โมเดลนี้มีผลลัพธ์ที่แข่งขันได้กับโมเดลที่ล้ำสมัย (state-of-the-art: SOTA) ชั้นนำอื่น ๆ ในการวัดประสิทธิภาพสำคัญต่าง ๆ ในด้านการเขียนโค้ด agentic, การใช้เบราว์เซอร์ และ การใช้เครื่องมือ

นอกจากนี้ อาลีบาบายังได้เปิดโอเพ่นซอร์ส Qwen Code ซึ่งเป็นเครื่องมือ command-line interface (CLI) ทรงประสิทธิภาพที่ช่วยให้นักพัฒนาซอฟต์แวร์มอบหมายงานด้านวิศวกรรมให้กับ AI ด้วยการใช้ภาษาธรรมชาติ Qwen Code ได้รับการปรับให้เหมาะสมด้วยพรอมต์ที่กำหนดเอง (custom prompts) และโปรโตคอลการปฏิสัมพันธ์ต่าง ๆ ซึ่งเป็นการปลดล็อกศักยภาพทั้งหมดของ Qwen3-Coder ให้กับการเขียนโปรแกรม agentic ในโลกจริงได้อย่างเต็มรูปแบบ โมเดลนี้ยังรองรับการทำงานร่วมกับ Claude Code interface ซึ่งช่วยให้นักพัฒนาซอฟต์แวร์เขียนโค้ดได้ง่ายขึ้น

Qwen3-Coder ได้รับการเทรนกับชุดข้อมูลโค้ดและข้อมูลข้อความทั่วไปอย่างครอบคลุม และได้รับการออกแบบมาสำหรับการเขียนโค้ด agentic ได้อย่างทรงประสิทธิภาพ โดยปกติโมเดลนี้รองรับหน้าต่างบริบท (context window) ได้ 256K โทเค็น และสามารถขยายได้สูงสุด 1 ล้านโทเค็น ช่วยให้สามารถประมวลผล codebases ขนาดใหญ่ได้ในการสนทนาโต้ตอบเดียว (single session) 

ประสิทธิภาพทั้งหมดที่เหนือกว่านี้ไม่เพียงเกิดจากการปรับขนาดข้ามโทเค็น, ความยาวบริบท และข้อมูลสังเคราะห์ (synthetic data) ระหว่างการเทรนล่วงหน้าเท่านั้น แต่ยังมาจากเทคนิคที่เป็นนวัตกรรมต่าง ๆ ภายหลังการเทรน เช่น การเรียนรู้ของ agent ที่เกิดจากการเรียนรู้แบบลองผิดลองถูกในระยะยาว (long-horizon reinforcement learning: agent RL) 

ความล้ำหน้านี้ช่วยให้โมเดลสามารถแก้ปัญหาที่ซับซ้อนในโลกจริง ผ่านการปฏิสัมพันธ์โต้ตอบแบบหลายขั้นกับเครื่องมือภายนอกต่าง ๆ ส่งผลให้ Qwen3-Coder บรรลุผลทดสอบสมรรถนะ SOTA ในกลุ่มโมเดลโอเพ่นซอร์สจาก SWE-Bench Verified (เกณฑ์มาตรฐานสำหรับการประเมินความสามารถของโมเดล AI ต่าง ๆ ในการแก้ปัญหาซอฟต์แวร์ในโลกการใช้งานจริง) แม้จะไม่มีการปรับเวลาทดสอบหรือปรับขนาดการอนุมานก็ตาม

การเขียนโค้ด agentic AI กำลังพลิกโฉมการพัฒนาซอฟต์แวร์ ด้วยการทำให้เวิร์กโฟลว์การเขียนโปรแกรมมีความอิสระที่จะทำได้ด้วยตนเอง มีประสิทธิภาพ และเข้าถึงได้มากขึ้น การเปิดโอเพ่นซอร์สความสามารถในการเขียนโค้ด agentic ที่มีสมรรถนะสูง และความเข้ากันได้อย่างไม่ติดขัดกับเครื่องมือและอินเทอร์เฟซต่าง ๆ ที่นักพัฒนาซอฟต์แวร์นิยมใช้ ส่งให้ Qwen3-Coder เป็นเครื่องมือทรงคุณค่าสำหรับนักพัฒนาซอฟต์แวร์ทั่วโลก

 

โมเดล Qwen3-Coder-480B-A35B-Instruct พร้อมใช้งานแล้วบน Hugging Face และ GitHub นอกจากนี้นักพัฒนาซอฟต์แวร์ยังสามารถเข้าใช้โมเดลนี้บน Qwen Chat หรือผ่าน APIs ที่คุ้มค่าใช้จ่ายบน Model Studio ซึ่งเป็นแพลตฟอร์มการพัฒนา generative AI ของอาลีบาบา

โมเดลการเขียนโค้ดที่ใช้ Qwen มียอดดาวน์โหลดทะลุ 20 ล้านครั้งทั่วโลก Tongyi Lingma ผู้ช่วยเขียนโค้ดที่ขับเคลื่อนโดย Qwen จะได้รับการอัปเกรดความสามารถด้าน agentic ของ Qwen3-Coder เร็ว ๆ นี้ และนับตั้งแต่เปิดตัวเมื่อเดือนมิถุนายน 2567 ฟีเจอร์ “AI Programmer” ของ Tongyi Lingma ที่นำเสนอการเติมโค้ดให้สมบูรณ์, การเพิ่มประสิทธิภาพให้เหมาะสม, สนับสนุนการดีบัก, การค้นหาตัวอย่าง และการสร้างการทดสอบ batch unit ได้สร้างโค้ดมาแล้วมากกว่า 3 พันล้านบรรทัด

Empowering Thailand’s Digital Future with AI and Cloud Innovation

เสริมศักยภาพอนาคตดิจิทัลของไทย ด้วยนวัตกรรม AI และ Cloud

Empowering Thailand’s Digital Future with AI and Cloud Innovation

By Sean Yuan, Vice President of International Business and General Manager of Thailand, Indonesia, Japan, the Philippines, and South Pacific Region at Alibaba Cloud Intelligence
By Sean Yuan, Vice President of International Business and General Manager of Thailand, Indonesia, Japan, the Philippines, and South Pacific Region at Alibaba Cloud Intelligence

Thailand’s digital economy continues to evolve rapidly, driven by government initiatives, private-sector innovation, and a growing demand for advanced cloud and AI solutions. Businesses are embracing digital tools to boost efficiency, enhance customer experiences, and unlock new opportunities, making cloud adoption and AI integration critical components of the country’s economic transformation.

The Thai government is prioritizing three strategic pillars to position the country as a regional AI hub: cultivating AI-ready talents, advancing digital infrastructure, and accelerating AI adoption across key industries. Specifically, it aims to train 10 million AI users, 90,000 professionals, and 50,000 developers within two years, alongside investments in cloud systems, data centers, and open-source AI platforms to enable scalable, cost-effective solutions.

A government study reveals that while under 20% of Thai organizations have implemented AI, over 70% plan to do so, highlighting immense growth potential. This momentum aligns with Thailand’s public cloud market, projected to grow at a 23.68% CAGR from 2025 to 2030, reaching US$8.51 billion by 2030. Infrastructure as a Service (IaaS) will lead this expansion, expected to hit US$ 950.23 million by 2025.

Building Foundations for Growth

To support the nation’s digital ambitions, we launched our second data center in Thailand with richer solutions earlier this year, strengthening our commitment to secure, high-performance cloud solutions tailored for Thai businesses. This infrastructure empowers businesses to deploy AI, big data analytics, and industry-specific applications without compromising latency, compliance, or scalability.

Beyond infrastructure, we’re collaborating with Thailand’s Digital Economy Promotion Agency (depa) and universities to nurture talent through training programs, AI competitions, and e-learning platforms. A standout initiative is “Eye for Thailand”,  our first AI-powered video contest, where participants used tools like Alibaba’s video-generation model Wan2.1 to blend tradition with innovation.

The two-month contest attracted over 200 applicants nationwide, from developers to marketers, culminating in a demo day where finalists showcased creativity and technical skills. Prize winners exemplified how AI can revolutionize storytelling, underscoring the public’s growing engagement with emerging technologies.

Expanding Regional and Global Impact

Southeast Asia remains pivotal for cloud adoption. Alongside Thailand’s new data center, we expanded infrastructure in Mexico, South Korea, and Malaysia, with the Philippines slated for October. Our global network now spans 89 availability zones across 29 regions, delivering scalable, low-latency cloud services.

Proven expertise in complex migrations was demonstrated in Indonesia, where we supported Indonesia’s largest digital ecosystem GoTo Group’s seamless transition of its financial services infrastructure to our cloud, achieving zero downtime for millions of users. Post-migration, GoTo migrated its core business data platform, leveraging Alibaba Cloud’s MaxCompute to enhance operational agility and cost efficiency, migrating tens of petabytes of data without disruption over a six-month period. Such projects highlight our capacity to deliver resilient, large-scale transformations across sectors.

Democratizing AI with Open-Source Innovation

As AI adoption accelerates, open-source models are key to inclusivity. Our latest large language model, Qwen3, has surpassed 12.5 million global downloads. The Qwen3 series, from lightweight 0.6B-parameter models to advanced Mixture-of-Experts architectures, enables developers to build AI solutions in healthcare, education, and smart devices.

Its broad language support including Thai and vibrant open-source community set it apart. On platforms like Hugging Face, developers have created over 130,000 derivative models—a testament to Qwen’s versatility. By open-sourcing these tools, we empower startups, researchers, and developers to drive AI innovations.

Towards a Collaborative Future

Thailand’s digital transformation accelerates, with cloud technology, AI adoption, and skills development as pivotal priorities. At Alibaba Cloud, we remain committed to advancing this journey through reliable infrastructure, accessible AI tools, and talent empowerment.

As we deepen our presence in Thailand and Southeast Asia, we strive to be a trusted partner in shaping the region’s digital future, where innovation meets inclusivity, and ambition meets execution. Together, we can unlock boundless opportunities for the Thailand’s businesses, communities, and the next generation of digital talents.

เสริมศักยภาพอนาคตดิจิทัลของไทย ด้วยนวัตกรรม AI และ Cloud

เสริมศักยภาพอนาคตดิจิทัลของไทย ด้วยนวัตกรรม AI และ Cloud

เสริมศักยภาพอนาคตดิจิทัลของไทย ด้วยนวัตกรรม AI และ Cloud

บทความโดย นายฌอน หยวน รองประธานฝ่ายธุรกิจระหว่างประเทศและผู้จัดการทั่วไปประจำประเทศไทย อินโดนีเซีย ญี่ปุ่น ฟิลิปปินส์ และภูมิภาคแปซิฟิกใต้ อาลีบาบา คลาวด์ อินเทลลิเจนซ์
บทความโดย นายฌอน หยวน รองประธานฝ่ายธุรกิจระหว่างประเทศและผู้จัดการทั่วไปประจำประเทศไทย อินโดนีเซีย ญี่ปุ่น ฟิลิปปินส์ และภูมิภาคแปซิฟิกใต้ อาลีบาบา คลาวด์ อินเทลลิเจนซ์

เศรษฐกิจดิจิทัลของไทยมีการพัฒนาอย่างรวดเร็ว จากแรงหนุนของภาครัฐ ภาคเอกชน และความต้องการคลาวด์และ AI ประสิทธิภาพสูงที่เพิ่มมากขึ้น องค์กรธุรกิจต่างนำเครื่องมือดิจิทัลหลากหลายไปใช้เพื่อเพิ่มประสิทธิภาพการดำเนินงาน เพิ่มประสบการณ์ที่ยอดเยี่ยมให้ลูกค้า และเปิดประตูสู่โอาสใหม่ ๆ ทางธุรกิจ ส่งผลให้คลาวด์และ AI กลายเป็นองค์ประกอบสำคัญของการเปลี่ยนผ่านทางเศรษฐกิจของประเทศ

รัฐบาลไทยให้ความสำคัญกับการขับเคลื่อนประเทศให้เป็นศูนย์กลาง AI ของภูมิภาคผ่านยุทธศาสตร์สามประการคือ การปลูกฝังผู้มีความสามารถด้าน AI, การพัฒนาโครงสร้างพื้นฐานดิจิทัลให้มีประสิทธิภาพสูง และ เร่งการนำ AI ไปใช้ในอุตสาหกรรมหลักต่าง ๆ ให้ได้อย่างรวดเร็ว มีการตั้งเป้าที่จะฝึกอบรมผู้ใช้ AI จำนวน 10 ล้านราย, มืออาชีพด้าน AI จำนวน 90,000 ราย และ นักพัฒนาด้าน AI จำนวน 50,000 ราย ภายในสองปี ควบคู่กับการลงทุนด้านระบบคลาวด์ ดาต้าเซ็นเตอร์ และแพลตฟอร์ม open-source AI เพื่อใช้โซลูชันที่ปรับขนาดได้และคุ้มค่าการลงทุน

ผลการศึกษาของภาครัฐเผยให้เห็นว่า องค์กรไทยนำ AI มาใช้แล้วไม่ถึง 20% ในขณะที่องค์กรมากกว่า 70% มีแผนที่จะนำมาใช้ ซึ่งแสดงให้เห็นถึงศักยภาพการเติบโตที่ยังมีอีกมาก ความเคลื่อนไหวต่อเนื่องนี้สอดคล้องกับความเคลื่อนไหวของตลาดพับลิคคลาวด์ของประเทศไทย ซึ่งคาดไว้ว่าจะเติบโตที่ 23.68% CAGR ในช่วงปี พ.ศ. 2568 ถึง 2573 และมีมูลค่าถึง 8.51 พันล้านเหรียญสหรัฐฯ ภายในปี พ.ศ. 2573 โดย Infrastructure as a Service (IaaS) ที่คาดว่าจะมีมูลค่าสูงถึง 950.23 ล้านเหรียญสหรัฐฯ ในปี 2568 จะเป็นโซลูชันนำในการตอบสนองการขยายตัวดังกล่าว

สร้างรากฐานรองรับการเติบโต

อาลีบาบา ได้เปิดดาต้าเซ็นเตอร์แห่งที่สองในประเทศไทย ที่มาพร้อมโซลูชันต่าง ๆ มากมาย เมื่อต้นปีนี้ เพื่อสนับสนุนเป้าหมายด้านดิจิทัลของประเทศ โดยโครงสร้างพื้นฐานดาต้าเซ็นเตอร์นี้จะช่วยให้ธุรกิจใช้ AI, วิเคราะห์บิ๊กดาต้า, และใช้แอปพลิเคชันเฉพาะทางของแต่ละอุตสาหกรรมได้โดยไม่ต้องกังวลเรื่องเวลาในการตอบสนอง การปฏิบัติตามกฎระเบียบ หรือความสามารถในการปรับขนาดการใช้งาน

นอกจากด้านโครงสร้างพื้นฐานแล้ว อาลีบาบา คลาวด์ ยังได้ร่วมมือกับสำนักงานส่งเสริมเศรษฐกิจดิจิทัล (depa) และมหาวิทยาลัยต่าง ๆ เพื่อบ่มเพาะผู้มีความสามารถผ่านโปรแกรมอบรม, การแข่งขันด้าน AI, และแพลตฟอร์มอี-เลิร์นนิงต่าง ๆ โครงการที่โดดเด่น เช่น “Eye for Thailand” ซึ่งเป็นการจัดการประกวดวิดีโอที่ใช้ AI ในการสร้างสรรค์รายการแรกของอาลีบาบา คลาวด์ โดยให้ผู้เข้าร่วมแข่งขันใช้ Wan2.1 ซึ่งเป็นโมเดลการที่ใช้สร้างวิดีโอของ ทำการผสมผสานแนวคิดสร้างสรรค์ของคนไทยเข้ากับนวัตกรรม สร้างวิดีโอสั้นส่งเข้าประกวด

มีผู้สนใจสมัครเข้าร่วมการแข่งขันจากหลากหลายวงการมากกว่า 200 รายทั่วประเทศ ไม่ว่าจะเป็นนักพัฒนาซอฟต์แวร์ไปจนถึงนักการตลาด การแข่งขันปิดท้ายด้วยการให้ผู้เข้ารอบสุดท้ายได้แสดงความคิดสร้างสรรค์และทักษะทางเทคนิคในวัน demo day ผู้ชนะรางวัลต่าง ๆ เป็นตัวอย่างที่แสดงให้เห็นว่า AI สามารถปฏิวัติการเล่าเรื่องได้อย่างไร และเป็นการย้ำให้เห็นว่าสาธารณชนมีส่วนร่วมกับเทคโนโลยีเกิดใหม่มากขึ้น 

ขยายประสิทธิภาพในระดับภูมิภาคและระดับโลก

เอเชียตะวันออกเฉียงใต้ ยังคงเป็นศูนย์กลางสำคัญในการใช้คลาวด์ นอกจากดาต้าเซ็นเตอร์ใหม่ในประเทศไทยแล้ว บริษัทฯ ยังได้ขยายบริการด้านโครงสร้างพื้นฐานในแม็กซิโก เกาหลีใต้ และมาเลเซีย และจะขยายไปยังฟิลิปปินส์ในเดือนตุลาคม ปัจจุบันเครือข่ายทั่วโลกของบริษัทฯ ครอบคลุม availability zones 15 แห่งใน 29 ภูมิภาค ให้บริการคลาวด์ที่ปรับขนาดได้และมีการตอบสนองที่รวดเร็ว (low-latency)

ความเชี่ยวชาญด้านการย้ายเวิร์กโหลดที่มีความซับซ้อน ที่ได้รับการพิสูจน์แล้วในประเทศอินโดนีเซีย โดยอาลีบาบา คลาวด์ ได้สนับสนุนระบบนิเวศดิจิทัลที่ใหญ่ที่สุดของประเทศ ให้ GoTo Group สามารถเปลี่ยนผ่านโครงสร้างพื้นฐานบริการด้านการเงินของบริษัทฯ ไปไว้บนคลาวด์ของอาลีบาบา คลาวด์ ส่งผลให้สามารถให้บริการผู้ใช้หลายล้านคนได้โดยไม่เกิดการหยุดชะงัก (zero downtime) หลังจากย้ายไปอยู่บนอาลีบาบา คลาวด์ GoTo ย้ายแพลตฟอร์มข้อมูลสำคัญทางธุรกิจโดยใช้ประโยชน์จาก MaxCompute ของอาลีบาบา คลาวด์ เพื่อเพิ่มความคล่องตัวในการดำเนินงานและความคุ้มค่าในการลงทุน มีการย้ายข้อมูลหลายสิบเพตะไบต์โดยไม่มีการหยุดชะงักตลอดระยะเวลาหกเดือน โครงการดังกล่าวเน้นให้เห็นความสามารถของบริษัทฯ ในการให้บริการการทรานส์ฟอร์มขนาดใหญ่ที่ยืดหยุ่นให้กับทุกภาคส่วน

ใคร ๆ ก็ใช้ AI ได้อย่างมีประสิทธิภาพด้วยนวัตกรรมโอเพ่นซอร์ส

โมเดลโอเพ่นซอร์สคือกุญแจสำคัญสู่การมีส่วนร่วมในเวลาที่มีการนำ AI มาใช้อย่างรวดเร็ว Qwen3 ซึ่งเป็นโมเดลภาษาขนาดใหญ่รุ่นล่าสุดของอาลีบาบา มียอดดาวน์โหลดทั่วโลกทะลุ 12.5 ล้านครั้ง นอกจากนี้ Qwen3 series ไม่ว่าจะเป็นโมเดลที่มีพารามิเตอร์ขนาดเล็ก 0.6B ไปจนถึงสถาปัตยกรรม  Mixture-of-Experts ประสิทธิภาพสูง ยังช่วยให้นักพัฒนาซอฟต์แวร์สร้างโซลูชัน AI เพื่อใช้ในอุตสาหกรรมการดูแลสุขภาพ ภาคการศึกษา และอุปกรณ์อัจฉริยะต่าง ๆ

Qwen สามารถรองรับภาษาที่หลากหลายซึ่งรวมถึงภาษาไทย อีกทั้งชุมชนโอเพ่นซอร์สที่ไม่หยุดนิ่ง ทำให้เกิดความแตกต่าง ทั้งนี้ นักพัฒนาซอฟต์แวร์ได้สร้างโมเดลอนุพันธ์ (derivative model) มากกว่า 130,000 โมเดลบนแพลตฟอร์มต่าง ๆ เช่น Hugging Face ซึ่งเป็นข้อพิสูจน์ความเก่งกาจของ Qwen การเปิดโอเพ่นซอร์สเครื่องมือเหล่านี้ เป็นการเสริมแกร่งให้สตาร์ทอัพ นักวิจัย และนักพัฒนาซอฟต์แวร์ ให้สามารถขับเคลื่อนนวัตกรรมด้าน AI ต่าง ๆ ได้

เดินหน้าสู่อนาคตแห่งความร่วมมือ

การใช้คลาวด์ การใช้ AI และการพัฒนาทักษะ มีความสำคัญในลำดับต้น ๆ ที่จะทำให้การเปลี่ยนผ่านสู่ดิจิทัลของประเทศทำได้อย่างรวดเร็ว อาลีบาบา คลาวด์ ยังคงมุ่งมั่นที่จะพัฒนาแนวทางเพื่อตอบสนองความต้องการนี้ ผ่านโครงสร้างพื้นฐานที่เชื่อถือได้ เครื่องมือ AI ที่เข้าถึงได้ และการเสริมศักยภาพบุคลากรที่มีความสามารถ

ขณะที่เราขยายฐานการดำเนินงานในประเทศไทยและเอเชียตะวันออกเฉียงใต้ เรามุ่งมั่นที่จะเป็นพันธมิตรที่เชื่อถือได้ในการกำหนดอนาคตดิจิทัลของภูมิภาค ที่ซึ่งนวัตกรรมผสานรวมกับการมีส่วนร่วม และความมุ่งมั่นผสานรวมลงมือปฏิบัติจริง เมื่อร่วมมือกัน เราจะสามารถปลดล็อกโอกาสอันไร้ขีดจำกัดให้กับธุรกิจ ชุมชน และบุคลากรดิจิทัลรุ่นใหม่ของประเทศไทย

Alibaba Introduces Open-Source Model for Video Creation and Editing

อาลีบาบา เปิด โอเพ่นซอร์สโมเดลสำหรับการรังสรรค์และตัดต่อวิดีโอ

Alibaba Introduces Open-Source Model for Video Creation and Editing

All-in-one AI model, Wan2.1-VACE, designed to transform the video creation industry

Alibaba has unveiled Wan 2.1-VACE (Video All-in-one Creation and Editing), its latest open-source model for video creation and editing. This innovative tool combines multiple video processing functions into a single model, to streamline the video creation process, boosting efficiency and productivity.

As part of Alibaba’s video generation large model – the Wan2.1 series – VACE is the first open-source model in the industry to provide a unified solution for various video generation and editing tasks.

Wan2.1-VACE supports video generation with multi-modal inputs spanning text, image, and video while offering creators comprehensive video editing capabilities. These editing features include referencing images or frames, video repainting, modifying selected areas of the video and spatio-temporal extension, all of which enable the flexible combination of various tasks to enhance creativity.

With this advanced tool, users can generate video containing specific interacting subjects based on image samples and bring static images to life by adding natural movement effects. They can also enjoy advanced video repainting functions such as pose transfer, motion control, depth control, and recolorization.

The model also supports adding, modification or deletion to selective specific areas of a video without affecting the surroundings. It also allows for the extension of video boundaries while intelligently filling in content to enrich the visual experience.

As an all-in-one AI model, Wan2.1-VACE delivers unparalleled versatility, enabling users to seamlessly combine multiple functions and unlock innovative potential. Users can turn a static image into video while controlling the movement of objects by specifying the motion trajectory. They can seamlessly replace characters or objects with specified references, animate referenced characters, control poses, and expand a vertical image horizontally to create a horizontal video while adding new elements through referencing.

Innovative Technologies

Wan2.1-VACE leverages several innovative technologies, to take into account the needs of different video editing tasks during construction and design. Its unified interface, called Video Condition Unit (VCU), supports unified processing of multimodal inputs such as text, images, video, and masks.

The model employs a Context Adapter structure that injects various task concepts using formalized representations of temporal and spatial dimensions. This innovative design enables it to flexibly manage a wide range of video synthesis tasks.

Thanks to advancements in model architecture, Wan2.1-VACE can be widely applied in the rapid production of social media short videos, content creation for advertising and marketing, post-production and special effects processing in film and television, and for educational training video generation.

Training video foundation models requires immense computing resources and vast amounts of high-quality training data. Open access helps lower the barrier for more businesses to leverage AI, enabling them to create high-quality visual content tailored to their needs, quickly and cost-effectively.

Alibaba is open-sourcing the Wan2.1-VACE model in two versions; a 14-billion(B)-parameter and a 1.3-billion(B)-parameter. The models are available to download for free on Hugging Face and GitHub, as well as Alibaba Cloud’s open-source community, ModelScope.

As one of the earliest major global tech companies to open source its self-developed large-scale AI models, Alibaba open sourced four Wan2.1 models in February 2025 and, last month, a video generation model that supports video creation with start and end frames. To date, the models have attracted over 3.3 million downloads on Hugging Face and ModelScope.