อาลีบาบา คลาวด์ ปล่อย Qwen2.5-Omni-7B โมเดล Multimodal AI ครบวงจร

อาลีบาบา คลาวด์ ปล่อย Qwen2.5-Omni-7B โมเดล Multimodal AI ครบวงจร

อาลีบาบา คลาวด์ ปล่อย Qwen2.5-Omni-7B โมเดล Multimodal AI ครบวงจร

 อาลีบาบา คลาวด์ เปิดตัว Qwen2.5-Omni-7B โมเดลมัลติโหมด (multimodal model) ครบวงจรเป็นส่วนหนึ่งใน Qwen series โมเดลนี้ออกแบบมาโดยเน้นความสามารถในการเข้าใจประเภทของข้อมูลได้หลายรูปแบบและครอบคลุม สามารถประมวลผลอินพุตหลากหลาย รวมถึงข้อความ รูปภาพ เสียง และ วิดีโอ สามารถสร้างการตอบสนองด้วยข้อความและคำพูดที่เป็นธรรมชาติได้แบบเรียลไทม์ นับเป็นการตั้งมาตรฐานใหม่ให้กับ multimodal AI ที่สามารถปรับใช้กับอุปกรณ์ปลายทาง (edge devices) เช่น โทรศัพท์มือถือ และแล็ปท็อปได้อย่างเหมาะสม

โมเดลนี้มอบประสิทธิภาพที่ไม่มีแผ่ว และมอบความสามารถแบบมัลติโหมดที่ทรงพลัง แม้ว่าจะมีพารามิเตอร์ขนาดกะทัดรัดเพียง 7B เท่านั้น จึงเป็นการผสมผสานรากฐานที่สมบูรณ์แบบเข้ากับการพัฒนา AI agents ที่คล่องตัวและคุ้มค่า มอบคุณประโยชน์ที่จับต้องได้ โดยเฉพาะกับแอปพลิเคชันเสียงอัจฉริยะต่าง ๆ เช่น โมเดลนี้ช่วยเปลี่ยนให้คุณภาพชีวิตดีขึ้น โดยการช่วยนำทางผู้มีความบกพร่องทางการมองเห็น ผ่านคำอธิบายเสียงเกี่ยวกับสภาพแวดล้อมแบบเรียลไทม์ หรือ ให้คำแนะนำในการทำอาหารทีละขั้นตอนด้วยการวิเคราะห์ส่วนผสมจากวิดีโอ หรือ ขับเคลื่อนให้บริการลูกค้าอัจริยะสามารถใช้บทสนทนาที่เข้าใจความต้องการที่แท้จริงของลูกค้าได้

ปัจจุบันโมเดลนี้เปิดเป็นโอเพ่นซอร์สบน Hugging Face และ GitHub และสามารถเข้าใช้ผ่าน Qwen Chat และ ModelScope ซึ่งเป็นชุมชนโอเพ่นซอร์สของอาลีบาบา คลาวด์ ทั้งนี้ในหลายปีที่ผ่านมา อาลีบาบา คลาวด์ ได้เปิดให้โมเดล generative AI มากกว่า 200 โมเดลเป็นโอเพ่นซอร์ส

นวัตกรรมด้านสถาปัตยกรรม ขับเคลื่อนให้โมเดลมีประสิทธิภาพสูง

Qwen2.5-Omni-7B มอบประสิทธิภาพโดดเด่นให้กับโหมดทุกประเภท ได้ทัดเทียมกับโมเดลเฉพาะแบบโหมดเดียวต่าง ๆ (single-modality models) ที่มีขนาดใกล้เคียงกัน โดยเฉพาะอย่างยิ่ง โมเดลนี้ได้ตั้งมาตรฐานใหม่ด้านการปฏิสัมพันธ์ด้วยเสียงแบบเรียลไทม์ การสร้างเสียงพูดที่เป็นธรรมชาติและชัดเจน และการทำตามคำสั่งเสียงอย่างครบวงจรจากต้นจนจบ

ประสิทธิภาพและสมรรถนะที่สูงของโมเดลนี้มาจากการใช้สถาปัตยกรรมล้ำสมัย ซึ่งรวมถึง Thinker-Talker Architecture ที่แยกการสร้างข้อความ (ด้วย Thinker) และการสังเคราะห์เสียง (ด้วย Talker) ออกจากกัน เพื่อลดสัญญาณรบกวนจากโหมดต่าง ๆ ให้เหลือน้อยที่สุดเพื่อให้ได้เอาต์พุตคุณภาพสูง, TMRoPE (Time-aligned Multimodal RoPE) ซึ่งเป็นเทคนิคการฝังตำแหน่งเพื่อให้ซิงโครไนซ์อินพุตวิดีโอด้วยเสียงเพื่อสร้างเนื้อหาที่สอดคล้องกันได้ดีขึ้น, และ Block-wise Streaming Processing ที่ช่วยให้สามารถตอบสนองเสียงด้วยความรวดเร็วมีความหน่วงต่ำ ส่งผลให้การโต้ตอบด้วยเสียงเป็นไปอย่างราบรื่น

Qwen2.5-Omni-7B ได้รับการเทรนล่วงหน้าด้วยชุดข้อมูลที่หลากหลายและกว้างขวาง ซึ่งรวมถึง การเปลี่ยนภาพเป็นข้อความ, วิดีโอเป็นข้อความ, วิดีโอเป็นเสียง, ตัวอักษรเป็นข้อมูล เพื่อให้มั่นใจได้ว่าโมเดลจะสามารถทำงานได้ทุกแบบด้วยประสิทธิภาพสูง

สถาปัตยกรรมที่ล้ำสมัยและการเทรนล่วงหน้าด้วยชุดข้อมูลคุณภาพสูง ทำให้โมเดลนี้มีความเป็นเลิศด้านการทำตามคำสั่งเสียง และมีประสิทธิภาพเทียบเท่ากับการป้อนเป็นตัวอักษรข้อความล้วน ๆ สำหรับงานที่เกี่ยวข้องกับมัลติโหมด เช่น โมเดลที่ได้รับการประเมินผ่าน OmniBench ซึ่งเป็นเกณฑ์มาตรฐานที่ประเมินความสามารถของโมเดลต่าง ๆ ด้านการจดจำ การตีความ และการให้เหตุผล จากอินพุตที่เป็นภาพ เสียงและข้อความ จึงกล่าวได้ว่า Qwen2.5-Omni มีสมรรถนะล้ำสมัยที่สุดในปัจจุบัน

Qwen2.5-Omni-7B ยังแสดงให้เห็นว่ามีสมรรถนะในการทำความเข้าใจและการสร้างคำพูดที่ดีเยี่ยม และมีความสามารถในการสร้างคำพูดผ่านการเรียนรู้ลงลึกในเชิงบริบท (in-context learning: ICL) นอกจากนี้ หลังจากเสริมประสิทธิภาพด้วยการเรียนรู้แบบเสริมกำลัง (reinforcement learning: RL) หรือการเรียนรู้จากปฏิสัมพันธ์แบบลองผิดลองถูกที่เกิดขึ้นระหว่างทางของการเรียนรู้แล้ว Qwen2.5-Omni-7B ได้แสดงให้เห็นว่ามีความเสถียรในการสร้างคำพูดเพิ่มขึ้นอย่างมาก ลดความคลาดเคลื่อนในการให้ความสนใจ, ลดข้อผิดพลาดในการออกเสียง และลดการสะดุดหยุดลงระหว่างการตอบสนองด้วยคำพูดได้อย่างเห็นได้ชัด

อาลีบาบา คลาวด์ เปิดตัว Qwen2.5 เมื่อเดือนกันยายนปี 2567 และปล่อย Qwen2.5-Max สู่ตลาดในเดือนมกราคมปี 2568 และได้รับการจัดให้อยู่ในอันดับที่ 7 บน Chatbot Arena ซึ่งเทียบชั้นได้กับ LLM ชั้นนำทั้งหลายที่มีกรรมสิทธิ์ และยังแสดงให้เห็นถึงความสามารถที่โดดเด่นด้านต่าง ๆ  อาลีบาบา คลาวด์ยังได้เปิดโอเพ่นซอร์ส Qwen2.5-VL และ Qwen2.5-1M ตอบโจทย์การทำความเข้าใจภาพที่มีประสิทธิภาพมากขึ้น และจัดการกับอินพุตบริบทที่ยาว ๆ ได้ดีขึ้น

A Majority of Businesses Intrigued by the Potential of AI in Achieving Sustainability Goals Whilst Energy Consumption Concerns Persist

A Majority of Businesses Intrigued by the Potential of AI in Achieving Sustainability Goals Whilst Energy Consumption Concerns Persist

A Majority of Businesses Intrigued by the Potential of AI in Achieving Sustainability Goals Whilst Energy Consumption Concerns Persist

  • More than one in two organizations acknowledge gap in understanding how digital technology can facilitate achieving sustainability goal.
  • Asian markets are leading the way in interest in adopting AI, cloud computing, and digital technologies to drive sustainability, with Thailand emerging among the top, showcasing strong enthusiasm.

Over three quarters of businesses (76%) across Asia, Europe and the Middle East are intrigued by the potential of digital technologies, including AI and cloud computing in driving sustainable development, according to the latest survey report titled “Tech-Driven Sustainability Trends and Index 2024”, commissioned by Alibaba Cloud, the digital technology and intelligence backbone of Alibaba Group. However, the substantial energy consumption associated with these technologies is still reflecting a key barrier to broader adoption, as 61% of respondents still express concerns over the matter. 

This interest in the potential of AI, cloud computing and other advanced digital technologies to support sustainable development varies across regions, with emerging Asian markets leading the way (83%), followed closely by the Middle East (78%), Europe (74%), and developed Asian markets (72%). Notably, the Philippines (91%), Singapore (84%), Indonesia (81%), and Thailand (81%), demonstrate particularly high interest. 

The survey also found that on average 80% of respondents have set sustainability goals, with Thailand surpassing this at 82%.

Regional Variations in AI Adoption and Sustainability Efforts

Despite this optimism, 59% businesses acknowledge gap in understanding how digital technology can assist in achieving sustainability goals with Asia leading at 63%, followed by Europe at 61% and the Middle East at 45%. Among all markets, Thailand ranked third with 70%, following Singapore (83%) and Hong Kong SAR (75%). 

Around two thirds (62%) of executives believe their organizations are lagging in adopting cloud computing and AI to accelerate progress towards sustainability goals. This concern is particularly noted in Singapore (80%), the Philippines (77%), and Japan (75%) and Hong Kong SAR (75%), indicating a pressing need for organizations to accelerate their technological adoption to advance sustainability. 

Overall, 82% of businesses agree that sustainable development in technology is paramount for their companies, with markets like Singapore (93%), the Philippines (91%), and Indonesia (89%) leading the charge. Companies increasingly recognize the multifaceted benefits of adopting digital technologies for sustainability including cost savings, improved operational efficiencies, and enhanced compliance with Environmental, Social, and Governance (ESG) regulations. For Thailand, 80% of respondents agreed on this matter.

AI and machine learning are viewed as the most crucial digital technologies for advancing corporate sustainability, with businesses in the Middle East (52%) placing greater emphasis on their importance compared to Europe (41%), emerging Asian markets (40%) and developed Asian markets (36%). In Thai market, respondents identified both AI/Machine Learning and cloud computing as the most important digital technologies with 34% of respondents favoring each. Meanwhile, 81% of businesses feel human oversight is needed in guiding the development of digital technologies, including AI tools with the Middle East feel the strongest at 91%, followed by emerging Asian markets at 83%, Europe at 82% and developed Asian markets at 74%. 

However, the survey reveals a notable concern: 61% of respondents fear that the high energy consumption associated with digital technologies may hinder widespread AI adoption. This concern is even higher in Singapore (85%), the Philippines (77%) and Hong Kong SAR (75%). 65% of Thai respondents share these energy concerns. Furthermore, 71% of businesses believe that the substantial energy consumption of digital technologies such as powering AI may outweigh its benefits with the highest concerns from Singapore (86%), the Philippines (84%) and Malaysia (81%). 

The report also highlights the importance of selecting technology providers that prioritize sustainability. When selecting a “green” cloud provider, approximately half of businesses prioritize those that use renewable energy (51%), maintain energy-efficient data centers (46%), and implement carbon footprint reduction initiatives (42%). Thai respondents ranked energy-efficient data center providers at the top of their list (51%), followed by providers with ‘future commitments on innovative or sustainable products and services’ (41%) and providers using renewable energy to power data centers (38%).

Commitment to Green AI and Open-source Innovation

“With feedback from decision-makers across 13 markets, the survey report sheds light on the current attitudes and challenges businesses face in adopting AI and cloud computing for sustainability,” said Selina Yuan, President of International Business, Alibaba Cloud Intelligence. “At Alibaba Cloud, we are committed to supporting businesses on their sustainability journeys with scalable and sustainable solutions. By pledging to use 100% clean energy by 2030 and improving the energy efficiency at our global data centers, as well as optimizing Generative AI capabilities such as large language models (LLMs) performance, AI can be a powerful tool to improve efficiency and optimize energy consumption.”

Alibaba Cloud has made notable progress in its green cloud initiatives. In the fiscal year ending March 31, 2024, the average power usage effectiveness (PUE) of the company’s self-built data centers improved to 1.200 from 1.215 the year before, with 56% of the electricity consumed coming from clean sources. Additionally, Alibaba’s green computing infrastructure has enabled clients to reduce their emissions by 9.884 million tons, a remarkable increase of 44% year-on-year.

In addition, Alibaba Cloud is at the forefront of democratizing AI through its open-source initiatives, making advanced AI technologies accessible and affordable for businesses of all sizes. By releasing cutting-edge open-source models from its proprietary large language model Qwen family, including Qwen2.5-VL and Qwen2.5-1M and its video foundation model Tongyi Wanxiang (Wan), Alibaba Cloud empowers developers to create task-specific AI applications that are both efficient and cost-effective. These open-source models have already inspired over 100,000 derivative models on Hugging Face, showcasing their global adoption and versatility. By promoting smaller parameter models, Alibaba Cloud reduces the cost and energy consumption of AI training and deployment, fostering a collaborative ecosystem that drives energy-efficient innovation.

Surveying 1,300 decision-makers across 13 markets, “Tech-Driven Sustainability Trends and Index 2024” aims to provide valuable insights into the evolving landscape of corporate sustainability. The survey report underscores the essential role of technology in driving impactful change, while highlighting the need for businesses to adopt AI and cloud computing responsibly to address energy consumption concerns and bridge the gap in sustainability efforts.

ผลสำรวจพบธุรกิจส่วนใหญ่ทึ่งในศักยภาพของ AI ที่จะช่วยให้บรรลุเป้าหมายด้านความยั่งยืน แต่ยังกังวลเรื่องการใช้พลังงาน

ผลสำรวจพบธุรกิจส่วนใหญ่ทึ่งในศักยภาพของ AI ที่จะช่วยให้บรรลุเป้าหมายด้านความยั่งยืน แต่ยังกังวลเรื่องการใช้พลังงาน

ผลสำรวจพบธุรกิจส่วนใหญ่ทึ่งในศักยภาพของ AI ที่จะช่วยให้บรรลุเป้าหมายด้านความยั่งยืน แต่ยังกังวลเรื่องการใช้พลังงาน

  • องค์กรมากกว่าหนึ่งในสองยอมรับว่ามีช่องว่างของความเข้าใจว่าเทคโนโลยีดิจิทัลจะช่วยให้บรรลุเป้าหมายด้านความยั่งยืนได้อย่างไร
  • ตลาดเอเชียเป็นตลาดนำในการใช้ AI คลาวด์คอมพิวติ้ง และใช้ดิจิทัลเทคโนโลยีขับเคลื่อนความยั่งยืน โดยผลสำรวจพบประเทศไทยอยู่ในลำดับต้น ๆ ในการใช้ AI และคลาวด์คอมพิวติ้ง

อาลีบาบา คลาวด์ ธุรกิจด้านเทคโนโลยีดิจิทัลและหน่วยงานหลักด้านอินเทลลิเจนซ์ของอาลีบาบา กรุ๊ป เผยรายงาน “แนวโน้มและดัชนีความยั่งยืนที่ขับเคลื่อนด้วยเทคโนโลยีประจำปี 2024” (Tech-Driven Sustainability Trends and Index 2024) พบว่าธุรกิจมากกว่าสามในสี่ (76%) ในเอเชีย ยุโรป และตะวันออกกลางตระหนักว่าเทคโนโลยีดิจิทัลต่าง ๆ รวมถึงปัญญาประดิษฐ์ (AI) และคลาวด์คอมพิวติ้ง มีศักยภาพสูงในการขับเคลื่อนการพัฒนาที่ยั่งยืน อย่างไรก็ตาม 61% ของผู้ตอบแบบสอบถามยังคงกังวลว่าการที่เทคโนโลยีเหล่านี้ใช้พลังงานมากจะเป็นอุปสรรคสำคัญต่อการนำเทคโนโลยีเหล่านี้ไปใช้อย่างแพร่หลาย 

การให้ความสำคัญกับการนำศักยภาพของ AI คลาวด์คอมพิวติ้ง และเทคโนโลยีดิจิทัลขั้นสูงอื่น ๆ เพื่อสนับสนุนการพัฒนาที่ยั่งยืนในภูมิภาคต่าง ๆ นั้นแตกต่างกัน ผลสำรวจพบว่า ตลาดเกิดใหม่ในเอเชียเป็นผู้นำในเรื่องนี้ (83%) ตามติดด้วยตลาดตะวันออกกลาง (78%) ยุโรป (74%) และตลาดที่พัฒนาแล้วในเอเชีย (72%) หากลงรายละเอียดระดับประเทศ ตลาดที่ให้ความสนใจและให้ความสำคัญด้านนี้มากที่สุดคือฟิลิปปินส์ (91%) สิงคโปร์ (84%) อินโดนีเซีย (81%) และไทย (81%) 

นอกจากนี้ผู้ตอบแบบสำรวจโดยเฉลี่ย 80% ได้กำหนดเป้าหมายด้านความยั่งยืนไว้แล้ว โดยประเทศไทยสูงกว่าผลเฉลี่ยเล็กน้อยอยู่ที่ 82%

ความแตกต่างในการใช้ AI และความพยายามด้านความยั่งยืนของแต่ละภูมิภาค

แม้การนำเทคโนโลยีดิจิทัลมาใช้จะเป็นไปในเชิงบวก แต่ธุรกิจ 59% ยังไม่เข้าใจอย่างถ่องแท้ว่าเทคโนโลยีดิจิทัลจะช่วยให้บรรลุเป้าหมายด้านความยั่งยืนได้อย่างไร โดยตลาดเอเชียมีช่องว่างด้านนี้มากที่สุดที่ 63% ตามด้วยยุโรป 61% และตะวันออกกลาง 45% ในเอเชียประเทศไทยอยู่ในลำดับที่สาม (70%) รองจากสิงคโปร์ (83%) และเขตบริหารพิเศษฮ่องกง (75%) 

นอกจากนี้ผู้ตอบแบบสำรวจประมาณสองในสาม (62%) เชื่อว่าองค์กรของตนยังล้าหลังในการนำคลาวด์คอมพิวติ้งและ AI มาปรับใช้เพื่อเร่งให้บรรลุเป้าหมายด้านความยั่งยืนได้เร็วขึ้น ข้อกังวลนี้มีเปอร์เซ็นที่สูงในประเทศสิงคโปร์ (80%) ฟิลิปปินส์ (77%) ญี่ปุ่น (75%) และเขตบริหารพิเศษฮ่องกง (75%) ซึ่งบ่งชี้ถึงความจำเป็นเร่งด่วนที่องค์กรต่างต้องเร่งนำเทคโนโลยีมาใช้เพื่อเพิ่มศักยภาพในการพัฒนาความยั่งยืน

โดยภาพรวม ธุรกิจ 82% เห็นตรงกันว่าการพัฒนาเทคโนโลยีที่ยั่งยืน เป็นสิ่งสำคัญต่อบริษัทของตน โดยสิงคโปร์ (93%) ฟิลิปปินส์ (91%) และอินโดนีเซีย (89%) เป็นสามประเทศที่มีสัดส่วนสูง คุณประโยชน์หลากหลายของการใช้เทคโนโลยีดิจิทัลเพื่อความยั่งยืนที่องค์กรที่ตอบแบบสำรวจตระหนักมากที่สุด เช่น ประหยัดค่าใช้จ่าย เพิ่มประสิทธิภาพการดำเนินงาน และสามารถปฏิบัติตามกฎระเบียบด้านสิ่งแวดล้อม สังคม และธรรมาภิบาล (ESG) ได้ดีขึ้น สำหรับประเทศไทย ผู้ตอบแบบสอบถาม 80% เห็นด้วยกับเรื่องนี้ 

52% ของธุรกิจในตะวันออกกลางมองว่า AI และ ML (แมชชีนเลิร์นนิ่ง) เป็นเทคโนโลยีดิจิทัลที่สำคัญที่สุดสำหรับการพัฒนาความยั่งยืนขององค์กร ในขณะที่ยุโรปให้ความสำคัญเรื่องนี้รองลงมาที่ 41% ตลาดเกิดใหม่ในเอเชีย 40% และตลาดที่พัฒนาแล้วในเอเชีย 36% ผู้ตอบแบบสำรวจในไทยระบุว่าทั้ง AI/ML และคลาวด์คอมพิวติ้งเป็นเทคโนโลยีดิจิทัลที่สำคัญที่สุด (34%) ในขณะเดียวกัน 81% ของธุรกิจที่ตอบแบบสำรวจรู้สึกว่ายังจำเป็นต้องใช้คนควบคุมและชี้แนะการพัฒนาเทคโนโลยีดิจิทัลและเครื่องมือด้าน AI ต่าง ๆ โดยตลาดตะวันออกกลาง (91%) มีแนวคิดด้านนี้สูงสุด ตามด้วยตลาดเกิดใหม่ในเอเชีย (83%) ยุโรป (82%) และตลาดพัฒนาแล้วในเอเชีย (74%)

อย่างไรก็ตาม ผู้ตอบแบบสำรวจ 61% กังวลว่าการที่เทคโนโลยีดิจิทัลใช้พลังงานปริมาณมากจะเป็นอุปสรรคต่อการนำ AI ไปใช้ในวงกว้าง โดยสิงคโปร์มีความกังวลสูงสุดที่ 85% ฟิลิปปินส์ 77% เขตบริหารพิเศษฮ่องกง 75% และไทย 65% นอกจากนี้ธุรกิจ 71% ยังเชื่อว่าการใช้พลังงานปริมาณมากของเทคโนโลยีดิจิทัลเช่น AI จะไม่คุ้มกับประโยชน์ที่จะได้รับ โดย 3 ตลาดที่กังวลเรื่องนี้สูงสุดคือสิงคโปร์ 86% ฟิลิปปินส์ 84% และมาเลเซีย 81%

รายงานฉบับนี้ยังเน้นให้เห็นความสำคัญของการเลือกผู้ให้บริการทางเทคโนโลยีที่ให้ความสำคัญกับความยั่งยืน ในมุมของการเลือกผู้ให้บริการคลาวด์ที่ “เป็นมิตรต่อสิ่งแวดล้อม” ธุรกิจประมาณครึ่งหนึ่งให้ความสำคัญกับผู้ให้บริการคลาวด์ที่ใช้พลังงานทดแทน (51%) ตามด้วยผู้ให้บริการที่คงไว้ซึ่งการดำเนินงานของดาต้าเซ็นเตอร์ที่ประหยัดพลังงาน (46%) และใช้แนวทางหรือมีโครงการลดการปล่อยก๊าซคาร์บอน (42%) ผู้ตอบแบบสำรวจในไทยให้ความสำคัญกับการเลือกผู้ให้บริการคลาวด์แตกต่างเล็กน้อย โดยจัดให้ผู้ให้บริการดาต้าเซ็นเตอร์ที่ประหยัดพลังงานอยู่ในลำดับสูงสุด (51%) ตามด้วยผู้ให้บริการที่มีความมุ่งมั่นในอนาคตเกี่ยวกับผลิตภัณฑ์และบริการที่เป็นนวัตกรรมหรือมีความยั่งยืน (41%) และผู้ให้บริการที่ใช้พลังงานทดแทนในการดำเนินงานดาต้าเซ็นเตอร์ (38%)

ความมุ่งมั่นต่อ AI ที่เป็นมิตรต่อสิ่งแวดล้อม และนวัตกรรมโอเพ่นซอร์ส

เซลิน่า หยวน ประธานฝ่ายธุรกิจระหว่างประเทศของอาลีบาบา คลาวด์ อินเทลลิเจนซ์ กล่าวว่า “การตอบแบบสำรวจของผู้มีอำนาจตัดสินใจจาก 13 ตลาด ทำให้รายงานการสำรวจนี้ให้ความกระจ่างเกี่ยวกับทัศนคติ และความท้าทายในการใช้ AI และคลาวด์คอมพิวติ้งเพื่อความยั่งยืนที่ธุรกิจเผชิญในปัจจุบัน อาลีบาบา คลาวด์ มุ่งมั่นสนับสนุนการเดินบนเส้นทางแห่งความยั่งยืนของธุรกิจต่าง ๆ ด้วยโซลูชันที่ปรับขนาดการทำงานได้และยั่งยืน AI จะกลายเป็นเครื่องมือทรงพลังที่จะช่วยเพิ่มประสิทธิภาพการใช้พลังงานให้เหมาะสม ด้วยคำมั่นของเราที่จะใช้พลังงานสะอาด 100% ภายในปี 2573 และเพิ่มประสิทธิภาพการใช้พลังงานในดาต้าเซ็นเตอร์ทั่วโลกของเรา รวมถึงการเพิ่มขีดความสามารถให้กับ Generative AI เช่น ประสิทธิภาพของโมเดลภาษาขนาดใหญ่ (LLM)”

การดำเนินงานด้านคลาวด์ที่เป็นมิตรต่อสิ่งแวดล้อมของอาลีบาบา คลาวด์ ประสบความสำเร็จอย่างสูง ข้อมูล ณ วันสิ้นสุดปีงบประมาณของบริษัทฯ เมื่อวันที่ 31 มีนาคม 2567 เผยให้เห็นว่าการใช้พลังงานเฉลี่ย (PUE) ของดาต้าเซ็นเตอร์ที่บริษัทฯ สร้างเองมีประสิทธิภาพดีขึ้นเป็น 1.200 จาก 1.215 ในปีงบประมาณก่อนหน้า โดย 56% ของการใช้ไฟฟ้ามาจากแหล่งพลังงานสะอาด นอกจากนี้โครงสร้างพื้นฐานการประมวลผลที่เป็นมิตรต่อสิ่งแวดล้อมของอาลีบาบา ยังช่วยให้ลูกค้าลดการปล่อยก๊าซเรือนกระจกได้ 9.884 ล้านตัน ซึ่งลดได้เพิ่มขึ้นอย่างน่าทึ่งถึง 44% เมื่อเทียบกับช่วงเดียวกันของปีที่ผ่านมา

นอกจากนี้ อาลีบาบา คลาวด์ ยังเป็นผู้นำในการช่วยให้การใช้ AI แพร่หลายมากขึ้น ผ่านการเปิดโอเพ่นซอร์สให้ธุรกิจทุกขนาดเข้าถึงเทคโนโลยี AI ขั้นสูงได้ด้วยค่าใช้จ่ายที่เหมาะสม อาลีบาบา คลาวด์ เสริมแกร่งให้นักพัฒนาซอฟต์แวร์สามารถสร้างแอปพลิเคชัน AI เฉพาะงานได้อย่างมีประสิทธิภาพและคุ้มค่าใช้จ่าย ด้วยการเปิดโอเพ่นซอร์สโมเดลภาษาขนาดใหญ่ที่ล้ำสมัยของบริษัทฯ ในตระกูล Qwen ซึ่งรวมถึง Qwen2.5-VL และ Qwen2.5-1M และ Tongyi Wanxiang (Wan) ซึ่งเป็นโมเดลพื้นฐานด้านวิดีโอของ บริษัทฯ โมเดลโอเพ่นซอร์สเหล่านี้ ได้สร้างแรงบันดาลใจให้เกิดการสร้างโมเดลอนุพันธ์มากกว่า 100,000 โมเดล บน Hugging Face ซึ่งเป็นการแสดงให้เห็นถึงความสามารถรอบด้านของโมเดลเหล่านี้ และการนำไปใช้แพร่หลายทั่วโลก อาลีบาบา คลาวด์ สนับสนุนโมเดลที่มีขนาดพารามิเตอร์เล็กลง เพื่อลดค่าใช้จ่ายและลดการใช้พลังงานในการฝึกอบรมและปรับใช้ AI เป็นการส่งเสริมระบบนิเวศการทำงานร่วมกันที่ขับเคลื่อนด้วยนวัตกรรมที่ประหยัดพลังงาน

รายงาน “Tech-Driven Sustainability Trends and Index 2024” ทำการสำรวจผู้มีอำนาจตัดสินใจ 1,300 รายใน 13 ตลาด มีวัตถุประสงค์เพื่อให้ข้อมูลเชิงลึกที่มีคุณประโยชน์เกี่ยวกับภูมิทัศน์การพัฒนาอย่างยั่งยืนขององค์กร รายงานการสำรวจเน้นย้ำไปที่บทบาทสำคัญของเทคโนโลยีในการขับเคลื่อนการเปลี่ยนแปลงที่สร้างผลกระทบสำคัญ และเน้นให้เห็นความจำเป็นที่ธุรกิจควรใช้ AI และคลาวด์คอมพิวติ้งอย่างมีความรับผิดชอบ เพื่อขจัดความกังวลด้านการใช้พลังงานและลดช่องว่างของการทำงานด้านความยั่งยืน

เกี่ยวกับการสำรวจ

รายงาน “Tech-Driven Sustainability Trends and Index 2024” ของอาลีบาบา คลาวด์ จัดทำโดยอิสระโดย Yonder Consulting ซึ่งเป็นบริษัทที่ปรึกษาทางธุรกิจ พร้อมด้วยการให้คำปรึกษา การออกแบบ และการวิเคราะห์จาก The Purpose Business ซึ่งเป็นบริษัทที่ปรึกษาด้านความยั่งยืน การสำรวจครั้งนี้เป็นการรวบรวมความคิดเห็นจากผู้นำธุรกิจและผู้บริหารระดับสูง 1,300 คนที่อยู่ในอุตสาหกรรมต่าง ๆ เช่น เทคโนโลยีและการสื่อสาร การเงิน โครงสร้างพื้นฐาน ทรัพยากรหมุนเวียน การดูแลสุขภาพ การขนส่ง ค้าปลีก และภาคการผลิต โดยทำการสำรวจจากวันที่ 10 พฤษภาคม ถึงวันที่ 19 มิถุนายน 2567

ผู้ตอบแบบสำรวจมาจากตลาด 13 แห่งในเอเชีย ยุโรป และ ตะวันออกกลาง ในเอเชียประกอบด้วย อินโดนีเซีย มาเลเซีย ฟิลิปปินส์ ไทย เขตบริหารพิเศษฮ่องกง ญี่ปุ่น สิงคโปร์ และเกาหลีใต้ ในยุโรปประกอบด้วย ฝรั่งเศส เยอรมนี และสหราชอาณาจักร และในตะวันออกกลางประกอบด้วย ซาอุดีอาระเบียและสหรัฐอาหรับเอมิเรตส์ คำว่าตลาดที่พัฒนาแล้วในเอเชียหมายถึง เขตบริหารพิเศษฮ่องกง ญี่ปุ่น สิงคโปร์ และเกาหลีใต้ ส่วนคำว่าตลาดเกิดใหม่ในเอเชียในที่นี้หมายถึง อินโดนีเซีย มาเลเซีย ฟิลิปปินส์ และไทย

Alibaba Cloud Open Sources its AI Models for Video Generation

Alibaba Cloud Launches Carbon Management Solution

Alibaba Cloud Open Sources its AI Models for Video Generation

Alibaba Cloud, the digital technology and intelligence backbone of Alibaba Group, recently made its AI models for video generation freely available as part of its latest efforts to contribute to the open-source community.

It is open sourcing four models of its 14 – billion(B)-parameter and 1.3 – billion(B)-parameter versions of Wan2.1 series, the latest iteration of its video foundation model Tongyi Wanxiang (Wan).

The four models, including T2V-14B, T2V-1.3B, I2V-14B-720P, and I2V-14B-480P, are designed to generate high-quality images and videos from text and image inputs. They are available for download on Alibaba Cloud’s AI model community, Model Scope, and the collaborative AI platform Hugging Face, accessible to academics, researchers, and commercial institutions worldwide. Within a week of their launch, the combined downloads of the four Wan2.1 open-source models on ModelScope and Hugging Face exceeded 1 million.

Unveiled earlier this year, Wan2.1 series is the first video generation model to support text effects in both Chinese and English. It excels at generating realistic visuals by accurately handling complex movements, enhancing pixel quality, adhering to physical principles, and optimizing the precision of instruction execution. Its precision in following instructions has propelled Wan2.1 to the top of the VBench leaderboard, a comprehensive benchmark suite for video generative models.

According to VBench, the Wan2.1 series, with an overall score of 86.22%, leads in key dimensions such as dynamic degree, spatial relationships, color, and multi-object interactions

Training video foundation models requires immense computing resources and vast amounts of high-quality training data. Open access helps lower the barrier for more businesses to leverage AI, enabling them to create high-quality visual content tailored to their needs in a cost-effective way.

The T2V-14B model is better suited for creating high-quality visuals with substantial motion dynamics, while the T2V-1.3B model strikes a balance between generation quality and computational power, making it ideal for a broad range of developers conducting secondary development and academic research. For example, the T2V-1.3B model allows users with standard personal laptops to generate a 5-second-long video at 480p resolution in as little as around 4 minutes.

In addition to supporting text-to-video generation, the I2V-14B-720P and I2V-14B-480P models also offer image-to-video capabilities. Users simply need to input a single image along with a brief text description to generate dynamic video content. The platform supports normal-sized image inputs of any dimensions.

Alibaba Cloud was one of the first major global tech companies to make its self-developed large-scale AI model open-source, releasing its first open-model Qwen (Qwen-7B) in August 2023. Qwen open-models have consistently topped the Hugging Face Open LLM Leaderboards, with performances matching that of leading global AI models across various benchmarks.

As of now, more than 100,000 derivative models based on the Qwen family of models have been developed on Hugging Face, making it one of the largest AI model families worldwide.

อาลีบาบา คลาวด์ เปิดโอเพ่นซอร์ส โมเดล AI สำหรับการสร้างวิดีโอ

Alibaba Cloud Launches Carbon Management Solution

อาลีบาบา คลาวด์ เปิดโอเพ่นซอร์ส โมเดล AI สำหรับการสร้างวิดีโอ

อาลีบาบา คลาวด์ ธุรกิจด้านเทคโนโลยีดิจิทัลและหน่วยงานหลักด้านอินเทลลิเจนซ์ของอาลีบาบา กรุ๊ป เปิดให้ใช้งานโมเดล AI สำหรับการสร้างวิดีโอโดยไม่มีค่าใช้จ่าย นับเป็นหนึ่งในความมุ่งมั่นครั้งล่าสุด ของบริษัทฯ ในการสนับสนุนชุมชนโอเพ่นซอร์ส

โมเดลโอเพ่นซอร์สมีสี่โมเดลที่อยู่ในกลุ่ม Wan2.1 series ประกอบด้วยเวอร์ชันขนาด 14-พันล้านพารามิเตอร์ และ 1.3-พันล้านพารามิเตอร์ ทั้งนี้ Wan2.1 series เป็นรุ่นล่าสุดของ Tongyi Wanxiang (Wan) ซึ่งเป็นโมเดลวิดีโอพื้นฐานของบริษัทฯ

โมเดลทั้ง 4 ประกอบด้วย T2V-14B, T2V-1.3B, I2V-14B-720P และ I2V-14B-480P ออกแบบมาเพื่อสร้างภาพและวิดีโอคุณภาพสูงจากการอินพุทข้อความและรูปภาพ เปิดให้ดาวน์โหลดได้บน Model Scope ซึ่งเป็นชุมชนด้านโมเดล AI ของอาลีบาบา คลาวด์ และบนแพลตฟอร์ม Hugging Face ซึ่งเป็นแพลตฟอร์มการทำงานด้าน AI ที่เปิดให้นักวิชาการ นักวิจัย และสถาบันเชิงพาณิชย์ทั่วโลกทำงานร่วมกัน ทั้งนี้ภายในสัปดาห์แรกที่เปิดตัว โมเดล Wan2.1 ทั้งสี่รุ่น มียอดดาวน์โหลดรวมบน ModelScope และ Hugging Face ทะลุเกิน 1 ล้านครั้งแล้ว

Wan2.1 เป็นโมเดลสร้างวิดีโอรุ่นแรกที่รองรับการปรับเปลี่ยนข้อความทั้งภาษาจีนและภาษาอังกฤษที่เปิดตัวเมื่อต้นปี 2568 มีความสามารถเป็นเลิศในการสร้างภาพที่สมจริง โดยสามารถจัดการการเคลื่อนไหวที่ซับซ้อนได้อย่างแม่นยำ เพิ่มคุณภาพพิกเซล ดำเนินการตามหลักการทางกายภาพ และปรับความแม่นยำของการทำตามคำสั่งให้เหมาะสม ความแม่นยำในการทำตามคำสั่งต่าง ๆ ทำให้ Wan2.1 ก้าวขึ้นไปอยู่ในลำดับต้น ๆ ของ VBench leaderboard ซึ่งเป็นชุดเกณฑ์มาตรฐานด้านโมเดลการสร้างวิดีโอที่ครอบคลุม

คะแนนรวมของ Wan2.1 บน VBench อยู่ที่ 86.22% เป็นผู้นำในมิติสำคัญต่าง ๆ เช่น ระดับความเคลื่อนไหว ความสัมพันธ์เชิงพื้นที่ ความถูกต้องของสี และการจัดความสัมพันธ์ของอ็อบเจกต์หลายรายการ

การเทรนโมเดลพื้นฐานที่ใช้สร้างวิดีโอต่าง ๆ ต้องใช้ทรัพยากรการประมวลผลจำนวนมหาศาล และต้องมีข้อมูลที่จะใช้เทรนที่มีคุณภาพสูงจำนวนมาก การเปิดให้เข้าใช้งานได้โดยไม่มีค่าใช้จ่ายช่วยลดอุปสรรค และทำให้ธุรกิจต่าง ๆ ใช้ประโยชน์จาก AI ได้มากขึ้น สามารถสร้างภาพที่มีคุณภาพสูงและปรับให้ตรงกับความต้องการของตนได้ด้วยค่าใช้จ่ายที่เหมาะสม

โมเดล T2V-14B เหมาะกับการสร้างภาพคุณภาพสูงที่มีไดนามิกของการเคลื่อนไหวสูง ในขณะที่โมเดล T2V-1.3B มีความสมดุลระหว่างคุณภาพในการสร้างภาพและพลังการประมวลผล จึงเหมาะสำหรับนักพัฒนาในวงกว้างที่ทำการพัฒนาต่อยอดจากของเดิม (secondary development) และการวิจัยทางวิชาการ เช่น โมเดล T2V-1.3B ช่วยให้ผู้ใช้งานใช้แล็ปท็อปส่วนตัวสร้างวิดีโอความยาว 5 วินาที ด้วยความละเอียดที่ 489p ได้ในเวลาเพียงประมาณ 4 นาที

นอกจากรองรับการแปลงข้อความเป็นวิดีโอแล้ว โมเดล I2V-14B-720P และ I2V-14B-480P ยังสามารถแปลงภาพเป็นวิดีโอได้ด้วย โดยผู้ใช้เพียงอินพุตภาพหนึ่งภาพพร้อมคำอธิบายเป็นข้อความสั้น ๆ เพื่อสร้างเนื้อหาวิดีโอเคลื่อนไหวได้ แพลตฟอร์มนี้รองรับการอินพุตภาพขนาดปกติได้ทุกมิติ

อาลีบาบา คลาวด์ เป็นหนึ่งในบริษัทด้านเทคโนโลยีรายใหญ่ของโลกรายแรก ๆ ที่เปิดโอเพ่นซอร์สโมเดล AI ขนาดใหญ่ที่บริษัทฯ พัฒนาขึ้นเอง โดยเปิดโอเพ่นโมเดล Qwen (Qwen-7B) เป็นครั้งแรกในเดือนสิงหาคม 2566 ทั้งนี้ Hugging Face Open LLM Leaderboards จัดให้โมเดลแบบเปิดของ Qwen อยู่ในอันดับสูงในเกณฑ์มาตรฐานการวัดประสิทธิภาพด้านต่าง ๆ มาโดยตลอด ด้วยประสิทธิภาพที่เทียบเท่ากับโมเดล AI ชั้นนำของโลก

ปัจจุบัน มีการพัฒนาโมเดลอนุพันธ์มากกว่า 100,000 รายการจากโมเดลในตระกูล Qwen บน Hugging Face ทำให้ Qwen เป็นหนึ่งในตระกูลโมเดล AI ที่ใหญ่ที่สุดในโลก