อาลีบาบา คลาวด์ ผสานพลัง ดีป้า เปิดตัวโครงการ “Eye for Thailand” เพิ่มขีดความสามารถในการใช้ AI สร้างสรรค์ดิจิทัล

อาลีบาบา คลาวด์ ผสานพลัง ดีป้า เปิดตัวโครงการ “Eye for Thailand” เพิ่มขีดความสามารถในการใช้ AI สร้างสรรค์ดิจิทัล

อาลีบาบา คลาวด์ ผสานพลัง ดีป้า เปิดตัวโครงการ “Eye for Thailand” เพิ่มขีดความสามารถในการใช้ AI สร้างสรรค์ดิจิทัล

  • ผู้เข้าร่วมการแข่งขันนำ 1 ซึ่งเป็นโมเดลสร้างวิดีโอรุ่นล่าสุดของอาลีบาบา ไปใช้สร้างวิดีโอสั้นที่มี AI เป็นตัวเสริมพลัง เป็นการผสมผสาน AI และความคิดสร้างสรรค์เข้าด้วยกัน
  • อาลีบาบา คลาวด์ และ ดีป้า ลงนามบันทึกความเข้าใจ (MoU) ร่วมขับเคลื่อนการฝึกอบรมผู้มีความสามารถด้านดิจิทัล ผ่านอีเลิร์นนิง การฝึกงาน และการสนับสนุนสตาร์ทอัพ

อาลีบาบา คลาวด์ ธุรกิจด้านเทคโนโลยีดิจิทัล และหน่วยงานหลักด้านอินเทลลิเจนซ์ของอาลีบาบา กรุ๊ป และ สำนักงานส่งเสริมเศรษฐกิจดิจิทัล (ดีป้า: depa) เปิดตัวโครงการ “Eye for Thailand” ซึ่งเป็นโครงการการแข่งขันที่ขับเคลื่อนด้วย AI และเปิดให้แข่งขันได้ทั่วประเทศ โครงการนี้ออกแบบมาเพื่อให้ผู้เข้าแข่งขันได้แสดงศักยภาพในการใช้ AI สร้างสรรค์เนื้อหาวิดีโอ โครงการนี้เปิดตัวในงาน “AI for Thailand” ที่จัดโดยอาลีบาบา คลาวด์ ในกรุงเทพฯ นับเป็นความร่วมมือครั้งล่าสุดขององค์กรทั้งสองแห่งที่มีวัตถุประสงค์เพื่อขับเคลื่อนนวัตกรรมและการพัฒนาผู้มีความสามารถด้านดิจิทัลในประเทศไทย ทั้งยังได้รับการสนับสนุนจากสมาคมโปรแกรมเมอร์ไทย และ ทรู ไอดีซี ซึ่งได้นำความเชี่ยวชาญและเครือข่ายเข้ามาช่วยเสริมศักยภาพโครงการ

การแข่งขันนี้ เป็นการเชิญชวนให้นักพัฒนาซอฟต์แวร์ นักการตลาด นักออกแบบ นักศึกษา และองค์กรทั่วประเทศไทย นำ Wan2.1 series ซึ่งเป็นโมเดลสำหรับการสร้างวิดีโอรุ่นล่าสุดของอาลีบาบาและเป็นโมเดลรุ่นล่าสุดของ Tongyi Wanxiang (Wan) ซึ่งเป็นโมเดลพื้นฐานด้านวิดีโอของบริษัทฯ ไปใช้สร้างวิดีโอสั้นที่น่าสนใจและสร้างสรรค์ ผู้เข้าร่วมแข่งขันจะได้รับธีมหนึ่งธีมที่พัฒนาร่วมกันโดยอาลีบาบา คลาวด์ และ ดีป้า และนำธีมนั้นไปคิดสร้างสรรค์โครงการวิดีโอของตน

การแข่งขันนี้มีเป้าหมายเพื่อเชื่อมประสาน AI และความคิดสร้างสรรค์เข้าด้วยกัน ส่งเสริมให้ผู้เข้าร่วมขับเคลื่อนนวัตกรรมในอุตสาหกรรมโฆษณาดิจิทัลในประเทศไทย และขยายโอกาสทางวิชาชีพและวิชาการไปพร้อม ๆ กัน ผู้เข้าร่วมจะมีโอกาสสร้างวิดีโอที่ขับเคลื่อนด้วย AI จัดแสดงผลงานบนเวทีระดับโลก แข่งขันชิงรางวัล ได้สัมผัสกับสถานการณ์การใช้งานจริง รวมถึงได้รับการยอมรับจากผู้เชี่ยวชาญด้าน AI ด้านการตลาดและธุรกิจ

ดร.วาริน รัชนานุสรณ์ ผู้อำนวยการสถาบันส่งเสริมวิสาหกิจดิจิทัลเริ่มต้น สำนักงานส่งเสริมเศรษฐกิจดิจิทัล หรือ ดีป้า กล่าวว่า โครงการ “Eye for Thailand” เป็นโครงการริเริ่มที่มุ่งสร้างการเปลี่ยนแปลงผ่านการให้ความสำคัญกับพลังของแอปพลิเคชัน AI และนวัตกรรมต่าง ๆ ที่สามารถปลดล็อกศักยภาพด้านความคิดสร้างสรรค์ได้ โดยเทคโนโลยีการสร้างวิดีโอขั้นสูงด้วย AI ของอาลีบาบา คลาวด์ ช่วยให้เราเสริมศักยภาพให้กับผู้เข้าร่วมแข่งขันให้สามารถค้นพบมุมมองใหม่ ๆ ในการเล่าเรื่องผ่านดิจิทัล และติดอาวุธให้พวกเขาด้วยทักษะที่พร้อมรองรับอนาคตไปพร้อม ๆ กัน ในฐานะหนึ่งในหน่วยงานหลักในการขับเคลื่อนการเปลี่ยนผ่านสู่ดิจิทัลของประเทศไทย ดีป้า ให้ความสำคัญกับการพัฒนาผู้มีความสามารถ นวัตกรรม และการสร้างโอกาสต่าง ๆ ในเศรษฐกิจดิจิทัล ซึ่งโครงการดังกล่าวสอดคล้องกับความมุ่งมั่นของเราในการสร้างผู้มีความสามารถด้านดิจิทัล อีกทั้งส่งเสริมนักนวัตกรรมรุ่นใหม่ที่จะยกระดับประเทศไทยในด้านความเป็นผู้นำด้าน AI และเศรษฐกิจดิจิทัลระดับโลก

นายฌอน หยวน รองประธานฝ่ายธุรกิจระหว่างประเทศ และผู้จัดการทั่วไปประจำประเทศไทย อินโดนีเซีย ญี่ปุ่น ฟิลิปปินส์ และภูมิภาคแปซิฟิกใต้ ของอาลีบาบา คลาวด์ อินเทลลิเจนซ์ กล่าวว่า “โครงการนี้สะท้อนคำมั่นของเราที่มุ่งเสริมแกร่งให้กับเศรษฐกิจดิจิทัลของไทย ด้วยเทคโนโลยี AI และคลาวด์ที่มีประสิทธิภาพล้ำสมัย เรามุ่งมั่นสร้างแรงบันดาลใจให้กับผู้มีความสามารถด้านดิจิทัลรุ่นใหม่ ๆ และขับเคลื่อนการเติบโตที่พร้อมรับการเปลี่ยนแปลงในภูมิภาคนี้ ด้วยการผสานรวมความคิดสร้างสรรค์และนวัตกรรมไว้ด้วยกัน”

คณะกรรมการซึ่งประกอบด้วยตัวแทนจากอาลีบาบา คลาวด์ ดีป้า และผู้เชี่ยวชาญในอุตสาหกรรมจะประเมินผลงานที่ส่งเข้าประกวดโดยพิจารณาจากเกณฑ์ต่าง ๆ เช่น ความคิดสร้างสรรค์ การใช้ AI การเล่าเรื่อง และความเชื่อมโยงกับแบรนด์ คะแนนสุดท้าย (final scores) จะพิจารณาจากคะแนนโหวตสาธารณะและการประเมินของคณะกรรมการผู้เชี่ยวชาญ การแข่งขันเริ่มต้นด้วยกิจกรรมเปิดตัวในวันที่ 9 พฤษภาคม 2568 โดยผู้เข้าร่วมสามารถส่งผลงานได้ตั้งแต่วันที่ 10 พฤษภาคม ถึง 2 มิถุนายน การตัดสินจะจัดในช่วงต้นเดือนมิถุนายน โดยจะประกาศรายชื่อผู้เข้ารอบ 10 คนสุดท้ายในวันที่ 11 มิถุนายน และเปิดให้โหวตสาธารณะระหว่างวันที่ 11 ถึง 19 มิถุนายน ตามด้วยวัน Demo Day ซึ่งเป็นวันประกาศชื่อผู้ชนะ

Wan2.1 series เปิดตัวไปเมื่อช่วงต้นปีนี้ เป็นโมเดลการสร้างวิดีโอรุ่นแรกที่รองรับข้อความทั้งภาษาอังกฤษและภาษาจีน ที่ติดอันดับต้น ๆ ของ VBench leaderboard ซึ่งเป็นชุดเกณฑ์มาตรฐานที่ครอบคลุมสำหรับโมเดลการสร้างวิดีโอ

บุกเบิกโครงการพัฒนาบุคลากรด้านดิจิทัลในประเทศไทย

โครงการ “Eye for Thailand” ต่อยอดจากการลงนามบันทึกความเข้าใจ (MoU) ระหว่างอาลีบาบา คลาวด์ และ ดีป้า ก่อนหน้านี้ ซึ่งเป็นการสร้างความร่วมมือเชิงกลยุทธ์ในการพัฒนาผู้มีความสามารถด้านดิจิทัลในประเทศไทย ทั้งนี้ ผลลัพธ์สำคัญประการหนึ่งของความร่วมมือในครั้งนั้น คือ การเปิดตัวพอร์ทัลอีเลิร์นนิ่งที่เปิดให้ทุกคนเข้าถึงได้เป็นสาธารณะ ออกแบบมาเพื่อนำเสนอการสอนหลักสูตรคลาวด์คอมพิวติ้งของอาลีบาบา คลาวด์ เป็นภาษาไทย เป็นครั้งแรก

ภายใต้ข้อตกลงนี้ โปรแกรมการฝึกอบรมของอาลีบาบา คลาวด์ จะได้รับการขึ้นทะเบียนอย่างเป็นทางการกับดีป้า และผลิตภัณฑ์คลาวด์ต่าง ๆ ของบริษัทฯ จะได้รับการบรรจุไว้ใน Thai Digital Catalog ซึ่งเป็นแพลตฟอร์มกลางของผลิตภัณฑ์และบริการดิจิทัลที่ได้รับการอนุมัติจากรัฐบาล การได้รับความไว้วางใจนี้ เป็นการปูทางให้กับการนำเทคโนโลยีคลาวด์ประสิทธิภาพสูงไปใช้ในวงกว้าง ทั้งในภาครัฐและภาคเอกชนของไทย นอกจากนี้ อาลีบาบา คลาวด์ จะร่วมมือกับดีป้า ส่งเสริมทักษะดิจิทัลในภูมิภาคต่าง ๆ มอบโอกาสการฝึกงานให้กับนักศึกษา และสนับสนุนโครงการสตาร์ทอัพในท้องถิ่นอีกด้วย

Alibaba Taps AI to Advance Social Good

Alibaba Taps AI to Advance Social Good

Alibaba Taps AI to Advance Social Good

From the weather forecast, healthcare, agriculture, and science discovery to education, Alibaba’s AI Innovations aim to bring positive impacts

Artificial intelligence (AI) continues to stand at the forefront of innovation, driving scientific breakthroughs that bring transformative changes to both society and the environment. As we enter 2025, the urgency to address global challenges has reached an unprecedented level. From rising climate threats and widening social inequalities to healthcare demands and food security concerns, we are facing mounting challenges that require innovative, scalable solutions.

AI, with its ability to analyze vast amounts of data and optimize processes, is uniquely positioned to tackle these pressing issues and create lasting benefits for the society. Over the past year, AI’s potential to tackle global challenges has become increasingly promising as well, from revolutionizing healthcare and agriculture to advancing renewable energy and education. Alibaba Cloud, as a global technology leader, remains steadfast in its commitment to leveraging AI for social good, pushing the boundaries of what is possible to address some of humanity’s most pressing needs.

“Our mission at Alibaba is not only to explore the frontiers of AI but to ensure its capabilities are harnessed for the greater good. As we navigate the complex challenges of 2025, from intensifying climate risks to the growing demand for equitable access to healthcare and education, we are dedicated to leveraging AI to drive meaningful societal changes. By setting a benchmark for how AI can be a transformative force for positive change, we hope to work with different parties to create a more sustainable, accessible, and inclusive future, ” said Jingren Zhou, Chief Technology Officer of Alibaba Cloud.

Here is a recap of some of Alibaba’s key AI-driven initiatives aimed at advancing social good:

  1. Enhancing Weather Forecasting and Optimizing Energy Production

Recent extreme weather conditions, including devastating floods in Spain, landslides in Nepal, and tropical storms affecting millions in the Philippines, underscore the existential threat posed by climate change. In response, Alibaba developed Baguan, an advanced AI-powered weather forecasting model designed to deliver accurate predictions.

Baguan offers hourly updates with a high spatial resolution of one-kilometer grids, enabling industries to prepare for unpredictable weather conditions for 10 days in advance. Its precision has far-reaching applications, particularly in renewable energy, where accurate weather forecasts are critical for optimizing energy production and improving power grid management. By contributing to stable and efficient energy distribution, the AI weather forecasting model aims to help mitigate environmental impacts and reduce costs.

  1. Making Cancer Diagnosis Faster and More Cost-Effective

Alibaba received recognition this year on Fortune’s Change the World list for its groundbreaking AI tool, PANDA, which revolutionizes cancer diagnosis. PANDA is designed to detect early signs of pancreatic ductal adenocarcinoma —a deadly cancer responsible for nearly half a million deaths annually – faster and more cost-effective, making cancer screening more accessible.

Deployed in two hospitals in Zhejiang province, PANDA has demonstrated remarkable sensitivity, identifying abnormalities with 34.1% greater accuracy than radiologists. Since its launch in 2023, PANDA’s applications have expanded to detect other cancers, including liver, esophageal, and colon tumors. This innovation reduces diagnostic costs and accelerates early detection, underscoring the potential of AI in advancing medical diagnosis.

  1. Uncovering Resources for Smart Crop Breeding

In collaboration with Zhejiang University and the Chinese Academy of Agricultural Sciences (CAAS), Alibaba has pioneered research that utilizes AI to accelerate crop improvement. Published in Cell Research, a prestigious journal under the Nature portfolio, the study highlights how DNA methylation data can improve crop breeding techniques.

By analyzing high-quality methylomes, transcriptomes, and genomes from crop fibers, the study uncovered over 287 million single methylation polymorphisms (SMPs) – the largest dataset of its kind. Additionally, researchers identified 43 genes related to fiber development, providing invaluable resources for future breeding initiatives. This breakthrough paves the way for smarter, more sustainable agricultural practices.

  1. Sparking Breakthrough in RNA Virus Discovery

With Sun Yat-sen University and The University of Sydney, Alibaba Cloud co-authored a groundbreaking study published in Cell. The research introduced LucaProt, an AI-powered deep-learning algorithm designed to detect RNA viruses, which are responsible for numerous diseases and pose significant public health challenges.

By analyzing protein sequences and structural features, LucaProt facilitated the discovery of 160,000 potential RNA virus species and 180 RNA virus supergroups – the largest virus discovery dataset ever published. This advancement not only deepens our understanding of viral evolution but also equips healthcare professionals with a powerful tool for combating infectious diseases.

  1. Creating Personalized Picture Books for Children with Autism

Alibaba has developed an AI-powered tool to create personalized picture books for children with autism spectrum disorder (ASD), offering them a creative platform to express themselves and interact with the world. According to the World Health Organization, ASD affects approximately one in 100 children globally, making innovative educational resources critical.

Harnessing the multimodal capabilities of LLMs developed by Alibaba Cloud, the AI transforms one-sentence plot summaries into engaging picture books with vivid graphics, audio narration, and accompanying text. In addition, Alibaba Cloud leveraged its multi-agent framework ModelScope Agent to orchestrate these LLMs and AI tools to perform tasks autonomously with minimal human intervention. Since its launch in June, the tool has been used for nearly 200,000 times, empowering tens of thousands of families and educators in China to create tailored learning materials for children with special needs.

อาลีบาบา ใช้ AI รับมือความท้าทายใหญ่ ๆ ของโลก และสร้างสังคมคุณภาพ

Alibaba Taps AI to Advance Social Good

อาลีบาบา ใช้ AI รับมือความท้าทายใหญ่ ๆ ของโลก และสร้างสังคมคุณภาพ

นวัตกรรมด้าน AI ของอาลีบาบา มุ่งสร้างผลเชิงบวก ให้กับภาคส่วนต่าง ๆ ไม่ว่าจะเป็นด้านการพยากรณ์อากาศ การดูแลสุขภาพ การเกษตร การค้นพบทางวิทยาศาสตร์ การศึกษา ฯลฯ

ปัญญาประดิษฐ์ (AI) ยืนหยัดเป็นนวัตกรรมโดดเด่นอย่างต่อเนื่อง เป็นเทคโนโลยีที่ขับเคลื่อนความก้าวหน้าทางวิทยาศาสตร์ ที่ส่งผลให้เกิดการเปลี่ยนแปลงเชิงปฏิรูปทั้งต่อสังคมและสิ่งแวดล้อม ความเร่งด่วนในการแก้ปัญหาความท้าทายต่าง ๆ ของโลกที่เราทุกคนต้องเผชิญในปีนี้มีมากขึ้นเป็นประวัติการณ์ ไม่ว่าจะเป็นภัยคุกคามจากสภาพภูมิอากาศและความเหลื่อมล้ำทางสังคมที่ขยายวงกว้างมากขึ้น ไปจนถึงความต้องการด้านการดูแลสุขภาพ และข้อกังวลเรื่องความมั่นคงทางอาหาร อย่างไรก็ตาม เทคโนโลยีและโซลูชันที่เป็นนวัตกรรมและปรับขนาดได้ สามารถแก้ไขความท้าทายเหล่านี้ได้

AI มีความสามารถโดดเด่นโดยเฉพาะความสามารถในการวิเคราะห์ข้อมูลมหาศาลและการปรับกระบวนการต่าง ๆ ให้เหมาะสม จึงเป็นเครื่องมือที่สามารถจัดการกับปัญหาเร่งด่วนเหล่านี้และสร้างประโยชน์ที่ยั่งยืนให้สังคมได้ ตลอดปีที่ผ่านมามีการใช้ศักยภาพของ AI รับมือกับความท้าทายต่าง ๆ ของโลก ไม่ว่าจะเป็นการปฏิวัติด้านการดูแลสุขภาพและการเกษตร ตลอดถึงการพัฒนาพลังงานหมุนเวียนและการพัฒนาภาคการศึกษา อาลีบาบา คลาวด์ ในฐานะผู้นำทางเทคโนโลยีระดับโลก มุ่งมั่นอย่างแน่วแน่ในการใช้ AI เพื่อประโยชน์ต่อสังคมและรับมือกับความท้าทายใหญ่ ๆ ระดับโลก (AI for social good) พร้อมส่งเสริมแนวทางที่จะตอบสนองความต้องการเร่งด่วนที่สุดของมนุษยชาติให้ได้ในวงกว้างมากขึ้น

นายจิงเหริน โซว ประธานเจ้าหน้าที่ฝ่ายเทคโนโลยีของอาลีบาบา คลาวด์ กล่าวว่า “ภารกิจของอาลีบาบา คลาวด์ ไม่เพียงแต่ค้นหาว่าจะใช้ AI กับแง่มุมใดได้บ้างเท่านั้น แต่เรายังมีภารกิจที่ต้องทำให้แน่ใจว่าจะมีการนำศักยภาพของ AI ไปใช้เพื่อประโยชน์ที่ดียิ่งขึ้น อาลีบาบา คลาวด์ มุ่งมั่นนำประโยชน์จาก AI ไปใช้ขับเคลื่อนการเปลี่ยนแปลงทางสังคมที่ส่งผลกระทบเชิงบวกอย่างมีนัยสำคัญ เพื่อหาวิธีจัดการกับความท้าทายที่ซับซ้อนของปี 2568 ไม่ว่าจะเป็นความเสี่ยงด้านสภาพภูมิอากาศ ไปจนถึงความต้องการเข้าถึงการดูแลสุขภาพและการศึกษาอย่างเท่าเทียมกันที่เพิ่มขึ้น เราหวังว่าจะได้ทำงานร่วมกับภาคส่วนต่าง ๆ เพื่อสร้างอนาคตที่ยั่งยืน เข้าถึงได้ และเท่าเทียมกันมากขึ้น ด้วยการกำหนดเกณฑ์มาตรฐานให้กับแนวทางการใช้ AI เป็นพลังขับเคลื่อนการเปลี่ยนแปลงเชิงบวก”

โครงการสำคัญบางส่วนของอาลีบาบา ที่ขับเคลื่อนด้วย AI และมีเป้าหมายเพื่อประโยชน์ส่วนรวม

  1. เพิ่มประสิทธิภาพการพยากรณ์อากาศและการผลิตพลังงาน

สภาพอากาศรุนแรงสุดขั้วในช่วงที่ผ่านมา รวมถึงน้ำท่วมครั้งใหญ่ในสเปน ดินถล่มในเนปาล และพายุโซนร้อนที่ส่งผลกระทบต่อชาวฟิลิปปินส์หลายล้านคน ตอกย้ำว่าภัยคุกคามที่เกิดขึ้นนั้นเกิดจากสภาพภูมิอากาศ อาลีบาบา พัฒนาโมเดลชื่อปากวน (Baguan) เพื่อตอบสนองต่อสถานการณ์ดังกล่าว ปากวนเป็นโมเดลพยากรณ์อากาศที่ขับเคลื่อนด้วย AI ที่ทันสมัย และมีการคาดการณ์ที่แม่นยำ

ปากวนอัปเดตข้อมูลเป็นรายชั่วโมง ด้วยความละเอียดเชิงพื้นที่สูงในระดับหนึ่งกิโลเมตรกริด และสามารถคาดการณ์ล่วงหน้าได้ 10 วัน ช่วยให้ธุรกิจทุกอุตสาหกรรมพร้อมรับมือสภาพอากาศที่ไม่สามารถคาดเดาได้ มีการนำความแม่นยำของปากวนไปใช้ในวงกว้าง โดยเฉพาะด้านพลังงานหมุนเวียนที่ต้องการการพยากรณ์อากาศที่แม่นยำซึ่งมีผลต่อประสิทธิภาพการผลิตพลังงานและการบริหารจัดการโครงข่ายไฟฟ้า โมเดลนี้มีส่วนช่วยให้การกระจายพลังงานมีเสถียรภาพและมีประสิทธิภาพ เพื่อเป้าหมายในการลดผลกระทบต่อสิ่งแวดล้อมและลดค่าใช้จ่าย

  1. วินิจฉัยโรคมะเร็งได้เร็วและคุ้มค่าใช้จ่ายมากขึ้น

PANDA เครื่องมือ AI ล้ำสมัยที่ปฏิวัติการวินิจฉัยโรงมะเร็งของอาลีบาบา ได้รับการจัดให้อยู่ในลิสต์ Fortune’s Change the World ทั้งนี้ PANDA ได้รับการออกแบบมาเพื่อตรวจจับสัญญาณเริ่มต้นของมะเร็งท่อน้ำดีในตับอ่อน ซึ่งเป็นมะเร็งที่ทำให้มีผู้เสียชีวิตเกือบครึ่งล้านรายต่อปีได้อย่างรวดเร็วและมีประสิทธิภาพ ช่วยให้สามารถตรวจคัดกรองมะเร็งได้ทั่วถึงมากขึ้น

โรงพยาบาลสองแห่งในมณฑลเจ้อเจียงใช้ PANDA และพบว่าเครื่องมือนี้มีความไวอันน่าทึ่ง และยังสามารถระบุความผิดปกติได้แม่นยำกว่านักรังสีวิทยาถึง 34.1% ทั้งนี้ ตั้งแต่เปิดตัวเมื่อปี 2566 มีการขยายการใช้งาน PANDA ไปใช้ตรวจหามะเร็งอื่น ๆ รวมถึงเนื้องอกในตับ หลอดอาหาร และลำไส้ใหญ่ นวัตกรรมนี้ช่วยลดค่าใช้จ่ายในการตรวจวินิจฉัย และช่วยให้ตรวจพบแต่เนิ่น ๆ นับเป็นการย้ำให้เห็นถึงศักยภาพของ AI ที่ช่วยยกระดับความก้าวหน้าในการวินิจฉัยทางการแพทย์

  1. การเปิดเผยแหล่งข้อมูลสำหรับการปรับปรุงพันธุ์พืชอัจฉริยะ

อาลีบาบา ร่วมมือกับมหาวิทยาลัยเจ้อเจียง และ สถาบันวิทยาศาสตร์การเกษตรของจีน (Chinese Academy of Agricultural Sciences: CAAS) บุกเบิกการวิจัยที่ใช้ AI เร่งการปรับปรุงพืชผล การศึกษานี้ตีพิมพ์ใน Cell Research ซึ่งเป็นวารสารที่มีชื่อเสียงฉบับหนึ่งในจำนวนผลงานของ Nature โดยย้ำให้เห็นวิธีการว่า DNA methylation data ช่วยปรับปรุงเทคนิคการปลูกพืชได้อย่างไร

จากการวิเคราะห์ methylomes, transcriptomes และ genomes คุณภาพสูงจากเส้นใยพืช รายงานได้ค้นพบ single methylation polymorphisms (SMPs) มากกว่า 287 ล้านชุด ซึ่งเป็นชุดข้อมูลที่ใหญ่ที่สุดในประเภทนี้ นอกจากนี้ นักวิจัยยังได้สามารถระบุยีน 43 รายการที่เกี่ยวข้องกับการพัฒนาเส้นใย ซึ่งเป็นแหล่งข้อมูลที่ล้ำค่าสำหรับโครงการปรับปรุงพันธุ์พืชในอนาคต ความก้าวหน้าครั้งสำคัญนี้เป็นแนวทางให้กับการทำการเกษตรที่ชาญฉลาดและยั่งยืนมากขึ้น

  1. จุดประกายความก้าวหน้าในการค้นพบไวรัส RNA

อาลีบาบา คลาวด์, มหาวิทยาลัยซุนยัดเซ็น และ มหาวิทยาลัยซิดนีย์ ร่วมเขียนงานวิจัยสมัยใหม่ตีพิมพ์ใน Cell การวิจัยได้แนะนำ LucaProt ซึ่งเป็นอัลกอริธึม deep-learning ที่ใช้ AI ออกแบบมาเพื่อตรวจจับไวรัส RNA ซึ่งเป็นต้นเหตุของโรคต่าง  ๆ มากมายและเป็นความท้าทายทางสาธารณสุขที่สำคัญ

ในการวิเคราะห์ลำดับโปรตีนและคุณลักษณะทางโครงสร้าง LucaProt ช่วยให้ค้นพบไวรัส RNA ที่มีศักยภาพ 160,000 ชนิด และกลุ่มซุปเปอร์ไวรัส RNA จำนวน 180 กลุ่ม ซึ่งเป็นชุดข้อมูลการค้นพบไวรัสที่ใหญ่ที่สุดเท่าที่เคยมีการเผยแพร่มา ความก้าวหน้านี้ไม่เพียงช่วยให้เราเข้าใจวิวัฒนาการของไวรัสมากขึ้นเท่านั้น แต่ยังช่วยให้บุคลากรทางการแพทย์มีเครื่องมือทรงประสิทธิภาพที่จะใช้ต่อสู้กับโรคติดเชื้ออีกด้วย

  1. สร้างหนังสือภาพเป็นการเฉพาะให้กับเด็กออทิสติก

อาลีบาบาพัฒนาเครื่องมือที่ใช้ AI เพื่อสร้างหนังสือภาพเฉพาะให้กับเด็กที่เป็นโรคออทิสติก (ASD) โดยมอบแพลตฟอร์มที่สร้างสรรค์ให้เด็กเหล่านั้นใช้เป็นที่แสดงออกและมีปฏิสัมพันธ์กับสังคมโลก ข้อมูลขององค์การอนามัยโลกระบุว่า ASD ส่งผลกระทบต่อเด็กประมาณหนึ่งในร้อยคนทั่วโลก ดังนั้นทรัพยากรทางการศึกษาที่ทันสมัยจึงมีความสำคัญอย่างมาก

ความสามารถหลายรูปแบบของโมเดลด้านภาษาขนาดใหญ่ (LLMs) ที่พัฒนาโดยอาลีบาบา คลาวด์ จะช่วยเปลี่ยนบทสรุปพล็อตประโยคเดียว ให้กลายเป็นหนังสือภาพที่น่าสนใจ พร้อมกราฟิกสดใส เสียงบรรยาย และข้อความประกอบ นอกจากนี้ อาลีบาบา คลาวด์ ยังใช้ ModelScope Agent ซึ่งเป็นเฟรมเวิร์กมัลติ เอเจนต์ของบริษัทฯ ทำงานร่วมกับ LLMs เหล่านี้ และเครื่องมือ AI ต่าง ๆ เพื่อให้เกิดการทำงานโดยอัตโนมัติ โดยมีการแทรกแซงของคนน้อยที่สุด เครื่องมือนี้เปิดตัวเมื่อเดือนมิถุนายน มีการนำไปใช้แล้วเกือบ 200,000 ครั้ง เป็นการเสริมศักยภาพให้นักการศึกษาหลายหมื่นคนในประเทศจีน ให้สามารถสร้างสื่อการเรียนรู้ที่ออกแบบมาสำหรับเด็กที่มีความต้องการพิเศษโดยเฉพาะ

Alibaba Cloud Releases Qwen2.5-Omni-7B: An End-to-end Multimodal AI Model

อาลีบาบา คลาวด์ ปล่อย Qwen2.5-Omni-7B โมเดล Multimodal AI ครบวงจร

Alibaba Cloud Releases Qwen2.5-Omni-7B: An End-to-end Multimodal AI Model

Alibaba Cloud has launched Qwen2.5-Omni-7B, a unified end-to-end multimodal model in the Qwen series. Uniquely designed for comprehensive multimodal perception, it can process diverse inputs, including text, images, audio, and videos, while generating real-time text and natural speech responses. This sets a new standard for optimal deployable multimodal AI for edge devices like mobile phones and laptops.

Despite its compact 7B-parameter design, Qwen2.5-Omni-7B delivers uncompromised performance and powerful multimodal capabilities. This unique combination makes it the perfect foundation for developing agile, cost-effective AI agents that deliver tangible value, especially intelligent voice applications. For example, the model could be leveraged to transform lives by helping visually impaired users navigate environments through real-time audio descriptions, offering step-by-step cooking guidance by analyzing video ingredients, or powering intelligent customer service dialogues that really understand customer needs.

The model is now open-sourced on Hugging Face and GitHub, with additional access via Qwen Chat and Alibaba Cloud’s open-source community ModelScope. Over the past years, Alibaba Cloud has made over 200 generative AI models open-source.

High Performance Driven by Innovative Architecture

Qwen2.5-Omni-7B delivers remarkable performance across all modalities, rivaling specialized single-modality models of comparable size. Notably, it sets a new benchmark in real-time voice interaction, natural and robust speech generation, and end-to-end speech instruction following.

Its efficiency and high performance stem from its innovative architecture, including Thinker-Talker Architecture, which separates text generation (through Thinker) and speech synthesis  (through Talker) to minimize interference among different modalities for high-quality output; TMRoPE (Time-aligned Multimodal RoPE), a position embedding technique to better synchronize the video inputs with audio for coherent content generation; and Block-wise Streaming Processing, which enables low-latency audio responses for seamless voice interactions.

Qwen2.5-Omni-7B was pre-trained on a vast, diverse dataset, including image-text, video-text, video-audio, audio-text, and text data, ensuring robust performance across tasks.

With the innovative architecture and high-quality pre-trained dataset, the model excels in following voice command, achieving performance levels comparable to pure text input. For tasks that involve integrating multiple modalities, such as those evaluated in OmniBench – a benchmark that assesses models’ ability to recognize, interpret, and reason across visual, acoustic, and textual inputs – Qwen2.5-Omni achieves state-of-the-art performance.

Qwen2.5-Omni-7B also demonstrates high performance on robust speech understanding and generation capabilities through in-context learning (ICL). Additionally, after reinforcement learning (RL) optimization, Qwen2.5-Omni-7B showed significant improvements in generation stability, with marked reductions in attention misalignment, pronunciation errors, and inappropriate pauses during speech response.

Alibaba Cloud unveils Qwen2.5 last September and released Qwen2.5-Max in January, which was ranked 7th on Chatbot Arena, matching other top proprietary LLMs and demonstrates exceptional capabilities. Alibaba Cloud also open-sourced Qwen2.5-VL and Qwen2.5-1M for enhanced visual understanding and long context input handling.

อาลีบาบา คลาวด์ ปล่อย Qwen2.5-Omni-7B โมเดล Multimodal AI ครบวงจร

อาลีบาบา คลาวด์ ปล่อย Qwen2.5-Omni-7B โมเดล Multimodal AI ครบวงจร

อาลีบาบา คลาวด์ ปล่อย Qwen2.5-Omni-7B โมเดล Multimodal AI ครบวงจร

 อาลีบาบา คลาวด์ เปิดตัว Qwen2.5-Omni-7B โมเดลมัลติโหมด (multimodal model) ครบวงจรเป็นส่วนหนึ่งใน Qwen series โมเดลนี้ออกแบบมาโดยเน้นความสามารถในการเข้าใจประเภทของข้อมูลได้หลายรูปแบบและครอบคลุม สามารถประมวลผลอินพุตหลากหลาย รวมถึงข้อความ รูปภาพ เสียง และ วิดีโอ สามารถสร้างการตอบสนองด้วยข้อความและคำพูดที่เป็นธรรมชาติได้แบบเรียลไทม์ นับเป็นการตั้งมาตรฐานใหม่ให้กับ multimodal AI ที่สามารถปรับใช้กับอุปกรณ์ปลายทาง (edge devices) เช่น โทรศัพท์มือถือ และแล็ปท็อปได้อย่างเหมาะสม

โมเดลนี้มอบประสิทธิภาพที่ไม่มีแผ่ว และมอบความสามารถแบบมัลติโหมดที่ทรงพลัง แม้ว่าจะมีพารามิเตอร์ขนาดกะทัดรัดเพียง 7B เท่านั้น จึงเป็นการผสมผสานรากฐานที่สมบูรณ์แบบเข้ากับการพัฒนา AI agents ที่คล่องตัวและคุ้มค่า มอบคุณประโยชน์ที่จับต้องได้ โดยเฉพาะกับแอปพลิเคชันเสียงอัจฉริยะต่าง ๆ เช่น โมเดลนี้ช่วยเปลี่ยนให้คุณภาพชีวิตดีขึ้น โดยการช่วยนำทางผู้มีความบกพร่องทางการมองเห็น ผ่านคำอธิบายเสียงเกี่ยวกับสภาพแวดล้อมแบบเรียลไทม์ หรือ ให้คำแนะนำในการทำอาหารทีละขั้นตอนด้วยการวิเคราะห์ส่วนผสมจากวิดีโอ หรือ ขับเคลื่อนให้บริการลูกค้าอัจริยะสามารถใช้บทสนทนาที่เข้าใจความต้องการที่แท้จริงของลูกค้าได้

ปัจจุบันโมเดลนี้เปิดเป็นโอเพ่นซอร์สบน Hugging Face และ GitHub และสามารถเข้าใช้ผ่าน Qwen Chat และ ModelScope ซึ่งเป็นชุมชนโอเพ่นซอร์สของอาลีบาบา คลาวด์ ทั้งนี้ในหลายปีที่ผ่านมา อาลีบาบา คลาวด์ ได้เปิดให้โมเดล generative AI มากกว่า 200 โมเดลเป็นโอเพ่นซอร์ส

นวัตกรรมด้านสถาปัตยกรรม ขับเคลื่อนให้โมเดลมีประสิทธิภาพสูง

Qwen2.5-Omni-7B มอบประสิทธิภาพโดดเด่นให้กับโหมดทุกประเภท ได้ทัดเทียมกับโมเดลเฉพาะแบบโหมดเดียวต่าง ๆ (single-modality models) ที่มีขนาดใกล้เคียงกัน โดยเฉพาะอย่างยิ่ง โมเดลนี้ได้ตั้งมาตรฐานใหม่ด้านการปฏิสัมพันธ์ด้วยเสียงแบบเรียลไทม์ การสร้างเสียงพูดที่เป็นธรรมชาติและชัดเจน และการทำตามคำสั่งเสียงอย่างครบวงจรจากต้นจนจบ

ประสิทธิภาพและสมรรถนะที่สูงของโมเดลนี้มาจากการใช้สถาปัตยกรรมล้ำสมัย ซึ่งรวมถึง Thinker-Talker Architecture ที่แยกการสร้างข้อความ (ด้วย Thinker) และการสังเคราะห์เสียง (ด้วย Talker) ออกจากกัน เพื่อลดสัญญาณรบกวนจากโหมดต่าง ๆ ให้เหลือน้อยที่สุดเพื่อให้ได้เอาต์พุตคุณภาพสูง, TMRoPE (Time-aligned Multimodal RoPE) ซึ่งเป็นเทคนิคการฝังตำแหน่งเพื่อให้ซิงโครไนซ์อินพุตวิดีโอด้วยเสียงเพื่อสร้างเนื้อหาที่สอดคล้องกันได้ดีขึ้น, และ Block-wise Streaming Processing ที่ช่วยให้สามารถตอบสนองเสียงด้วยความรวดเร็วมีความหน่วงต่ำ ส่งผลให้การโต้ตอบด้วยเสียงเป็นไปอย่างราบรื่น

Qwen2.5-Omni-7B ได้รับการเทรนล่วงหน้าด้วยชุดข้อมูลที่หลากหลายและกว้างขวาง ซึ่งรวมถึง การเปลี่ยนภาพเป็นข้อความ, วิดีโอเป็นข้อความ, วิดีโอเป็นเสียง, ตัวอักษรเป็นข้อมูล เพื่อให้มั่นใจได้ว่าโมเดลจะสามารถทำงานได้ทุกแบบด้วยประสิทธิภาพสูง

สถาปัตยกรรมที่ล้ำสมัยและการเทรนล่วงหน้าด้วยชุดข้อมูลคุณภาพสูง ทำให้โมเดลนี้มีความเป็นเลิศด้านการทำตามคำสั่งเสียง และมีประสิทธิภาพเทียบเท่ากับการป้อนเป็นตัวอักษรข้อความล้วน ๆ สำหรับงานที่เกี่ยวข้องกับมัลติโหมด เช่น โมเดลที่ได้รับการประเมินผ่าน OmniBench ซึ่งเป็นเกณฑ์มาตรฐานที่ประเมินความสามารถของโมเดลต่าง ๆ ด้านการจดจำ การตีความ และการให้เหตุผล จากอินพุตที่เป็นภาพ เสียงและข้อความ จึงกล่าวได้ว่า Qwen2.5-Omni มีสมรรถนะล้ำสมัยที่สุดในปัจจุบัน

Qwen2.5-Omni-7B ยังแสดงให้เห็นว่ามีสมรรถนะในการทำความเข้าใจและการสร้างคำพูดที่ดีเยี่ยม และมีความสามารถในการสร้างคำพูดผ่านการเรียนรู้ลงลึกในเชิงบริบท (in-context learning: ICL) นอกจากนี้ หลังจากเสริมประสิทธิภาพด้วยการเรียนรู้แบบเสริมกำลัง (reinforcement learning: RL) หรือการเรียนรู้จากปฏิสัมพันธ์แบบลองผิดลองถูกที่เกิดขึ้นระหว่างทางของการเรียนรู้แล้ว Qwen2.5-Omni-7B ได้แสดงให้เห็นว่ามีความเสถียรในการสร้างคำพูดเพิ่มขึ้นอย่างมาก ลดความคลาดเคลื่อนในการให้ความสนใจ, ลดข้อผิดพลาดในการออกเสียง และลดการสะดุดหยุดลงระหว่างการตอบสนองด้วยคำพูดได้อย่างเห็นได้ชัด

อาลีบาบา คลาวด์ เปิดตัว Qwen2.5 เมื่อเดือนกันยายนปี 2567 และปล่อย Qwen2.5-Max สู่ตลาดในเดือนมกราคมปี 2568 และได้รับการจัดให้อยู่ในอันดับที่ 7 บน Chatbot Arena ซึ่งเทียบชั้นได้กับ LLM ชั้นนำทั้งหลายที่มีกรรมสิทธิ์ และยังแสดงให้เห็นถึงความสามารถที่โดดเด่นด้านต่าง ๆ  อาลีบาบา คลาวด์ยังได้เปิดโอเพ่นซอร์ส Qwen2.5-VL และ Qwen2.5-1M ตอบโจทย์การทำความเข้าใจภาพที่มีประสิทธิภาพมากขึ้น และจัดการกับอินพุตบริบทที่ยาว ๆ ได้ดีขึ้น