ทีม Qwen ของ Alibaba Cloud เปิดโมเดล QvQ-72B-Preview ที่พัฒนาต่อจาก Qwen-VL-72B แต่ฝึกให้คิดเป็นขั้นเป็นตอนเพื่อเพิ่มความแม่นยำมากขึ้น
ผลทดสอบที่ทีม Qwen ใช้ทดสอบมี 4 ชุด ได้แก่ MMMU, MathVista, MathVision, และ OlympiadBench คะแนนที่ได้ขึ้นไปถึงระดับ Claude 3.5 Sonnet เข้าใกล้ OpenAI o1 มากขึ้น โดยพฤติกรรมของโมเดลจะคิดไปเรื่อยๆ และตอบคำถามสุดท้าย
โมเดลเปิดให้ทดสอบผ่าน HuggingFace ไฟล์โมเดลเปิดให้ดาวน์โหลดในไลเซนส์แบบ Qwen License โดยตอนนี้ยังส่งคำสั่งได้รอบเดียว ไม่สามารถคุยต่อเนื่องได้
ที่มา - QwenLM
ทีม Qwen ของ Alibaba Cloud เปิดโตัวโมเดลปัญญาประดิษฐ์ QwQ (อ่านว่า ควิว/quil) เป็นโมเดลเพื่อการทดลองที่จะไม่มุ่งตอบคำถามทันที แต่พยายามคิดทบทวนก่อน ทำให้คำตอบที่ได้แม่นยำขึ้น
ความโดดเด่นของ QwQ-32B คือคะแนนทดสอบหลายชุดทดสอบ เช่น GPQA, AIME, MATH-500, หรือ LiveCodeBench นั้นสูงขึ้นมาก เทียบชั้นกับ OpenAI o1-preview เลยทีเดียว อย่างไรก็ดีทีมงานพบปัญหาการคิดของโมเดลมักสลับภาษาไปมา (ผมทดลองถามภาษาไทยก็คิดเป็นภาษาจีน) บางครั้งคิดวนไปวนมาไม่ได้คำตอบ นอกจากนี้ยังต้องเพิ่มความระมัดระวังความปลอดภัยในการใช้งาน และคะแนนทดสอบก็อาจจะมีข้อจำกัดไม่สามารถทดสอบความสามารถบางด้าน
Alibaba เปิดโมเดล Qwen2.5-Turbo โมเดลปัญญาประดิษฐ์ที่ปรับปรุงขึ้นจากรุ่นโอเพนซอร์ส เน้นขนาดข้อมูลที่รองรับได้ จากเดิม 128,000 โทเค็นเป็น 1 ล้านโทเค็น ทำให้รองรับข้อมูลระดับหนังสือทั้งเล่มได้ คิดเป็นขนาดข้อมูลประมาณ 1 ล้านคำหรืออักษรจีน 1.5 ล้านตัวอักษร
ผลทดสอบของ Qwen2.5-Turbo ค่อนข้างดีมากการถามตอบจากข้อมูลขนาดใหญ่ Passkey Retrieval ได้เต็ม 100 คะแนน ขณะที่ชุดทดสอบ RULER ก็ได้คะแนนสูงกว่า GPT-4 เมื่อใส่ข้อมูลเต็ม 1 ล้านโทเค็นจะเริ่มตอบใน 68 วินาที ราคาต่อ 1 ล้านโทเค็นอยู่ที่ 0.3 หยวน ถูกกว่า GPT-4o-mini อยู่ 4.6 เท่าตัว
Alibaba รายงานผลประกอบการของไตรมาสเดือนกันยายน 2024 รายได้รวมเพิ่มขึ้น 5% จากช่วงเดียวกันในปีก่อนเป็น 236,503 ล้านหยวน กำไรสุทธิอยู่ที่ 43,547 ล้านหยวน เพิ่มขึ้น 63% ซึ่ง Alibaba เป็นผลจากการบันทึกกำไรของการลงทุนในบริษัทอื่นที่เพิ่มขึ้นมาก
กลุ่มอีคอมเมิร์ซในจีน (Taobao และ Tmall) มีรายได้เพิ่มขึ้น 1% เป็น 98,994 ล้านหยวน โดย Alibaba บอกว่ายอดขายสุทธิหรือ GMV ยังคงเติบโตดี และเทศกาล 11.11 ที่ผ่านมาก็ทำสถิติสูงสุดอีกปี ส่วนกลุ่มคลาวด์มีรายได้ 29,610 ล้านหยวน เพิ่มขึ้น 7% โดยบอกว่าบริการที่เกี่ยวกับ AI มีการเติบโตระดับเลขสามหลักต่อเนื่องกันเป็นไตรมาสที่ห้าแล้ว
สถาบัน DAMO ของ Alibaba รายงานความสำเร็จในการพัฒนาโมเดลปัญญาประดิษฐ์ "ปากวน" สำหรับทำนายสภาพอากาศอย่างละเอียดระดับชั่วโมงไปได้ถึงสิบวันข้างหน้า ในแง่พื้นที่สามารถทำนายได้ละเอียด 1 ตารางกิโลเมตร
ทีมงานอาศัยชุดข้อมูล ERA5 ที่เก็บบันทึกสภาพอากาศตั้งแต่ปี 1979 ร่วมกับข้อมูลท้องถิ่น เช่น อุณหภูมิ, แรงลม, และระดับแสงแดด
ทาง Aliababa นำ Baguan ไปสาธิตในการจัดการพลังงาน โดยโมเดลสามารถทำนายเหตุการณ์อุณหภูมิลดลงอย่างรวดเร็วในจีนได้อย่างแม่นยำ ทำให้การไฟฟ้าสามารถทำนายได้ว่าการใช้พลังงานจะลดลงอย่างรวดเร็วเหมือนกัน โดยรวมการใช้สภาพอากาศเข้ามาร่วมทำให้สามารถทำนายความต้องการไฟฟ้าได้แม่นยำ 98.1%
ทีมวิจัย Qwen ของ Aliababa เปิดตัวโมเดล Qwen2.5-Coder โมเดล LLM ช่วยเขียนโค้ดที่ปรับปรุงกระบวนการฝึกจนได้ประสิทธิภาพสูงสุดในหมู่โมเดลโอเพนซอร์ส คะแนนทดสอบรวมพอๆ กับ GPT-4o ในการทดสอบหลายตัว
กระบวนการฝึก Qwen2.5-Coder นั้นอาศัยการฝึกเป็นขั้น เริ่มตั้งแต่การฝึกโค้ดแบบไฟล์เดี่ยว (file-level pretrain) แล้วขยับมาเป็นการฝึกแบบหลายไฟล์ (repo-level pretrain) สุดท้ายจึงฝึกการเขียนโค้ดตามคำสั่ง โดยอาศัยชุดข้อมูลโค้ดที่พบในอินเทอร์เน็ต นำมาสร้างคำสั่งเพื่อให้ได้โค้ดนั้น แล้วจึงนำชุดข้อมูลไปฝึก
จุดเด่นสำคัญของ Qwen2.5-Coder คือมันสามารถสร้างโค้ดได้หลายภาษาในคุณภาพค่อนข้างสูง เนื่องจากทีมงานสร้างชุดข้อมูลภาษาโปรแกรมอื่นๆ ที่มีชุดข้อมูลน้อยเพิ่มเข้ามา
Alibaba Cloud เปิดบริการ LLM ของตัวเองในตระกูล Qwen แต่เป็นเวอร์ชั่นไม่เปิดให้ดาวน์โหลดโมเดล ได้แก่ Qwen-Max, Qwen-Plus, และ Qwen-Turbo โดยชูความสามารถของ Qwen-Max ว่าใกล้เคียง Llama3.1-405B และ GPT-4o แล้ว โดยเอาชนะได้บางขุดทดสอบ เช่น MATH หรือ LiveCodeBenach
ราคาค่าใช้งาน Qwen-Max อยู่ที่ 10 ดอลลาร์ต่อล้านโทเค็นสำหรับอินพุต และ 30 ดอลลาร์ต่อล้านโทเค็นสำหรับเอาท์พุต แพงกว่า GPT-4o ประมาณเท่าตัว
สำหรับโมเดลอื่นๆ ที่เปิดตัวมาพร้อมกัน เช่น Tongyi Wanxiang โมเดลสร้างภาพและวิดีโอจากข้อความ, Qwen2-VL โมเดลที่รับภาพและวิดีโอ, AI Developer ตัวช่วยเขียนโปรแกรม
Alibaba Cloud เปิดตัวโมเดลปัญญาประดิษฐ์ Qwen เวอร์ชั่น 2.5 จุดเด่นของโมเดลเวอร์ชั่นนี้คือฝึกด้วยข้อมูลขนาดถึง 18 ล้านล้านโทเค็น รองรับ 29 ภาษารวมภาษาไทย โดยเปิดให้ใช้งานได้อิสระแทบทุกรุ่น
ตัวโมเดลรองรับอินพุต 128K token และตอบข้อมูลได้ 8K token ยกเว้นรุ่น 3B ลงไปจะรองรับอินพุต 32K token เท่านั้น
รุ่นใหญ่สุด Qwen2.5-72B ได้ผลทดสอบชนะ Llama3.1-70B แทบทุกการทดสอบขึ้นไปใกล้เคียง Llama3.1-405B แต่เวอร์ชั่น 72B แจกแบบ Qwen License ซึ่งจำกัดการใช้งานกับบริการที่ผู้ใช้เกิน 100 ล้านคนต่อเดือน
เมื่อวานนี้เกิดเหตุไฟไหม้ศูนย์ข้อมูล Alibaba Cloud Zone C ในสิงคโปร์ กระทบบริการจำนวนมาก โดยต้นเพลิงเกิดจากแบตเตอรีลิเธียมในศูนย์ข้อมูล
กระบวนการดับเพลิงกินเวลา 4 ชั่วโมง ตั้งแต่ 10:20-14:40 ตามเวลาปักกิ่ง แต่หลังจากควบคุมเพลิงได้แล้วก็ยังมีความร้อนอยู่ ทำให้ทีมงานไม่สามารถเข้าพื้นที่ได้ และอุปกรณ์เน็ตเวิร์คทำงานผิดปกติ ตลอดจนมีน้ำดับเพลิงเข้าไปในห้องเซิร์ฟเวอร์ ทำให้กระบวนการกู้คืนระบบใช้เวลา
ทาง Alibaba Cloud ระบุว่าระบบที่เปิด high availability เอาไว้สามารถย้ายระบบออกไปโดยอัตโนมัติได้ตามที่คาดหวัง เช่น Redis, MongoDB, MySQL แต่บริการที่เปิดใช้แบบ single availability zone เช่น object storage หรือฐานข้อมูลต่างๆ หากอยู่ใน Zone C ก็จะดับไป
Alibaba Cloud ปล่อยโมเดล LLM ตระกูล Qwen 2 รุ่นล่าสุด Qwen2-VL โดย VL ย่อมาจาก Vision Language ที่พัฒนาบนพื้นฐานของ Qwen2
Qwen2-VL มีจุดเด่นคือความสามารถในการทำความเข้าใจรูปภาพ ที่มีความละเอียดและอัตราส่วนภาพหลากหลาย ผลการทดสอบทำงานได้ดีกว่าโมเดลประเภทเดียวกัน ซึ่งสามารถนำไปประยุกต์ใช้ได้กับอุปกรณ์ที่ต้องใช้การทำความเข้าใจภาพที่เห็น เช่น สมาร์ทโฟน, หุุ่นยนต์ หรือระบบอัตโนมัติอื่นที่ต้องอาศัยภาพในการตัดสินใจ
ความสามารถของ Qwen2-VL ยังสามารถสรุปเนื้อหาวิดีโอได้ที่ความยาวถึง 20 นาที โดยสามารถตอบคำถามเนื้อหาจากวิดีโอ หรือสรุปบทสนทนาได้ด้วย ภาษาที่รองรับได้แก่ ภาษาเกือบทั้งหมดที่ใช้ในทวีปยุโรป, ภาษาญี่ปุ่น, ภาษาเกาหลี, ภาษาอาหรับ, ภาษาเวียดนาม และอื่น ๆ
Alibaba Cloud ปล่อยโมเดล LLM แบบโอเพนซอร์สตระกูล Qwen 2 เพิ่มอีกสองรุ่น ได้แก่ Qwen2-Math และ Qwen2-Audio
Qwen2-Math เป็นโมเดลที่ฝึกต่อจก Qwen2 โดยสร้างชุดข้อมูลคุณภาพสูงด้านคณิตศาสตร์เฉพาะ ทั้งหนังสือ, โค้ดต่างๆ, ชุดข้อสอบต่างๆ, จนถึงข้อมูลที่สังเคราะห์ออกมาจาก Qwen2 เอง จุดเด่นของโมเดลนี้คือทำคะแนนทดสอบด้านคณิตศาสตร์ เช่น GSM8K, MATH หรือ MMLU-STEM ได้สูงกว่าโมเดลปิดอย่าง GPT-4o หรือ Gemini เสียอีก
Qwen2-Math ยังใช้งานได้เฉพาะภาษาอังกฤษเท่านั้น และมี 3 ขนาด คือ 1.5B, 7B, 72B เปิดให้ใช้งานแบบสัญญาอนุญาต Apache 2.0 ทีมงานระบุว่าจะเปิดเวอร์ชั่นภาษาจีนเร็วๆ นี้
Alibaba จัดการแข่งขัน Alibaba Global Math Competition การแข่งขันคณิตศาสตร์ที่เริ่มมาตั้งแต่ปี 2018 แต่ปีนี้มีความพิเศษคือเปิดให้ AI เข้ามาแข่งขันด้วย อย่างไรก็ดีทีมที่ใช้ AI ตกรอบทั้งหมดตั้งแต่รอบคัดตัว เหลือผู้เข้าแข่ง 802 คน
คะแนนรอบคัดตัวต้องการคะแนนขั้นต่ำ 45 คะแนน แต่ทีม AI ที่ได้คะแนนสูงสุดได้เพียง 34 คะแนนเท่านั้น และคะแนนเฉลี่ยของ AI อยู่ที่ 18 คะแนนพอๆ กับผู้เข้าแข่งทั่วไป โดยผู้เข้าแข่งที่ทำคะแนนได้ดีที่สุดทำคะแนนได้ถึง 113 คะแน ข้อสอบมีทั้งหมด 7 ข้อ มีทั้งแบบตัวเลือกและแบบแสดงวิธีทำ
ทีมวิจัย Qwen ของ Alibaba Cloud เปิดตัวโมเดล LLM ในชื่อ Qwen2 มี 5 ขนาดให้เลือกตั้งแต่ 0.5B, 1.5B, 7B, 14B, และ 72B โดยชูจุดเด่นรองรับภาษาอื่นๆ นอกจากภาษาอังกฤษ เช่นแถบเอเชียตะวันออกเฉียงใต้นั้นรองรับทั้ง ไทย, เวียดนาม, อินโดนีเซีย, เมียนมาร์, ลาว, กัมพูชา และยังรองรับ context window ถึง 128K
ผลทดสอบยอดนิยมเช่น MMLU หรือ HumanEval นั้น Qwen2-72B ทำได้เหนือกว่า Llama3-70B ไปเล็กน้อย ขณะที่ Qwen2-7B ก็เอาชนะ Llama3-7B ได้หลายชุดทดสอบโดยเฉพาะชุดทดสอบ HumanEval ที่คะแนนนำค่อนข้างมาก
Qwen2 ปล่อยให้ใช้งานแบบ Apache 2.0 ยกเว้นเฉพาะ Qwen2-72B เท่านั้นที่ยังจำกัดการใช้งานแบบ Qianwen License ทำให้โมเดลขนาด 7B สามารถใช้งานได้แทบไม่มีข้อจำกัด
Bloomberg รายงานสงคราม AI ฝั่งจีนที่กำลังร้อนแรงในช่วงสัปดาห์ที่ผ่านมา หลังค่าย Alibaba เปิดสงครามราคา หั่นค่าใช้บริการ AI ของตัวเองที่ชื่อ Qwen (ชื่อเต็มคือ Tongyi Qianwen) ลงมากถึง 97% บีบให้คู่แข่งต้องเล่นสงครามราคาตาม
หลังจากนั้นไม่กี่ชั่วโมง ค่าย Baidu ประกาศว่าบริการ Ernie AI บางโมเดลย่อยเปลี่ยนมาให้บริการฟรี และฝั่งค่าย ByteDance ก็ต้องลดราคาโมเดล Doubao 99% ตามมาด้วยเช่นกัน
เมื่อต้นเดือนนี้ Alibaba เพิ่งออก Qwen เวอร์ชัน 2.5 ที่มีความสามารถมากขึ้น อย่างไรก็ตาม การใช้งานโมเดล AI จากฝั่งจีนยังจำกัดเฉพาะบริษัทจีนซะมาก ตัวอย่างลูกค้าที่ Alibaba นำมาโชว์ยังมีเฉพาะบริษัทจีนด้วยกันเอง เช่น Xiaomi และ Perfect World Games
Alibaba Cloud ประกาศในงานสัมมนาที่ปารีส เปิดพื้นที่ให้บริการเขตเม็กซิโกเป็นครั้งแรก และประกาศขยายศูนย์ข้อมูลเพิ่มใน 4 ประเทศคือ มาเลเซีย ฟิลิปปินส์ เกาหลีใต้ และไทย ในช่วงเวลา 3 ปีข้างหน้า
Alibaba Cloud มีให้บริการ Availability Zone ในประเทศไทยมาตั้งแต่ปี 2022 ประกาศนี้บอกคร่าวๆ เพียงว่าจะขยายศูนย์ข้อมูลเพิ่มเติมอีก แต่ยังไม่ให้รายละเอียดมากไปกว่านี้
ในภูมิภาคเอเชียตะวันออกเฉียงใต้ Alibaba Cloud มีศูนย์ข้อมูลให้บริการใน 5 ประเทศคือ สิงคโปร์ (3 โซน), มาเลเซีย (2 โซน), อินโดนีเซีย (3 โซน), ฟิลิปปินส์ (1 โซน) และไทย (1 โซน) - แผนที่ละเอียด
Alibaba Cloud ประกาศว่า Tongyi Qianwen หรือ Qwen โมเดลปัญญาประดิษฐ์ภาษาขนาดใหญ่หรือ LLM มีหน่วยงานนำไปติดตั้งใช้งานแล้วมากกว่า 90,000 แห่ง สะท้อนความต้องการใช้งานที่เพิ่มต่อเนื่องจาก ทั้งจากกลุ่มอุตสาหกรรมอิเล็กทรอนิกส์, ยานยนต์ จนถึงเกม
โดย Alibaba Cloud ได้อัปเดตโมเดล Qwen นี้ในเวอร์ชันล่าสุด Qwen2.5 โดยมีจุดเด่นคือการให้เหตุผล ประเมินโค้ด และทำความเข้าใจภาษาได้ดีกว่าเวอร์ชันก่อนหน้า Qwen2.0
DAMO Academy โครงการสนับสนุนงานวิจัยและพัฒนาเทคโนโลยีใหม่ของ Alibaba ประกาศบริจาคห้องปฏิบัติการด้านควอนตัม และอุปกรณ์ที่เกี่ยวข้อง ให้กับ Zhejiang University ในเมืองหางโจว โดย Alibaba ยืนยันการบริจาคนี้กับสื่อท้องถิ่น
อย่างไรก็ตามในรายงานนั้นบอกว่าสาเหตุที่ Alibaba บริจาคอุปกรณ์และห้องปฏิบัติการ ก็เพราะบริษัทตัดสินใจลดค่าใช้จ่าย โดยตัดกิจกรรมที่เกี่ยวข้องการงานวิจัยส่วนห้องปฏิบัติการควอนตัมนี้ กระทบกับพนักงานที่ทำงานในห้องปฏิบัติการนี้ประมาณ 30 คน
Alibaba ปรับโครงสร้างฝ่ายบริหารใน Alibaba Cloud ส่วนธุรกิจให้บริการคลาวด์ ที่ก่อนหน้านี้ Alibaba จะแยกธุรกิจออกมาตามแผน แต่ล่าสุดบริษัทรายงานว่าได้เลื่อนแผนไอพีโอธุรกิจคลาวด์นี้ออกไปก่อน
Alibaba Cloud จะปรับโครงสร้างให้มีผู้บริหารรับผิดชอบแต่ละหน่วยธุรกิจย่อย ซึ่งมี 3 แผนกคือ Public Cloud, Hybrid Cloud และ Cloud Infrastructure มี Weiguang Liu ดูส่วน Public Cloud, Jin Li ดูส่วน Hybrid Cloud ทั้งสองคนจะขึ้นตรงกับ Eddie Wu ซีอีโอ Alibaba Cloud และเป็นซีอีโอของ Alibaba Group บริษัทแม่หลักด้วย ส่วน Jiangwei Jiang ที่รับผิดชอบ Infrastructure จะขึ้นตรงกับซีทีโอ Jingren Zhou
Alibaba รายงานผลประกอบการของไตรมาสเดือนกันยายน รายได้เพิ่มขึ้น 9% เทียบกับไตรมาสเดียวกันในปีก่อนเป็น 224,790 ล้านหยวน มีกำไรสุทธิ 27,706 ล้านหยวน
Eddie Wu ซีอีโอคนใหม่ของ Alibaba กล่าวในช่วงแถลงผลประกอบการว่าบริษัทพร้อมลงทุนเพื่อการเติบโต ด้วยสถานะทางการเงินที่ไม่เคยดีเท่านี้มาก่อน บริษัทสร้างกระแสเงินสดอิสระย้อนหลัง 12 เดือน ได้มากถึง 2.7 หมื่นล้านดอลลาร์ และตอนนี้มีเงินสดในมือ 6.3 หมื่นล้านดอลลาร์ บริษัทจึงประกาศจ่ายเงินปันผลให้ผู้ถือหุ้นเป็นครั้งแรกของบริษัท ที่ 0.125 ดอลลาร์ต่อหุ้นปกติ และ 1.00 ดอลลาร์ต่อหุ้น ADS
มีรายงานว่า Alibaba ได้ออกอีเมลแจ้งภายในบริษัทว่า Daniel Zhang จะลาออกจากตำแหน่งซีอีโอของส่วนธุรกิจคลาวด์ ซึ่งเป็นตำแหน่งที่เขาเพิ่งย้ายมาเป็นเมื่อปลายเดือนมิถุนายน ตามแผนการปรับโครงสร้างองค์กรของ Alibaba ที่แยกธุรกิจออกเป็นบริษัทย่อย
Eddie Wu ประธานกลุ่ม Alibaba ซึ่งเป็นตำแหน่งก่อนหน้านี้ของ Zhang ด้วย จะมารับตำแหน่งซีอีโอส่วนธุรกิจคลาวด์นี้เพิ่มอีกตำแหน่ง
กลุ่มธุรกิจ Alibaba Cloud เป็นหนึ่งในธุรกิจที่ Alibaba โฟกัสมากเป็นพิเศษหลังการแยกออกมาเป็น 6 บริษัท โดยมีแผนนำบริษัทเข้าตลาดหุ้นให้ได้ภายใน 12 เดือน มูลค่ากิจการคาดว่าอยู่ที่ 4-6 หมื่นล้านดอลลาร์
Alibaba Cloud เปิดตัวโมเดลภาษาภาพขนาดใหญ่ (Large Vision Language) แบบโอเพนซอร์ส ซึ่งมีความสามารถในการเข้าใจภาพและตัวหนังสือ
สองโมเดลได้แก่ Qwen-VL เป็นโมเดลภาษาภาพขนาดใหญ่ที่ถูกเทรนมาก่อน และ Qwen-VL-Chat โมเดลสำหรับการสนทนาโต้ตอบ ขนาด 7 พันล้านพารามิเตอร์ มีความสามารถทำความเข้าใจภาพในภาษาอังกฤษและภาษาจีน และสร้างบทสนทนาโต้ตอบ รวมถึงทำงานประมวลผล เช่น บวกเลขในภาพได้ ซึ่งสามารถนำมาช่วยทั้งการอ่านป้ายภาษาจีน สำหรับคนที่ไม่รู้ภาษาจีน หรือใช้ช่วยอ่านป้ายต่าง ๆ สำหรับผู้มีปัญหาการมองเห็น
ทั้ง Qwen-7B และ Qwen-7B-Chat เปิดให้ดาวน์โหลดใช้งานแล้วที่ ModelScope ซึ่งเป็นชุมชนนักพัฒนา AI ของ Alibaba Cloud และที่ Hugging Face
Alibaba Cloud เปิดซอร์สโค้ดของโมเดลภาษาขนาดใหญ่ (LLM) ชื่อ Tongyi Qianwen ที่เคยเปิดตัวครั้งแรกเมื่อเดือนเมษายน 2023 ออกสู่สาธารณะ
โมเดลที่เปิดซอร์สโค้ดออกมายังมีเฉพาะรุ่นเล็ก Qianwen-7B และ Qianwen-7B-Chat ขนาด 7 พันล้านพารามิเตอร์ รองรับบทสนทนาขนาดยาว 8K, คลังคำศัพท์ 150K tokens (Qianwen ตัวเต็มมีขนาดใหญ่ถึง 10 ล้านล้านพารามิเตอร์ และถูกใช้กับบ็อตสนทนาของ Alibaba เอง เช่น DingTalk หรือ Tmall Genie)
Alibaba Cloud บริษัทในเครือ Alibaba ที่ดูแลธุรกิจบริการคลาวด์ เปิดตัว Tongyi Wanxiang เครื่องมือสร้างรูปภาพด้วย AI โดยตอนนี้ทดสอบในสถานะเบต้าสำหรับลูกค้าองค์กรก่อน
Tongyi Wanxiang รองรับอินพุททั้งภาษาจีนและภาษาอังกฤษ สามารถพรอมต์คีย์เวิร์ดที่ต้องการได้หลากหลาย รวมทั้งโมเดลยังสามารถแปลงรูปภาพเดิมให้เป็นรูปภาพใหม่ที่อาศัยโครงเดิมตามรายละเอียดคำสั่งได้อีกด้วย
นอกจากนี้ Alibaba Cloud ยังเปิดตัว ModelScopeGPT เฟรมเวิร์กสำหรับรับคำสั่ง AI ที่ซับซ้อนและมีความเฉพาะตัว รองรับทั้งการป้อนตัวหนังสือ รูปภาพ และคำสั่งเสียง มีโมเดลรองรับที่พัฒนาจากโมเดลพื้นฐาน ModelScope มากกว่า 900 โมเดล
CNBC รายงานจากแหล่งข่าวที่ไม่เปิดเผยว่า Alibaba เตรียมปลดพนักงาน 7% ในแผนกคลาวด์ โดยพนักงานจะได้เงินชดเชยหรือข้อเสนอย้ายไปฝ่ายอื่น
ในรายงานบอกถึงสาเหตุของการปลดพนักงานว่าเป็นผลต่อเนื่องจากที่ Alibaba เตรียมแยกบริษัทออกเป็น 6 กลุ่ม และล่าสุดก็บอกว่าธุรกิจคลาวด์ จะใช้วิธีไอพีโอเข้าตลาดหุ้น จึงต้องมีการปรับโครงสร้างองค์กรให้เหมาะสมเนื่องจากจะเป็นบริษัทอิสระ คาดว่าจะแล้วเสร็จใน 12 เดือนข้างหน้า
Alibaba Cloud ประกาศพันธมิตร 7 บริษัทที่จะได้ทดสอบและปรับแต่งการใช้งานปัญญาประดิษฐ์ภาษาขนาดใหญ่ Tongyi Qianwen ที่เปิดตัวไปเมื่อวันที่ 11 เมษายนที่ผ่านมาให้เหมาะกับการใช้งานของแต่ละอุตสาหกรรม
7 บริษัทแรกนี้ ได้แก่ Kunlun Digital Technology (ปิโตรเคมี), LongShine Technology (ไฟฟ้า), China Transinfo Technology (การคมนาคมขนส่ง), Shiji Group (ธุรกิจบริการ), Yonyou Network Technology (บริการสำหรับองค์กร), AsiaInfo Technologies (บริการด้านโทรคมนาคม), และ CICC Wealth Management (ภาคการเงิน) นับว่าเป็นบริษัทขนาดใหญ่ทั้งหมด แม้จะมีผู้สนใจลงทะเบียนขอทดสอบกว่าสองแสนราย