DeepSeek เทรนข้อมูลบนชิป Nvidia แต่ใช้ชิป AI ของ HUAWEI ในการประมวลผล

2 months ago 30
❤️ ARTICLE AD BOX ❤️

ดูเหมือนตอนนี้สงคราม AI กำลังทวีความรุนแรงขึ้น หลังจากการมาของ DeepSeek ซึ่งเป็นโมเดล AI สัญชาติจีนที่อ้างว่ามีความสามารถที่แซงหน้า AI คู่แข่งของสหรัฐฯ ได้อย่างมาก โดยเฉพาะต้นทุนที่ต่ำกว่า ทำให้แชทบอทโอเพนซอร์สของ DeepSeek สามารถขึ้นสู่อันดับสูงสุดบน App Store ใน 51 ประเทศ ล่าสุดมีรายงานว่าแอปฯ นี้สามารถประมวลผลได้บนชิป AI ของ HUAWEI อีกด้วย

I feel this should be a much bigger story: DeepSeek has trained on Nvidia H800 but is running inference on the new home Chinese chips made by Huawei, the 910C. pic.twitter.com/6IAgQlQ3ou

— Alexander Doria (@Dorialexander) January 28, 2025

โดยในโพสต์ข่าวโปรโมตนั้นกล่าวว่า DeepSeek R1 LLM (โมเดลภาษาขนาดใหญ่) ได้รับการฝึกบน Nvidia H100 แต่ใช้ชิป Ascend 910C สำหรับการสรุปข้อมูล ซึ่งเป็นการใช้โมเดลที่ผ่านการฝึกมาแล้ว มาประมวลผลบนชิป AI ของ HUAWEI ด้วย ซึ่งข้อมูลจากแหล่งข่าว @Dorialexander ระบุว่าชิป Ascend ของ HUAWEI จะไม่ได้ถูกใช้งานสำหรับการเทรน AI ดังนั้นความต้องการประสิทธิภาพจาก GPU จึงไม่สูงนัก

อย่างไรก็ตาม เนื่องจากชิป Ascend 910C มีประสิทธิภาพที่ไม่สูงนัก จึงทำให้ไม่เหมาะกับการเทรน ดังนั้น HUAWEI จึงวางแผนที่จะแก้ไขปัญหานี้ด้วยชิป 920C ที่อัปเกรดใหม่ และจะเปิดตัวเพื่อแข่งขันกับ Blackwell B200 ซึ่งเป็นชิปเซตจาก Nvidia สำหรับงาน AI โดยเฉพาะเช่นกัน

ที่มา gsmarena

Read Entire Article