矽星人pro
7minAPR 29
播放聲音
喜歡
評論
分享

詳細信息

在所有人都在猜測DeepSeek V4或者R2和Qwen3誰先到來時,Qwen3發布了。 4月29日淩晨,阿里巴巴開源了新一代通義千問Qwen3系列模型,涵蓋8款不同尺寸。其中,旗艦模型Qwen3 235B采用混合專家(MoE)架構,總參數量235B(僅為DeepSeek-R1的1/3),激活參數僅需22B,預訓練數據量達36萬億Tokens。 性能上,據官方介紹,Qwen3在多項測評中表現優異,超越DeepSeek-R1、OpenAI-o1等主流模型,成為當前性能領先的開源大語言模型。 具體來看,Qwen3在推理、指令遵循、工具調用、多語言能力等方面均大幅增強:在奧數水平的AIME25測評中,Qwen3斬獲81.5分...

查看更多