雷峰網
19min3 w ago
播放聲音
喜歡
評論
分享

詳細信息

過去兩年,關於大模型的討論視角很少從商湯這樣成立不過十年、資源與技術積累正當青壯年的人工智能公司出發。造成這一現象的主要原因是兩個技術週期的迥異: 2023 年之前,商湯的人工智能技術路徑以計算機視覺模型為主,不同於 ChatGPT 為代表的新技術浪潮:以自然語言處理為主、大規模參數模型為核心。一個是視覺、一個是語言,在外界看來兩個賽道還没有發生直接的關系。 然而,DeepSeek R1 的發布讓一切變得“戲劇性”:ChatGPT 之后,各個大語言模型廠商在卷 GPT-4 的路上狂奔兩年后幾乎所有努力被 V3 與 R1 抹平。當語言方向的基礎模型出...

查看更多