白左搁那分析DeepSeek我就想笑

支那人除了造假什么都不会。
首先发了论文证明自己用了新的架构，并且开源，号称训练成本低，用GPU算力少，并且得到ChatGPT八成效果。熟悉中国的，以及阿姨的廉价七成正确理论的，连看都不会看，一眼假。
首先你如何证明你用了你所谓的新的架构来达到了如此的效果？其次你开源的预训练模型只是一个原型，没有人可以投入大量的成本来验证是否能够达到八成效果，所以这是一个伪命题。你说只花了六百万美元/只用了H800就达到了如此效果，谁证明？中国政府可以大力投入资金，中国白区党也可以像孟晚舟那样绕过管控偷偷买来很多H100（有传），所以你如何证明你的数据？另外如果这个模型是拿其他AI模型得到的数据蒸馏得到的，那成本肯定会低，但是没有任何意义，无非就是另一个山寨瓦房店产品。

品大葱必须蘸大酱 25-01-27

要评论请先登录或注册