白左搁那分析DeepSeek我就想笑
支那人除了造假什么都不会。
首先发了论文证明自己用了新的架构,并且开源,号称训练成本低,用GPU算力少,并且得到ChatGPT八成效果。熟悉中国的,以及阿姨的廉价七成正确理论的,连看都不会看,一眼假。
首先你如何证明你用了你所谓的新的架构来达到了如此的效果?其次你开源的预训练模型只是一个原型,没有人可以投入大量的成本来验证是否能够达到八成效果,所以这是一个伪命题。你说只花了六百万美元/只用了H800就达到了如此效果,谁证明?中国政府可以大力投入资金,中国白区党也可以像孟晚舟那样绕过管控偷偷买来很多H100(有传),所以你如何证明你的数据?另外如果这个模型是拿其他AI模型得到的数据蒸馏得到的,那成本肯定会低,但是没有任何意义,无非就是另一个山寨瓦房店产品。
品大葱必须蘸大酱 25-01-27
首先发了论文证明自己用了新的架构,并且开源,号称训练成本低,用GPU算力少,并且得到ChatGPT八成效果。熟悉中国的,以及阿姨的廉价七成正确理论的,连看都不会看,一眼假。
首先你如何证明你用了你所谓的新的架构来达到了如此的效果?其次你开源的预训练模型只是一个原型,没有人可以投入大量的成本来验证是否能够达到八成效果,所以这是一个伪命题。你说只花了六百万美元/只用了H800就达到了如此效果,谁证明?中国政府可以大力投入资金,中国白区党也可以像孟晚舟那样绕过管控偷偷买来很多H100(有传),所以你如何证明你的数据?另外如果这个模型是拿其他AI模型得到的数据蒸馏得到的,那成本肯定会低,但是没有任何意义,无非就是另一个山寨瓦房店产品。
品大葱必须蘸大酱 25-01-27