|
- 如何评价 DeepSeek 的 DeepSeek-V3 模型? - 知乎
尽管DeepSeek-V3展示了per-tile和per-group量化对于模型收敛的重要性,论文中并没有给出对应的FP8矩阵乘法的算子效率。 另外,论文中缺乏per-token加per-channel量化的讨论,不清楚这种实现上更加友好的量化方法对于训练稳定性的影响会有多大。
- OpenAI GPT-5 和 DeepSeek 等 AI 工具均向用户免费,免费 . . .
DeepSeek的出发点,不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。DeepSeek 希望形成一种生态,就是业界直接使用我们的技术和产出,我们只负责基础模型和前沿的创新,然后其它公司在 DeepSeek 的基础上构建 toB、toC 的业务。
- Deepseek-R2什么时候可以上线? - 知乎
1 为什么DeepSeek R2正在改变人工智能经济学 当DeepSeek R1于2025年1月首次亮相时,它打破了人们对于前沿人工智能需要数十亿美元资金的观念。 R1展示了一个精心设计的模型,使用较旧的英伟达芯片,可以以20-40倍更低的成本匹敌甚至超越一些顶尖的西方人工智能系统。
- DeepSeek 遭暴力破解,攻击 IP 均来自美国,造成影响有多 . . .
最可恨的是,DeepSeek 这波本来是泼天的流量,iOS App Store 双榜登顶,吸引了非常多国内外的新用户。结果这些新用户要么无法注册,要么登录以后不能正常使用。他们还没来及体验到 DeepSeek 真正的 AI 能力,就被劝退了,必然会造成很多用户流失。
- deepseek开始会员收费了吗? - 知乎
deepseek-chat 模型已经升级为 DeepSeek-V3;deepseek-reasoner 模型为新模型 DeepSeek-R1。思维链为deepseek-reasoner模型在给出正式回答之前的思考过程,其原理详见 推理模型。如未指定 max_tokens,默认最大输出长度为 4K。请调整 max_tokens 以
- deepseek和chatgpt有什么区别?哪个更好用? - 知乎
如果把DeepSeek和ChatGPT比作两个人,他们就像来自不同成长环境的超级学霸,各有专长但性格迥异: 1 身份背景 DeepSeek:本土培养的理工科博士 出身中国团队,擅长用"穷举法"解难题:用极低成本(训练费不到ChatGPT十分之一)实现顶级推理能力
- DeepSeek R1 的幻觉问题为什么严重?AI 的创造性和准确性 . . .
评估结果出乎意料:DeepSeek-R1 的幻觉率高达 14 3%,远高于其前代非推理模型 DeepSeek-V3。 DeepSeek-R1 的幻觉率测量 按照 HHEM 排行榜的标准流程,我们使用 DeepSeek-R1 和 DeepSeek-V3 生成数据集中的摘要,并使用以下两种方法评估其内容是否忠实于原始文章:
- 怎么分辨在用的deepseek是不是满血版啊? - 知乎
2、沃卡全模型API,我们测试了deepseek-r1及deepseek-r1-search这两个模型,结果都是“鸡” 沃卡全模型API-deepseek-r1模型 沃卡全模型API-deepseek-r1-search模型 沃卡API的Deepseek R1现在的速度还可以,缺点就是要付费,不过比官方的API价格还便宜一些,新用户有白嫖额度
|
|
|