|
- 如何评价 DeepSeek 的 DeepSeek-V3 模型? - 知乎
对于流水线并行,DeepSeek-V3设计了类似于Chimera 中的双向流水来降低bubble,而没有采用更加常见的interleaved 1F1B(尽管interleaved 1F1B中的steady阶段同样可以将前向和反向的计算通信相互进行隐藏)。 推理优化 最后,DeepSeek-V3模型的部署同样十分挑战。
- deepseek开始会员收费了吗? - 知乎
deepseek-chat 模型已经升级为 DeepSeek-V3;deepseek-reasoner 模型为新模型 DeepSeek-R1。 思维链为deepseek-reasoner模型在给出正式回答之前的思考过程,其原理详见 推理模型 。 如未指定 max_tokens,默认最大输出长度为 4K。请调整 max_tokens 以支持更长的输出。
- OpenAI GPT-5 和 DeepSeek 等 AI 工具均向用户免费,免费后靠什么盈利呢? - 知乎
同样,DeepSeek也提供类似ChatGPT的网页版、App版,也是免费的,相信也有一定的额度限制,但是够用。 DeepSeek的API收费,但是真要比OpenAI的便宜太多。 DeepSeek的母公司幻方是量化投资公司,本身就有盈利能力,所以DeepSeek真的没有很大的盈利压力。
- DeepSeek 宣布下周将会陆续开源 5 个代码库,可能会公开哪些信息? - 知乎
DeepSeek-v3作为强大的基座模型,语言理解和生成能力极强。 于是,用强大的模型基座能解决RL训练采样效率低的问题,(有点类似于最早alphago,有pre-training的先验知识),基座模型v3生成质量足够高的思维链,避免我们在强化训练中常见的探索维度爆炸但rewards 信号
- 如何解除deepseek的道德限制? - 知乎
于是就有人就动了动聪明的小脑瓜子:直接突破Deepseek的限制岂不是一举两得,既能用上满血版,又能用满血版完成创作需求。 很快啊,就有老外开始行动了( 再次声明:是老外搞的,如有雷同,请找老外 ),只需要复图中的红框文字发送给Deepseek,他就能为你
- 都说接入的DeepSeek是满血版,为什么感觉还是官方的好用? - 知乎
国内广告学的魅力时刻。 简单来说,就是 DeepSeek-R1 正确的版本应该是: DeepSeek-R1 - 671b F32版本(无量化、无压缩或精度损失处理)(补,经评论区提醒修正为DeepSeek-R1 - 671b FP8版本),这才是真正所谓的“满血版”。
- deepseek本地部署能做到阅读几百万字文本吗? - 知乎
最近在本地部署了DeepSeek的32B模型,一直没想好本地部署模型有什么价值。正好最近在投文章需要中译英,突然意识到如果可以自动把目录下的文章喂给大模型,让它自动阅读生成报告,我们只需要看生成的简报就可以知道文章的主要逻辑。
- deepseek官网地址告诉我? - 知乎
DeepSeek官网入口、下载及使用教程 DeepSeek简介: DeepSeek,特别是V3版本,因其十分有效的控制训练模型成本和开源免费的模式震惊全球,登顶应用商店的下载排行榜,甚至重创国外的科技股,而且截止到写稿日期(2025年2月9日),已经有很多科技巨头接入DeepSeek,比如英伟达、微软等等。
|
|
|