About 50 results
Open links in new tab
  1. 如何评价 DeepSeek 的 DeepSeek-V3 模型? - 知乎

    尽管DeepSeek-V3展示了per-tile和per-group量化对于模型收敛的重要性,论文中并没有给出对应的FP8矩阵乘法的算子效率。 另外,论文中缺乏per-token加per-channel量化的讨论,不清楚这种实现 …

  2. DeepSeek 更新两个 v3.2 新模型,这次有哪些亮点? - 知乎

    Dec 1, 2025 · DeepSeek 是缺人力物力财力数据去训 T 级参数规模的模型吗? 我觉得不是。 单纯就是发展路线的选择,我相信 DeepSeek 用一年时间,已经把 V3 的基模调出花了。 说实话, 这种不为外 …

  3. deepseek官网地址告诉我? - 知乎

    DeepSeek官网入口、下载及使用教程 DeepSeek简介: DeepSeek,特别是V3版本,因其十分有效的控制训练模型成本和开源免费的模式震惊全球,登顶应用商店的下载排行榜,甚至重创国外的科技股, …

  4. DeepSeek 计划二月中旬发布新模型 DeepSeek-V4,有哪些技术亮点? …

    Jan 10, 2026 · DeepSeek这个新模型有很强的Coding能力 废话,DeepSeek v3.2就表现出了很强的Coding能力,当然也有用户反映Coding能力反而有下降,我觉得这说明DeepSeek v3.2还没有碾压 …

  5. OpenAI GPT-5 和 DeepSeek 等 AI 工具均向用户免费,免费后靠什么盈 …

    有人说 DeepSeek 靠 API 盈利,但 API 都已经停止充值了,他们也不做 toB 业务,所以目前来看,DeepSeek 纯纯为爱发电。 至于原因,我们也许可以在梁文锋的采访中找到答案。 去年 DeepSeek …

  6. 使用Deepseek需要付费的吗? - 知乎

    2、阿里云百炼新人可领取百万token3: bailian.console.aliyun.com 此外,DeepSeek还为企业提供定制化的解决方案,这类服务通常需要根据具体需求协商价格。 所以,普通用户可以免费使用 …

  7. 如何理解 DeepSeek 最新提出的 mHC 架构? - 知乎

    而DeepSeek的这个选择,简直是神来之笔。 具体来看看双随机矩阵的一些性质,你就能明白Deepseek这样选择的深意。 先说谱范数的事儿。 双随机矩阵有个非常好的性质——它的谱范数, …

  8. 有必要自己将deepseek部署到本地吗? - 知乎

    顺带教大家如何在10分钟内零基础地完全本地化部署DeepSeek-R1模型。 1.为什么要自己部署DeepSeek? 最近DeepSeek非常火爆! 它不仅能撰写文案和进行研究,还能联网实时回答问题,堪 …

  9. 如何看待DeepSeek发布的新模型DeepSeek-Math-V2? - 知乎

    DeepSeek终于回来了,再次创造历史 (首个IMO金奖级别的开源模型)。 就在刚刚,DeepSeek在HuggingFace开源了全新的数学推理模型DeepSeekMath-V2,685B参数。

  10. 2025年12月1日,DeepSeek正式发布V3.2和V3.2-Speciale,如何评价该 …

    Dec 1, 2025 · DeepSeek-V3.2 与其他模型在各类数学、代码与通用领域评测集上的得分(括号内为消耗 Tokens 总量约数) 不同于过往版本在思考模式下无法调用工具的局限,DeepSeek-V3.2 是我们推出 …