|
- DeepSeek - 知乎
DeepSeek-V3 R1 推理系统的优化目标是:更大的吞吐,更低的延迟。 为了实现这两个目标,我们的方案是使用大规模跨节点专家并行(Expert Parallelism EP)。
- 如何评价 DeepSeek 的 DeepSeek-V3 模型? - 知乎
DeepSeek-V3据我所知,是第一个(至少在开源社区内)成功使用FP8混合精度训练得到的大号MoE模型。 众所周知,FP8伴随着数值溢出的风险,而MoE的训练又非常不稳定,这导致实际大模型训练中BF16仍旧是主流选择。
- 都说接入的DeepSeek是满血版,为什么感觉还是官方的好用? - 知乎
看到一个很好用的测试案例,可以用来简单测试是不是DeepSeek满血版。 请用我给你的四个数字,通过加、减、乘、除、括号,组成一个运算,使得结果为24。注意:数字需要全部我提供的数字:4 4 6 8。 这是DeepSeek官方提供的回答,简洁明了,一次就答对了。
- 如何让deepseek做ppt?
DeepSeek和Kimi二者结合,利用DeepSeek协助做分析出代码, 然后让Kimi做它擅长的PPT设计与优化。 假设我们要做一个关于“DeepSeek介绍”的PPT,需要我们先输入指令,让DeepSeek给出大纲内容,并且最好是用Markdown格式输出; PPT大纲的输出速度还是很快的,
- DeepSeek 完整使用手册!? - 知乎
deepSeek页面 如果您没有DeepSeek账号,点击“还是对话“按钮之后会进入注册页面。DeepSeek目前提供验证码登录、微信登录或者密码登录3种方式。 除了支持网页版、DeepSeek还支持API接入及移动端应用。 1 2 基本界面 网页版登录后,我们会进入DeeepSeek的使用界面。其主要功能如下图所示:
- deepseek v3的成本这么低的根本原因是什么? - 知乎
DeepSeek-V3 在一系列基准测试中进行了评估,包括多学科多项选择题、语言理解和推理、闭卷问答、阅读理解、参考消歧、语言模型、中文理解和文化、数学、代码和标准化考试等。 DeepSeek-V3 在大多数基准测试中都取得了最强大的性能,尤其是在数学和代码任务上。
- 为什么用 DeepSeek 总是提示「服务器繁忙」?怎么解决? - 知乎
为什么用 DeepSeek 总是提示「服务器繁忙」? 怎么解决? 最近使用deepseek时,不知道是不是问问题的方式不对还是服务器不稳定原因,很多问题半天也没有一个回答。 所以deepseek到底该怎么与其交流呢? 显示全部 关注者 666 被浏览
- deepseek开始会员收费了吗? - 知乎
deepseek开始会员收费了吗? 现在可以下载电脑客户端了,先跳出来的是deepseek下载助手,然后下载客户端需要先登录手机号然后点下载需要支付68元?
|
|
|