|
- 什么是大模型?超大模型和 Foundation Model 呢? - 知乎
目前Foundation Model或者是大模型,特别地火,接下来介绍什么是大模型,大模型的基本概念;接着看看大模型的实际作用,然后基于这些实际作用,我们简单展开几个应用场景。 最后就是介绍支持大模型训练的AI框架。
- 视觉大模型Qwen2. 5-VL关键技术介绍 - 知乎
模型结构:Qwen1 0-VL的核心模型结构包括一个语言大模型、视觉编码器、Vision-Language Adaptor,是一个目前多模态大模型最常见的结构。
- 大模型是怎么训练的?有哪些步骤和难点? - 知乎
微软年度开发者大会2023 Andrej Karpathy所演讲的内容 大模型的训练大体上可以分为四个步骤,每个环节都有不同的难点。 流程上大概是这样: 预训练→ 监督微调(SFT)→ 奖励模型训练,Reward Modeling → 强化学习,Reinforcement Learning(RL)。
- 华为盘古大模型被指出抄袭阿里Qwen大模型是怎么回事? - 知乎
华为盘古大模型被指出抄袭阿里Qwen大模型是怎么回事? 7月5日,针对盘古Pro MoE模型被质疑套壳阿里通义千问Qwen-2 5的争议,华为诺亚方舟实验室发布声明称,该模型是基于昇腾硬件平台开发、训练的基…
- 大模型面试:八股文+题目整理 - 知乎
微调(Fine-Tuning)在大语言模型的历史上,就像给一台超级计算机穿上定制的西装——看似只改了点边边角角,实际上大大提升了它在特定场景下的表现。 大语言模型的微调像是一个从“小作坊定制”到“工业流水线”,再到“智能自动化”的演化过程。
- 现在这些大模型,哪个在代码编写上表现的最好呀? - 知乎
现在这些大模型,哪个在代码编写上表现的最好呀? gpt好像出了o3,但似乎是更追求效率? deepseek听说是更专门针对代码编写的,有没有大佬说说体验。 其他大模型也可以讲讲 显示全部 关注者 50 被浏览
- 大模型思维链 CoT 介绍及应用 - 知乎
大模型思维链CoT相关内容需要学习大模型提示prompt相关知识,在这里我推荐 知乎知学堂推出的AI大模型进阶课程,这门课会讲到大模型提示prompt的原理和构造方法。
- 大模型有哪些评估指标? - 知乎
1 导入 你可能听说过A大模型比B大模型好,但你知道如何评估这些模型吗?在大模型领域,有许多指标可以帮助我们评估模型的性能。这些指标可以帮助我们了解模型的准确性、效率和可解释性。在本文中,我们将介绍一些常用的指标,以及如何使用它们来评估模型的性能。
|
|
|