|
- 目前,已知的开源大模型有哪些? - 知乎
目前,已知的开源大模型有不少,以下是一些比较有代表性的,但不全面: 国外开源大模型 Llama系列:Meta推出的开源大模型,最新版本是Llama3,有8B和70B两个小参数版本,支持8K上下文长度,性能出色,能媲美一些闭源大模型。
- 大模型(LLM)和智能体(Agent)有什么区别? - 知乎
大模型(Large Language Models, LLMs)和智能体(Agent)虽然在某些应用场景中有交集,但它们的概念、功能和技术实现上有显著的区别。我从以下几个方面来给大家做一个对比,相信你就能更加清晰的了解了。 1 定义与目标 大模型(LLM)
- 什么是大模型?超大模型和 Foundation Model 呢? - 知乎
回到大模型,2017年Transformer结构的提出,使得深度学习模型参数突破了1亿。下面这个图呢,就是从一开始的lenet、Alexnet、ResNet开始,模型参数一个比一个大,到了BERT网络模型的提出,使得参数量首次超过3亿规模,GPT-3模型超过百亿,鹏程盘古实现千亿稠密的规模、Switch Transformer的问世还一举突破万
- AI大模型,哪个最好用? - 知乎
引用Dario Amodei的话,超大模型的参数是用来捕捉长尾罕见模式的。——如果要学习到高端稀缺的知识模式,只能用更多参数,更深的层级去捕获,要不然这深度神经网络的参数,是搁那玩呢。) ②新GPT-4o,美国老牌模型,这次给得很多,差不多可以替代4oL了。
- 大模型优化利器:RLHF之PPO、DPO - 知乎
打个小广告 ☻,知乎专栏《大模型前沿应用》的内容已经收录在新书《揭秘大模型:从原理到实战》中。感兴趣的朋友可以购买,多谢支持!♥♥ 与有 sft 相比,强化学习能够给大语言模型带什么哪些好处呢?
- 有没有好用的AI大模型聚合平台啊?找一个也太难了!? - 知乎
可以看到,这个网站支持的AI大模型聚合平台功能包括了国内外常见的AI大模型,包括OpenAI的ChatGPT4 0、3 5,还有百度的文心一言,阿里的通义千问,清华的GLM4、3,甚至还有最近爆火的Claude3 0
- 推理大模型与普通大模型的区别是什么? - 知乎
通用大模型和推理大模型是人工智能领域中的两种重要模型类型,它们在设计目标、训练方法和应用场景上存在显著差异。以下以 DeepSeek-V3 和 DeepSeek-R1 为例,详细分析它们的定义、区别及适用场合。 1 定义 1 1 通用大模型:DeepSeek-V3
- 国内大模型聚合平台有哪些? - 知乎
现在挺多这种AI聚合平台的,直接在一个平台上,就能使用不同平台的AI大语言模型, 我推荐一个我经常使用的, 不过这个就对接了Chatgpt和Claude3 (克劳德),以及一些AI绘图模型,至于那些国产AI大模型,就没有对接,因为都是能直接打开使用,也没有对接的必要,这些本土化模型,直接在官网
|
|
|