00:00 / 04:36
连播
清屏
智能
倍速
点赞25
00:00 / 00:54
连播
清屏
智能
倍速
点赞63
00:00 / 02:38
连播
清屏
智能
倍速
点赞369
00:00 / 03:44
连播
清屏
智能
倍速
点赞2
大语言模型:定义、涌现能力与三阶段训练流程解析 LLM 区别于传统 PLM 的独特优势在于其核心能力: 1. 涌现能力:随着模型规模增大,性能迅速提升,量变引起质变。 2. 上下文学习(In-context Learning):无需额外训练或参数更新,通过自然语言指令或示例即可执行任务,推动了 NLP 范式向 Prompt Engineering 转变。 3. 指令遵循(Instruction Following):通过指令微调获得泛化能力,能够理解并执行未见过的指令,极大拓宽了模型的应用范围。 4. 逐步推理(Step by Step Reasoning):通过思维链(CoT)推理策略解决涉及多个推理步骤的复杂任务。 训练一个完整的 LLM 一般需要经过三阶段: 1. 预训练(Pretrain):工程量最大的一步,使用海量无监督文本(数 T token)通过因果语言模型(CLM)任务来赋予模型海量知识。这一阶段需要大规模分布式训练框架(如 Deepspeed,利用 ZeRO 策略)支持上百亿参数的模型。 2. 监督微调(SFT):旨在激发模型的通用指令遵循能力。训练输入是各种类型的用户指令,输出是期望的模型回复。多轮对话能力也是在 SFT 阶段训练获得的。 3. 人类反馈强化学习(RLHF):实现 LLM 与人类价值观对齐,使其输出安全、有用、无害的内容。RLHF 分为两个步骤:训练奖励模型(RM)来拟合人类偏好,以及使用 PPO(近端策略优化)算法进行强化学习训练。此外,DPO(直接偏好优化) 是 RLHF 的一种低门槛平替方案。 #大语言模型 #涌现能力 #上下文学习 #幻觉 #知识前沿派对
00:00 / 08:52
连播
清屏
智能
倍速
点赞17
高端模型品牌Kiss的中国探厂纪录片 当一个铁路模型与原型的区别仅在于比例时,这便意味着模型制作达到了最高水准!家族企业“Kiss铁路模型公司”多年来专注于高端领域的顶级模型制作,其工艺已触及当今制造技术可行性的极限。 关于Kiss铁路模型 Kiss Modellbahnen品牌最早由Günther Kiss创立,后由其儿子Stefan Kiss(“Kiss Junior”)接手,成立Kiss Modellbahnen GmbH & Co. KG。2020 年 3 月,Kiss Modellbahnen申请破产;成立了两家新的独立公司Kiss Modellbahnen Deutschland和Kiss Modellbahnen Schweiz接管,前者现在是 Fine Models GmbH 旗下的一个品牌,该公司专注1比例模型制造;后者于 2021 年被Christoph Hulliger收购,但2025年3月24日该新主体再次破产。 原视频来自Youtube频道「Andreas Cadosch」,发布于2013年7月4日,是当时来中国青岛的代工商处探厂的纪录片,内容丰富,细节满满,通过沉浸式展示KISS模型从调研、设计、铸造、涂装到总装的全链条,塑造了其作为顶级手工模型制造商的品牌形象——在规模化生产时代,仍以手工精密工艺实现近乎极致的原型还原。视频由「我们爱看西洋镜」频道翻译和校对字幕,中文配音使用HEYGEN,首次尝试东北话音色呈现。 #KISS #我们爱看西洋镜 #瑞士联邦铁路 #1比例 #模型品牌纪录片 #高端模型 #火车模型 #Br95 #Re66
00:00 / 20:25
连播
清屏
智能
倍速
点赞2
00:00 / 02:08
连播
清屏
智能
倍速
点赞1054
00:00 / 07:11
连播
清屏
智能
倍速
点赞10
00:00 / 08:35
连播
清屏
智能
倍速
点赞0
00:00 / 00:53
连播
清屏
智能
倍速
点赞173