实实通信的视频网站怎么做网站建设终稿确认书

张小明 2026/1/13 0:33:01
实实通信的视频网站怎么做,网站建设终稿确认书,百度手机网站优化指南,网站建设的商品编码无需重新训练#xff0c;只要抑制 0.1% 的特定神经元#xff0c;就能让模型“闭嘴”#xff1f;近年来#xff0c;大语言模型#xff08;LLMs#xff09;在问答、推理与生成任务中展现出卓越能力#xff0c;但其幻觉#xff08;Hallucination#xff09;问题仍然是制约…无需重新训练只要抑制 0.1% 的特定神经元就能让模型“闭嘴”近年来大语言模型LLMs在问答、推理与生成任务中展现出卓越能力但其幻觉Hallucination问题仍然是制约实际应用的核心挑战之一。模型有时会在缺乏事实依据的情况下给出看似合理却错误的回答甚至在面对明显错误或虚构的信息时依然“自信作答”。为了解决这个问题学术界和工业界尝试了各种宏观层面的手段从数据清洗、后训练对齐到外挂知识库RAG。然而这些方法大多将模型视为一个黑盒试图从外部矫正其行为。但是模型内部究竟发生了什么幻觉在模型内部是如何产生的对于幻觉是否存在可被精确定位、分析乃至干预的内部结构围绕这一问题清华大学 THUNLP、清华大学新闻与传播学院、OpenBMB 以及面壁智能的联合团队近期的一项工作从微观神经元视角出发系统研究了 LLM 中的幻觉机制。不仅找到了与幻觉相关的极少数神经元H-Neurons更揭示了一个令人意外的真相幻觉并非无序的生成错误而是模型为了顺从你进行的“过度配合”。论文标题H-Neurons: On the Existence, Impact, and Origin of Hallucination-Associated Neurons in LLMs论文地址https://arxiv.org/pdf/2512.01797核心贡献团队从神经元层面对 LLM 中的幻觉问题进行了系统研究围绕“是否存在、如何影响行为、从何而来”三个核心问题给出了相对完整的机制性回答论文的主要贡献如下在神经元层面验证了幻觉的可定位性并揭示了幻觉背后的行为机制。识别出极其稀疏0.1%的一部分与幻觉高度相关的神经元它们在数量上极其稀少却能够有效地区分幻觉与非幻觉输出。通过对 H-Neurons 进行推理阶段的扰动团队发现这些神经元并非简单地“编码错误事实”而是在驱动模型的顺从性由此幻觉被自然地统一为“过度顺从”的具体表现而非孤立的异常行为。追溯了幻觉相关神经元的训练起源团队发现这些神经元的核心作用在预训练阶段已基本成型而非单纯由后训练引入。核心方法2.1 幻觉定位H-Neurons在 LLM 中是否存在一部分神经元其激活模式能够稳定地区分“幻觉回答”与“真实回答”如果幻觉信号在神经元层面高度分散那么针对幻觉的分析与干预很可能只能停留在宏观调控相反若幻觉能够被归因到一小部分神经元则意味着其背后可能存在更加清晰、可操作的机制。基于这一考虑团队从模型的前馈神经网络FFN层出发开展神经元级别的系统分析。具体而言团队并未简单使用神经元的原始激活值而是引入了 CETT 指标用以量化单个神经元在具体生成过程中对输出的实际贡献程度这一设计旨在避免将高激活但低影响的神经元误判为活跃神经元更精准地衡量神经元的实际贡献。在此基础上团队收集了模型产生和未产生幻觉的等量回复将每个神经元在这些回复的生成过程中的贡献值作为特征构建了一个带有强正则化约束的稀疏预测模型用以区分幻觉与非幻觉输出稀疏性约束的引入使模型能够在大量候选神经元中自动筛选出最具判别力的最小神经元子集。为了证明这部分神经元不只是捕捉到数据集的偶然相关性团队在实验中采用了严格的跨数据集评估策略预测模型仅在单一数据集上训练但在多个不同领域、不同问题分布的数据集上进行测试如果稀疏预测模型在不同数据集上均能保持较高的幻觉预测准确率便能说明所选神经元捕捉到了鲁棒的幻觉信号。实验结果显示模型中确实存在一类与幻觉高度相关的神经元它们极其稀疏通常不足全部神经元的 0.1%但对幻觉的预测能力却十分显著。更重要的是这些神经元的预测能力能够稳定泛化到不同领域、不同问题形式的问答数据集包括跨领域与含虚构实体的场景。这意味着幻觉在模型内部是有清晰、可定位的结构基础的。团队进一步在稀疏预测模型中保留那些贡献与幻觉产生正相关的神经元即 H-Neurons。2.2 幻觉本质大模型为满足用户需求“过度顺从”的表现确立了 H-Neurons 的存在后一个更深层的问题浮出水面这些神经元到底在干什么仅凭预测能力很难区分这些神经元究竟只是与幻觉相关还是具体驱动了模型的某种行为。因此我们进一步从因果干预的角度检验 H-Neurons 在模型行为中的作用。具体而言团队在不重新训练模型、不修改模型参数结构的前提下对 H-Neurons 进行了“神经外科手术”式的扰动实验在推理阶段适度放大或抑制其输出并观察模型整体行为的变化实验结果揭示了幻觉背后的真正机制过度顺从Over-Compliance。团队在错误前提的顺从、误导性上下文的顺从、用户质疑的顺从、有害指令的顺从等四类顺从性任务上做了评测。结果显示在不同模型上扰动实验呈现出高度一致的模式当增强这些 H-Neurons 时模型并没有变得语无伦次而是展现出更高的顺从性。例如面对用户的质疑模型更倾向于将自己原先回答正确的问题修改为错误的。反之当抑制这些神经元时模型的顺从性则随之降低。这些变化并非零散出现而是在不同任务设置中系统性地共同发生这一现象指向一个统一的机制解释H-Neurons 并非专门制造错误事实而是在提升模型的顺从性。从这一视角看幻觉并不是一种孤立的异常行为而是过度顺从的具体体现当这种倾向被过度激活时模型更倾向于满足用户输入而非在信息有误或问题本身不合理时指出问题。2.3 幻觉溯源源于预训练而非后训练在确认 H-Neurons 的存在及其对模型行为的因果影响之后团队进一步追问一个更为根本的问题H-Neurons 是在指令微调之后产生的还是早在预训练阶段就已经形成这一问题对于理解幻觉的根源具有关键意义如果幻觉相关神经元主要由指令微调或对齐过程引入那么通过改进对齐策略或奖励设计或许可以从根本上缓解幻觉。但若它起源可以追溯到预训练阶段则意味着幻觉问题在一定程度上源于模型的基础训练目标其治理难度与影响范围都将更为深远。为此团队将指令微调模型中识别出的 H-Neurons 映射回其对应的预训练模型并在不进行任何重新训练或参数更新的情况下直接使用之前的稀疏预测模型评估这些神经元在预训练模型中的幻觉预测能力。此外团队还通过分析模型参数的演变将 H-Neurons 的变动幅度与全网络神经元的平均变动进行全域排序对比从而在微观参数层面判定这些神经元是否在后训练阶段被大幅重新构建了。实验结果表明在预训练模型中这些神经元依然能够显著地区分幻觉与非幻觉输出。H-Neurons 在指令微调中的平均变动幅度显著小于其他神经元。这说明指令微调并未系统性地改变 H-Neurons 它们并非后训练阶段的产物而是 next-token prediction 预训练目标下自然涌现的结果。从根本上看模型在预训练阶段被优化去持续生成在统计上合理的下一个 token。这一目标天然偏向于鼓励回答的连贯性、流畅性与完整性。在缺乏对“未知”或“不确定”进行明确建模的情况下一部分神经元逐渐承担起推动生成继续进行的功能而这些神经元在后续任务中便可能演化为带来幻觉的关键单元。总结该工作为理解与缓解幻觉问题提供了新的思路。首先团队提供了一种基于白盒神经元信号的幻觉检测方法H-Neurons 可作为神经元级的诊断信号用于模型幻觉检测。其次推理阶段的神经元扰动结果表明幻觉缓解并不一定依赖重新训练模型也可能通过编辑特定神经元控制模型行为来完成虽然简单的抑制可能影响模型效用但这为开发更可控、更安全的 LLM 开辟了新的物理干预路径。最后这一工作对 LLM 训练与对齐本身提供了新的反思视角。研究结果表明H-Neurons 在预训练阶段已基本形成这意味着幻觉问题并非仅靠后续对齐或指令微调即可彻底解决而与 next-token prediction 这一基础训练目标内在相关。这一发现提示消除幻觉可能需要超越传统的后训练思路从更底层出发重新审视预训练阶段的设计。现在在「知乎」也能找到我们了进入知乎首页搜索「PaperWeekly」点击「关注」订阅我们的专栏吧·
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

网站开发项目周报企业整合营销系统

车辆MPC轨迹跟踪控制,跟踪双移线轨迹 无人驾驶车辆模型预测控制第五章 根据文献及第五章代码进行了修改调试,已经调试好以下车速的MPC轨迹跟踪代码: 车速:36km/h、60km/h、72km/h(原本代码会失稳,新添加了质…

张小明 2026/1/12 9:31:49 网站建设

网站建设私单合同app外包开发公司排行

Google Search Console监控:跟踪“github镜像”关键词排名变化 在AI开源项目层出不穷的今天,一个再优秀的工作流或模型,如果没人搜得到,几乎等同于不存在。我们经常看到一些技术实现非常出色的项目,文档齐全、代码优雅…

张小明 2026/1/12 7:57:43 网站建设

快速网站建设推荐泉州关键词网站排名

QSPI高速通信背后的“隐形守护者”:电源去耦设计实战精要你有没有遇到过这样的情况?系统其他功能一切正常,唯独QSPI Flash启动时偶尔卡死;或者在EMI测试中,30–100 MHz频段莫名其妙超标,排查半天发现源头竟…

张小明 2026/1/6 3:59:04 网站建设

做一个网站怎么赚钱苏州网页制作

WinAsar:完全免费的asar文件图形化处理神器 【免费下载链接】WinAsar 项目地址: https://gitcode.com/gh_mirrors/wi/WinAsar 还在为Electron应用中的asar文件处理而头疼吗?WinAsar让你的asar文件操作变得前所未有的简单!这款专为Win…

张小明 2026/1/9 0:55:10 网站建设

网站建设综合实训wordpress文章生成二维码

NVIDIA CUDA-Q QEC权威指南:实时解码、GPU解码器与AI推理增强引言:实时解码在容错量子计算中的关键作用 容错量子计算机的实现离不开实时解码。通过使解码器与量子处理单元(QPU)并行低延迟运行,我们可以在相干时间内对…

张小明 2026/1/6 3:53:30 网站建设

网站建设全包广州英国网站后缀

终极指南:Voice有声书播放器完全解析 【免费下载链接】Voice Minimalistic audiobook player 项目地址: https://gitcode.com/gh_mirrors/vo/Voice 你是否曾因复杂的有声书应用而烦恼?Voice正是为解决这一痛点而生。这款极简主义的有声书播放器&a…

张小明 2026/1/6 3:53:30 网站建设