网站建设原则石家庄网站建设费用-马鞍山市网站建设公司-Seo优化

网站建设原则,石家庄网站建设费用,mt4外汇网站建设,做网站建设有哪些公司好为什么环境计算需要自学习在ACM信息检索特别兴趣小组#xff08;SIGIR#xff09;年会上#xff0c;Alexa AI的应用科学总监Ruhi Sarikaya发表了题为“面向环境计算的智能对话代理”的主题演讲。本文是经过编辑的演讲内容。几十年来#xff0c;个人计算的范式是台式机。…为什么环境计算需要自学习在ACM信息检索特别兴趣小组SIGIR年会上Alexa AI的应用科学总监Ruhi Sarikaya发表了题为“面向环境计算的智能对话代理”的主题演讲。本文是经过编辑的演讲内容。几十年来个人计算的范式是台式机。然后是笔记本电脑最后是我们可以握在手中、放进口袋的移动设备这感觉像是革命性的。然而所有这些设备都将你束缚在屏幕前。在大多数情况下你需要物理触摸它们才能使用这在许多情况下似乎既不自然也不方便。那么接下来是什么最可能的答案是物联网IoT和其他智能、互联的系统与服务。与物联网的交互界面会是什么你需要在手机上为每个联网设备配备一个单独的应用程序吗还是当你走进一个房间时只需对你想重新配置的设备说话在Alexa我们相信对话式AI将成为物联网的接口。这将意味着我们对对话式AI的理解将发生转变。环境计算的新背景特别是物联网为对话式AI模型创造了新形式的“上下文”。这里的“上下文”指的是围绕特定事件、情况或实体的环境和事实集合AI模型可以利用这些来提升其性能。例如上下文可以帮助消除歧义。以下是我们所指的上下文的一些例子设备状态如果烤箱是开着的那么“温度是多少”这个问题更有可能指的是烤箱温度。设备类型如果设备有屏幕“播放《饥饿游戏》”比在没有屏幕的设备上更可能指电影。物理/数字活动如果客户只听爵士乐“播放音乐”应该与只听说唱音乐的客户引发不同的响应如果客户总是在闹钟响后煮咖啡这应该影响“开始煮”等命令的解读。同样的推理也适用于其他上下文信号例如时间、设备和用户位置、传感器测量的环境变化等。训练一个对话代理去考虑如此多的上下文信号远比训练它识别歌曲标题要复杂得多。理想情况下我们希望为每个客户、设备和上下文的组合都有大量的训练示例但这显然不现实。那么我们如何扩展具有上下文感知能力的对话代理的训练呢自学习的解决方案答案是自学习。通过自学习我们指的是一个框架使自主代理能够从客户-系统交互、系统信号和预测模型中学习。客户-系统交互可以提供隐式反馈和显式反馈。Alexa已经能处理这两种反馈。如果客户在Alexa响应请求时打断我们称之为“插话”或重新措辞请求那就是隐式反馈。在多个客户中汇总的插话和重述表明请求未被正确处理。客户也可以明确地教导Alexa如何处理特定请求。这可以是客户发起的例如当客户使用Alexa的互动教学功能时也可以是Alexa发起的例如当Alexa询问“我回答您的问题了吗”自学习的巨大优势在于它不需要数据标注因此能更好地扩展并保护客户隐私它最大限度地减少了更新模型的时间和成本并且它依赖于高价值的训练数据因为客户最清楚自己的意图和需求。我们有针对自学习不同应用的几个项目包括自动生成真实标注、减少缺陷、可教学的AI以及确定故障的根本原因。自动生成真实标注在Alexa我们已经启动了一个多年计划旨在将Alexa的ML模型开发从基于手动标注转向主要基于自学习。我们面临的挑战是将客户反馈通常是二元或低维的如是/否、缺陷/非缺陷转换为高维的合成标注例如转录和命名实体标注。我们的方法有两个主要组成部分1探索模块和2反馈收集与标注生成模块。以下是标注生成模型的架构[架构图描述模型包含对话上下文编码器和基于Transformer的对话级编码器。输入特征包括对话上下文、分类特征、数值特征和原始音频数据。]真实标注生成模型将通常为二元或低维的客户反馈转换为高维的合成标注。输入特征包括对话上下文用户话语、Alexa响应、前序和后序对话轮次、分类特征领域、意图、对话状态、数值特征令牌数量、语音识别和自然语言理解置信度得分以及原始音频数据。该模型由轮次级编码器和基于Transformer的对话级编码器组成。轮次级文本编码器是一个预训练的RoBERTa模型。我们以自监督的方式对模型进行预训练使用合成对比数据。例如我们随机交换来自不同对话的答案作为缺陷样本。预训练后模型以监督方式在多个任务上进行训练使用显式和隐式的用户反馈。我们在多个任务上评估标注生成模型。其中两个是目标分割确定对话中哪些话语与完成特定任务相关和目标评估确定目标是否成功实现。作为这些任务的基线我们使用了一组每个由单个标注者在单次通过中产生的标注。对于模型和基线我们的“真实标准”是每个都由三位不同的人类标注者验证过的标注集。我们模型在这两个任务上的输出与人类标注者相当我们的模型准确性略高但F1分数略低。我们可以设置更高的阈值显著超越人类性能并且仍然比手动标注实现更大的标注吞吐量。除了与目标相关的标注外我们的模型还根据意图客户想要执行的操作例如播放音乐、槽位意图操作的数据类型例如歌曲名称和槽值槽位的特定值例如“Purple Haze”为话语添加标注。作为槽位和意图标注的基线我们使用了一个不包含上下文信息的基于RoBERTa的模型我们发现我们的模型在所有方面都优于它。基于自学习的缺陷减少三年前我们部署了一种自学习机制该机制纯粹基于隐式信号自动纠正Alexa对客户话语解释中的缺陷。这种机制——与真实标注生成模块不同——不涉及重新训练Alexa的自然语言理解模型。相反它会覆盖这些模型的输出以提高其准确性。提供重写有两种方式预计算重写离线生成请求-重写对并在运行时加载。此过程没有延迟限制因此可以使用复杂模型并且在训练期间可以利用丰富的离线信号例如用户后续对话轮次、用户重述、Alexa响应和视频点击率。其缺点是在运行时无法利用上下文信息。在线重写在运行时利用上下文信息例如先前的对话轮次、对话位置、时间来生成重写。它能够重写长尾缺陷查询但必须满足延迟约束并且其训练无法利用离线信息。预计算重写我们尝试了两种不同的预计算重写对方法一种使用预训练的BERT模型另一种使用吸收马尔可夫链。下图说明了基于BERT的方法[图示描述上下文重述检测模型将重述检测视为跨度预测问题预测每个令牌是跨度的开始或结束的概率。]上下文重述检测模型将重述检测视为一个跨度预测问题预测每个令牌是跨度开始或结束的概率。左侧是一个示例对话其中Alexa客户两次重述一个查询。第二次重述得到了正确的响应因此它是初始查询的一个良好重写候选。最终的查询不是重述重述提取模型必须学会区分重述与不相关的查询。我们将重述检测视为跨度预测问题使用BERT最后一层的嵌入输出预测每个令牌是跨度开始或结束的概率。我们还使用时间戳来限制作为重述候选的后续客户请求数量。我们使用吸收马尔可夫链从在广泛交互中重复出现的重述候选中提取重写对。[图示描述跨客户交互的重述序列概率可以用吸收马尔可夫链编码。]马尔可夫链将动态系统建模为状态序列每个状态都有一定的概率转换到其他几个状态中的任何一个。吸收马尔可夫链是一种具有最终状态的链从任何其他系统状态都可以到达该最终状态且转换到其他状态的概率为零。我们使用吸收马尔可夫链来编码在特定交互范围内同一查询的任何给定重述跟随任何其他重述的概率。求解马尔可夫链可以为我们提供任何给定请求最有可能成功的重写。在线重写在线重写机制不依赖于客户自己的重述而是使用检索和排名模型来生成重写。重写基于客户与代理的习惯使用模式。例如在下例中根据客户的交互历史我们将查询“Wilkerson的天气怎么样”重写为“加州Wilkerson的天气怎么样”——尽管在跨交互中“华盛顿州Wilkerson的天气怎么样”是更常见的查询。然而该模型确实同时包含全局层和个人层以防止过度个性化例如推断喜欢Selena Gomez歌曲“We Don’t Talk Anymore”的客户也会喜欢《Encanto》中的歌曲“We Don’t Talk about Bruno”并使模型能够在客户的交互历史提供很少或没有指导时提供重写。[图示描述在线重写模型的个人层考虑了客户上下文而全局层防止过度个性化。]个性化工作流和全局工作流都包括检索和排名模型检索模型使用密集段落检索DPR模型将文本映射到低维连续空间为索引和查询提取嵌入。然后使用某种相似性度量来决定重写得分。排名模型将模糊匹配例如通过单编码器结构与各种元数据结合做出重新排名决策。我们已经部署了所有这些自学习方法——基于BERT和马尔可夫链的离线重写以及在线重写——并且都在提高Alexa客户体验质量方面产生了显著影响。在实验中我们在六个机器标注和两个人标注的数据集上将基于BERT的离线方法与四个基线模型进行了比较它在所有方面都优于所有基线在一些机器标注数据集上改进幅度高达16%至17%而在人工标注数据集上的改进幅度几乎翻倍。使用吸收马尔可夫链的离线方法已经重写了Alexa自动语音识别模型的数千万条输出其胜-负比为8.5:1这意味着每有一个错误的重写就有8.5个正确的重写。最后在一系列针对在线重写引擎的A/B测试中我们发现仅全局重写就能将缺陷率降低13%而添加个人重写模型可进一步减少4%的缺陷。可教学的AI查询重写依赖于客户的隐式信号但客户也可以明确地教导Alexa他们的个人偏好例如“我是勇士队球迷”或“我喜欢意大利餐厅”。Alexa的可教学AI机制可以是客户发起的也可以是Alexa发起的。Alexa主动感知可教学时刻——例如当客户多次重复同一请求或声明Alexa的响应不满意时。客户也可以使用简单的提示如“Alexa学习我的偏好”来发起与Alexa的引导式问答。在任何一种情况下Alexa都可以利用客户的偏好来指导下一次客户交互。故障点定位除了通过查询重写从缺陷中恢复外我们还希望理解缺陷的根本原因。像Alexa这样的对话助手依赖于多个模型按阶段处理客户请求。首先语音触发或“唤醒词”模型确定用户是否在对助手说话。然后自动语音识别ASR模块将音频流转换为文本。此文本传递给自然语言理解NLU组件该组件确定用户请求。实体识别模型识别并解析实体助手使用多个子系统生成最佳响应。最后文本到语音TTS模型将响应渲染为类似人类的语音。对于Alexa而言自学习的一部分是自动确定故障发生时哪个组件发生了故障。上游组件的错误可能通过管道传播在这种情况下多个组件可能失败。因此我们关注以不可恢复方式首次失败的组件我们称之为“故障点”。在我们关于故障点定位的初步工作中我们识别五个错误点以及一个“正确”类意味着没有组件失败。可能的故障点是错误唤醒语音触发错误ASR错误NLU错误例如将“播放哈利波特”错误地路由到视频而不是有声读物实体解析和识别错误以及结果错误例如播放了错误的哈利波特电影。为了更好说明故障点问题让我们检查一个多轮对话[图示描述故障点定位识别处理管道中最早发生故障的点对话代理从中恢复的错误不被归类为故障。]在第一轮中客户试图打开车库门对话助手识别语音不正确。实体解析模型未从此错误中恢复也失败了。最后对话助手未能执行正确的操作。在这种情况下ASR是故障点尽管后续其他模型也失败了。在第二轮中客户重复了请求。ASR犯了一个小错误没有识别出语音中的冠词“the”但对话助手采取了正确的操作。我们会将此轮标记为正确因为ASR错误没有导致下游故障。最后一轮突出了我们方法的一个局限性。用户要求对话助手做三明治这是对话助手目前还做不到的。所有模型都正常工作但用户不满意。在我们的工作中我们不认为这样的轮次有缺陷。平均而言我们最佳的故障点定位模型在不同类别上实现了接近人类的表现92% vs 人类。该模型使用扩展的对话上下文、来自助手日志的特征例如ASR置信度以及决策组件的追踪信息例如NLU模块。我们在结果和正确类别检测方面超越了人类。ASR、实体解析和NLU的准确率在90-95%范围内。结语当计算融入环境我们随意地从房间走到房间指示嵌入式计算设备我们希望它们如何行为的时代可能仍属于未来。但在Alexa AI我们已经在这条道路上走了很远。并且我们每天都在向前迈进。更多精彩内容请关注我的个人公众号公众号办公AI智能小助手或者我的个人博客 https://blog.qife122.com/对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号网络安全技术点滴分享

网站建设原则石家庄网站建设费用

影视网站的设计与实现长春网站排名优化价格

学做点心上哪个网站网站开发+兼职挣钱吗

有没有做试卷的网站网上在哪里注册公司

网站开发建设公司地址宁波网站建设推广平台

做临时网站黄冈市建设工程信息网

有什么网站是学做吃的网站500兆空间多少钱

网站 建设 原则石家庄网站建设费用

影视网站的设计与实现长春网站排名优化价格

学做点心上哪个网站网站开发+兼职挣钱吗

有没有做试卷的网站网上在哪里注册公司

网站开发建设公司地址宁波网站建设推广平台

做临时网站黄冈市建设工程信息网

有什么网站是学做吃的网站500兆空间多少钱

网站建设原则石家庄网站建设费用