广州哪家做网站还可以,公关到底做什么,苏州网站建设介绍,设置网站域名点击观看大咖分享心疼你独自一人承担生活的苦难#xff0c;寂寞夜里陪伴你的只剩无人倾诉的压抑和无处安放的焦虑。养个宠物#xff0c;它却不能get到你的“宠言宠语”。找个伴侣#xff0c;还要浪费吵架的时间和精力。回到家里#xff0c;只能浸泡在“循环唠叨式“母爱的沐…点击观看大咖分享心疼你独自一人承担生活的苦难寂寞夜里陪伴你的只剩无人倾诉的压抑和无处安放的焦虑。养个宠物它却不能get到你的“宠言宠语”。找个伴侣还要浪费吵架的时间和精力。回到家里只能浸泡在“循环唠叨式“母爱的沐浴。当一个人在你身边活的恰到好处的时候就是在成全你做自己这样的人已经出现只是你还不知道而已。现在就教你构建只属于你的智能对话机器人带你找回那个最轻松的自己。 本期腾讯大学大咖分享课程邀请到了腾讯 AI 技术专家叶聪老师分享零代码使用腾讯TBP打造智能对话机器人。叶聪老师是腾讯智能对话平台TBP技术负责人、总架构师带领团队完成了TBP产品的从0到1。前美国亚马逊 AWS 人工智能技术经理负责领导开发了Amazon Alexa 智能语音助手背后的 AI 云服务Lex。 本期课程分为五个部分 做智能对话机器人的缘由 研发痛点和难点 智能对话技术 如何用app构建智能对话 最佳实践案例一、为什么我们要做智能对话从计算机发展至今人机交互已发生巨大变化。第一代的是键盘和鼠标。键盘鼠标帮助整个计算机覆盖了30%的人口。这30%人都可以通过键盘鼠标去操控计算机系失误他想要的信息是拿到他想要的答案第二代的智能交互是触控交互。但它成本高。使用手机阅读新闻发送消息的时候就是人与硬件的交互这种方式已经覆盖了大概2/3的人口剩下的那1/3 就需要智能对话的技术来解决。如果正常对话将来在所有的设备上得到的应用那我们全世界的所有的人不管他在用任何一种语言都可以通过我们的智能对话机器人来操控所有他想要操控的设备去输入所有他想要输入的信息。从此 AI 对话设备将变得无处不在。智能对话无处不在智能对话影响人类生活。目前我们智能对话其实已经深入了生活的各个方面。 包括语音搜索智能硬件语音消息转写语音助手。以及语音输入法。这些东西每天大家都会用到。包括我们左下角的那个是我们的智能音箱。也是现在大家很热衷去研究和使用的一个设备。经调研发现个人用户使用 AI 能力主要原因有3点便捷就是用更快速的方式我们可以去使用到一些ui的能力.高效把复杂的东西利用人工智能变的自动化或者半自动化来减轻我们的整体的工作量。自然能实现和人类的自然交流而不是简单的由人操控实现个人用户AI能力的主要诉求。有些用户主要为了帮公司降本增效。在大量to B 用户中间有很多工作需要人工解决比如人工客服外呼人员还有一些内部管理人员智能问答技术可以部分代替人工的工作。目前来看使用的趋势已经非常的明显在智能客服和智能外呼的领域已经得到了很多客户的认可相关技术在很多to C领域比如公众号小程序的客服上也得到了广泛使用。结合个人用户和企业用户痛难点打造智能对话发展的源泉和根基。首先它能提供自然的交互能力可以模拟人工和人类的交流让用户在使用时不会产生机械交流感的一种真实场景体验。其次是接入场景多样性。赋予机器人在不同场景下提供服务的能力。 二、研发痛点和难点首先需要懂得语言学的基本概念语法搭配。其次需要有高等数学能力。例如举例论证偏微分方程概率论。 同时要有一定的上传能力把算法转变成代码的能力拓展能力等。其次是高维空间的抽象思维能力。工作量大门槛高导致很多人放弃。智能对话的核心技术结构图如下。一个用户在使用对话平台去和基线交流时首先用户的语音素材进来后系统会把语言转换成机器可以理解的文字。然后自然语言理解会识别文字从中提取到适当的意图信息和槽位解析针对已经提取的信息结合对话管理和策略优化能力整合最合适的答案。答案列表用来择优选择最佳回复生成为人类可理解的文字。 最后通过TTS语音合成文字转换成语音呈现给用户这就是一整套流程。左边的部分是由腾讯云智能语音服务支撑的。中间是核心的智能对话平台右边是各类对话模型服务。之前内部大体结构是每个用户的问题进来以后经过自然语言理解核心要素会被分成不同类型。例如任务型闲聊型百科型根据不同机器人的反馈结果会生成一个列表根据用户说这句话的情绪上下文还有一些个性化配置最后生成一个最终答案。整个平台内部机器人的整合和协同合作非常重要。智能对话和自然语言理解中两个核心要素意图和槽位。意图反应用户需求在对话系统中每一个意图都与现实世界中的某个需求点对应。指完成一个目的与机器人对话发出的指令就是意图。意图的类型也有不同简单的意图如左图。多级意图是分层的在实际应用中我们也会对机器意图有人工干预比如一些敏感词等让机器人人性化的同时避免敏感词汇。目前来说 每一个模型只在某一个特定场景下实现效果相对较好。既然算法没有特别完美所以需要通过一些半人工的方法帮助他优化主动学习就是app也是非常重要的一点。机器本身会内建这样的能力人工定期梳理。用机器人命中和命中的case核心是去抽取值得用户标注的信息用户使用简单选择意图的这个分类这个说法就会自动添加进去。机器人在下一次用户再说一个类似词汇时就会100%的命中。一个很核心的概念是槽位英文是slot是指从句子中抽取出的特定概念它包含最核心的信息。例如我想去北京北京这个名词是一个地点这个中国城市这就是一个槽位信息。在槽位信息中相关内容例如地名就是槽位中间的内容我们一般把关焦作词典。机器人在获取用户输入信息的过程英文叫填槽Slot Filling。填槽就是把用户输入的信息中间核心要素转换成机器人能够理解的语言提取出来。填槽过程中难点有很多。首先一个很传统的填槽方式是基于规则的天桥。就是设定一个模板比如假设一个订机票的机器人。机票的机型首先要提取到就是出发地和目的地。这两个信息可以根据规则填上去来解决。把它抽象成一个规则就弱了用户的输入可以持续套用然后提取出相关信息但实际上也会造成很多问题因为我们体育部的最优和全局的自由是不一样的过多的模板会产生串扰比如同一句话同时满足多个模板很难判断用哪一个几乎没有很好的解决方式而且随着规则越来越多维护成本升高加入新规则时很难保证不破坏原有规则以及一些特殊情况。所以出现了将实体识别作为填槽结果。这是目前广泛使用的一种方式。但仍然会造成一些问题。例如假设用户说我想去听七里香中的借口。从人的角度来讲这句话是容易理解的。但是对机器来说不然里面是有好多种可能性的。它提取到了七里香和借口这两个信息但同时它有可能是专辑名或者是歌曲名。此时并不能简单的把前面那个词汇当做专辑名而后面的当做歌曲名因为用户有可能换词汇的表达顺序这样结果是颠倒的。所以如果只是使用规则填槽的话我们就需要海量的槽。为了适配做一种很简单的场景可以明显知道是得不偿失的。所以要前一种更好的方式就是将实体识别作为嵌套的结果但是同时要考虑这些槽位之间的关系。比如如果七里香是个专辑名那歌曲名就只可能是接口反过来也是一样。利用这种方式能够将词典和模型识别的实体结果一起做排序能够减少模型错误所带来的影响。同时会连接一些外部的知识库。比如特定的用户还有一些外部的知识点和其他用户是不一样的我们做的时候也可以把这些外部的兴趣加入总的模型里面再做排序这就比原先的排序结果更准确也更适合这种场景。例如它得出的是一个分数可以理解为我们会用它来做排序但它不是准确率只是一个相对分数用它来排的那一种结果是最可信的。另一点就是从用户的说法中去提取有效信息相对关系只是其中的一种。如果想要更多的信息让这个软件更加科学还有更多的信息可以抓取。将两三个词建立一种关联关系还有槽位的长度。可以认为如果一个槽位的长度越长它被识别的可能性会越高槽位的长度如果越长得到真实信息的概率就更大。比如大辞典中的两个小词典如果一句话同时都命中了就要考虑它们之间的互相包含这样也可以帮助我们把排序变的准确最后用不同语言模型的分数进行综合。可能训练的多个模型会利用模型之间的一些不同的特性最后会整合出一个结果。接下来统一把这些点全部提取出来这样可以将他们封装到一个统一的网络。Feature Extract就是特征提取的接口不需要单独为某一种情况设置一个接口和模型非常方便一切在平台内部的用户在使用时不会有感知但实际上内部已经把所有的因素全部考虑进来了。联合排序的模型使意图的和槽位可以相互联动一组槽位的整体全局最优解是最活跃的。我们可以给出Ranking的联合模型。意图识别大概分几个步骤首先根据不同的意图或生成候选的。其次根据后台的结果提取出特征。再次根据不同的模型生成的特征进行一个联合排序最后生成一个最终的结果。目前根据测试结果显示这种方式展现的效果会非常好。而且它的性能也非常高在对整个机器消耗不大的情况下下面的结果已经接近了最好的效果。如果已经提前知道了意图它就会对用户的话语打上了一个意图我们知道哪个意图命中的是正确的然后再计算分数。而模型是我们不知道意图是什么让它先匹配意图再通过综合的排序方式生成最后的结果。这两种方式中因为算法几乎接近了预知意图的效果。要找到两句话的相似性比如再想变更意图的时候、用户说法不精准时如何获取用户的言语和配置意图是否一致由于我们的说话是经过很长时间训练的而且平时生活中使用的那一种语言容易理解两句话可能语境不一样、倒叙的话可能是同样的意思人可以理解但是机器就很难。例如你是谁我是谁这个看起来我们理解是完全不一样的但是机器找不出明显区别都是再问是谁所以很大程度上来说这两句话在机器来看是一个意思。简单的使用Word Embedding这种方式我们认为结果是类似的但实际上并不类似。再尝试使用蓝山网络。网络就是用户的一个因素进来以后可以认为是两个相似的模型。不同的模型体现出不同的特征最后结合这两个特征调整他们的权重。利用这种方式使模型提升准确率更加智能化。除了兰生网络还有CNN神经网络。从最开始按照这个CNN替代整体训练速度。模型响应时间小于50毫秒。如果使用传统的爱人它的性能一般会在100到200毫秒之间达不到要求这也是为什么会有优化动力不断去铺时这样的app能的边境。为了优化差异我们做了不同的尝试例如不同尺度的卷集合。然后通过大量测试发现虽然贝斯的解决方案。模型效果是不错的也是常见使用的。除此之外还有更深层的就是使用一种剪辑和通过简单的深度叠加来提取更多尺度的信息。挖掘对话深层兴趣的方法。不仅是网络结构的增加文林白领和china办理就是。问词语的一些白领和文字的明白点混合使用质量方式可以避免假设一个词不在我们的四点钟。因为四点是有限的就会去找关于他的文字信息可以对他进行猜测和匹配总体来说它可以让我们的机器人模型变得更聪明。自然语言理解的过程就是机器如何能够理解我们人类说话的从中提取有效信息的其实智能对话整个的嗯整个的carburetor非常大除了自然语言理解还有包含对话管理和人员生成三、DM是什么?当我们和机器人交流时为生成一个回复他需要了解我们。需要机器人保留对话状态dollslove中间状态的管理整个模块叫做店。DM是在维护计划状态的同时协助支持系统生成决策。作为接口和后端任务进行交互比如假设用户是要调动一些技能或者是要靠第三方服务的对话管理要知道触发这个行为的x提供语义表达的一个期望值必须把整个回复完全生成最后回复给用户。用户的上下文和他语义核心表达加在一起进入我们的DMDM决定下一步操作。树和有限状态机的解决方案每当我们机器人聊天都是在他的一个数中间不断地转跳。或者是途中进行转跳我们现在这个状态如果上下文是这样他就会到另外一个状态。机器人就是在途中不断转跳。 这个概念已经有很多年了但大家都还没完全攻克目前有很多团队开始回归到supports尝试利用数形和游戏状态机的方式解决并且效果还不错。经过12年supported人类在研究盆子都被supported这里有一些比如对话吉田草只是把用户的对话当做是给我们提供信息的一种方式然后我们就尽量的从中提取earthquake这样的信息然后供给槽位。快乐引擎我们现在评估都是通过感性的评估就是找不同的人用同样的话测试模型。目前大部分的模型是没有办法很理性的去指导的所以训练好的模型如果不去试一试是不知道他的回复的。但如果用了星期论的方法我们其实就能确定他的回复是应该是这个还是有意义的。目前最流行的一些方式就是统计学的方式只要体育课vip客户这个跑ssf这个pos系统包括目前很多人在研究的学习就reinforcement。400的方法小孩学习有什么好处呢就是当用户输入的时候有很多不确定的信息是用户未必会按照我们想的方式。使用我们的对话。怎样能够用不确定信息找到合适方法建模呢有人想到了强化信息对抗网络方式让模型不断学习同时不断净化自己。这种方式的好处是我们可以把这些不确定性也一起考量了模型会变得更聪明。这也是个很好的研究方向大家如果对最快有研究的话寻找课题的可以看reading这部分的发展。为什么要打造腾讯智能对话平台就很产品因为整个智能对话不涉及的技术太多了而且都有一定的门槛希望AI深入到各个行业最好的方式就是简化环节提高大家使用能力。智能对话技术统一对外出口叫做对话机服务就是希望大家可以通过简单的配置开箱就可以用。整个俱全开发的全流程大概分这几步流模型就定义 在控制台上输入简单信息四个服务自动阅读模型自动变成模型不需要懂深度学习是也不用写任何代码它会自动帮你把模型去申请好。提供给网页模拟器小程序和公众号进行测试和统一当一切ok的时候点击一键点击。就可以发布到公网上给所有人使用。没有版本管理使用时海量连接窗口微信的公众号小程序企业微信还有各种h5的解决方案是深度整合的几乎只要把一些链接token放到平台上配置一下就可以做到一键接入比如像公众号只要扫码就可以关联上公众号成为公众号的智能助手。上线以后我们会提供一个数据中心的功能中心会显示之前运行的所有状态相当于测量差的倾向和脉搏。主动学习的机率也会在数据中呈现不断的优化你的路线。这一切都是建立在不需要非常理解智能对话的前提下使用就可以了。平台的全景图大概分三层一 针对一些核心技术比如模型算法意图识别槽位收取等包括多伦知识图谱。 中间一层是平台配置中心。里面分几个部分比如针对开发者的多渠道发布。可以一键发布到小程序公众号移动的h5网页物联网设备等。 底层是海量的机器人中间件的能力包含多种类型例如闲聊型问答咨询文档型基本所有常见的机器人平台都是经包含并且可以支持。 同时还有海量的个性化和人性化的开发工具。最上面那一层是核不同行业客户还有部门合作的一些解决方案现在主动拓展的有金融教育生活服务酒店旅游。智能对话平台也改变了开发流程最重要的就是简化流程提高效率比如内置一些信息像是需要使用一个全国城市的词典或者是某行业的词典有内置的可以直接通过一键选择使用。机器人一键开发以后可以在不同端同时使用几乎所有源的sdk可以集成到小程序这些都会关联到同一个机器人上。整体的解决方案通过扫码就可以接入。四、怎样在tv上创建第一个机器人通过可视化对话的配置平台只需要在这个平台上面输入一些简单的信息就可以完成兑换。当用户说哪一句话或者类似话语时会进入。如果当他的说法和配置说法接近程度相似度达到一定程度的时候就会认为他命中所以不并不需要他是完全吻合的。当说法命中以后除了我们提取用户信息还可以进行第三方调用就是vs的配置的调用和回条复杂场景时比如当开发者希望回复店面信息然后进入下一轮的话的时候我们的平台也是很好的支持。例如任务型问法问答型机器人看到时我们可以配置一些相似问题和答案通过一键扫码的方式就可以用小程序或者公众号的智能客服。在客服中间机器人同时可以和客户进行闲聊比如同时接听和对话两个人然后完成一个多轮对话的任务比如像订机票在任务中间如果当用户有问题的时候他可以跳脱出人用qq问答精选回复一些问题比如左边的托运行李的费用可以显示出问答齐全对用户来说他完全不知道实际上在调哪种能力。为提高体验效果让开发者可以更快的配置左边是槽位。槽位光亮就是当用户让配置用户刷卡的时候理论上如果允许从用户说法中提取一些槽位信息需要用户在户收卡上面标注出来标注这是一个槽位当用户收到帮我订到北京的机票时说北京是个地址这个过程非常繁琐平台已免去此过程。当用户配置完所有想要四点以后不是选择内置四点以后只要简单的输入非常自然的游戏比如帮我订到北京机票这本来不能做为一个说法的但是我们会和智能引擎去判断如果发现未替换成草用户只要输入自然的语言或者导入一个海量语言就自动把它练草字全部标注上。这大大提高了用户配置齐全的速度。人们如何体验大部分对话类似的产品都是用从控制台上去体验这种方式呢依托于腾讯的生产微信很好的整合可以在腾讯智能化平台体验小程序上非常容易的登录云账号随后即可显示所有在同样银行创建的机器人都会自动关联就可以通过小程序去测试去体验刚刚配置好了这个机器并且经济可以转化的经转发分享获取资源和平台。除了平台本身我们还提供海量波特被子中间件的能力我们的机全都能力底层的比如任务型atqq点凹形知识图谱文档型都可以通过平台对外进行输出如果只是想要单一能力的用户比如想要接一个闲聊型中用户也可以直接通过我们的平台获得这个能力。关键指标开发者需要有一个客观的认识目前我们所有的任务识别的准确率包括sq深度学习模型的命中准确率都超过95%行业知识库已经积累了超过10万个。任务型的延迟和ip的延迟都会小于100毫秒。性能还在持续优化最终会把它优化到小于50毫秒综合来说性能非常优异包含海量的数据顶尖的算法丰富的经验最优化的接触体验。客户源也有很多。旅游时会用到小程序其实背后就是使用第一批的对话能力。同时还有文理类差旅类的这样的案例包括春秋航空深航的订票助手。还有香格里拉酒店的对话机器人它可以帮助你订房间预约出行和控制房间的设备。金融类包括中国银行光大银行中信银行减轻了人工客服的压力。问卷为了给广大开发者提供最实用、最热门前沿、最干货的视频教程请让我们听到你的需要感谢您的时间点击填写 问卷腾讯云大学是腾讯云旗下面向云生态用户的一站式学习成长平台。腾讯云大学大咖分享每周邀请内部技术大咖为你提供免费、专业、行业最新技术动态分享。