当前位置:K88软件开发文章中心编程资讯编程资讯07 → 文章内容

竹间智能CTO翁嘉颀:如何打造主动式对话机器人 | 吃瓜笔记

减小字体 增大字体 作者:华军  来源:华军资讯  发布时间:2019-2-11 18:03:44

会下雨”,而且可能还有一些基本的上下文,“明天上海会不会下雨?那后天呢?”,可不可以问股票?可不可以听音乐?可不可以叫机器人讲笑话?或者请机器人帮我打个车,帮我订酒店,帮我订外卖,这个都是功能、技能的部分。知识图谱知识图谱是少数机器人可以赢过人的部分。知识图谱的最基础是三元组,三元组就是“A的B等于C”。比如知道姚明的身高是2米26,姚明的老婆是叶莉,姚明的体重是140公斤,姚明打过球队是哪几支?姚明的生涯最高分43分,也知道叶莉的身高是1米9。除了这些基础信息之外,知识图谱可以做推论,像一阶层的推论,姚明的老婆有多高?我知道姚明的老婆是叶莉,叶莉的身高是1米9。那可不可以做两个阶层的推论?比如谢霆锋跟陈小春有什么关系?那这个我们通常不知道,但在知识图谱里面,知道谢霆锋的前妻叫张柏芝,陈小春的前女友也是张柏芝,所以陈小春是谢霆锋前妻的前男友,这是二阶层的推论,可以推论出来。可不可以再做多阶层的推论?例如说陆奇加入百度之后,股价到底涨还是跌?那要先要知道陆奇是谁?什么时候加入百度的?百度那时候股价多少钱,现在股价多少钱,那到底涨还是跌,那是涨了百分之多少?人脑不会记得这么多事情,但机器人可以,所以这是机器人有机会赢过人的部分。作为人是没有办法看了公司的一些差旅的规定,休假的规定,就回答所有的问题,因为有无穷多的问题要问——我去了北京,我要订酒店,我只能订公司的协议酒店吗?那协议酒店不太好,我可不可以自己加钱,订好一点的酒店,可以还是不行?那公司的差旅规定,机器人读完之后,它能帮你回答公司内部的员工这些说的问题。当然更长一点的阅读理解目前还做不到。它不可能读完整篇金庸的小说,最后有能力来回答说谁的武功最高?这个目前机器还差得非常远。对话主题除了知识图谱以外,再往下看对话的主题,这也是人机交互一个最主要的部分。通常对话主题是有阶层关系的,例如我问“你喜欢英超哪支球队?”,“你喜欢英超哪支球队?”这是运动里面的足球里面的五大联赛里面的英超。那我回答“其实我喜欢巴萨”。你问我英超,但是回答是巴萨,这在人跟人的对话里面,可能是OK的,因为它的主题并没有偏离太远。那我回答说“其实我喜欢看NBA”,你问我足球,我回答是篮球,这个对话主题偏离得比较远了,但是也不是完全不行。但至少我不会回答“我喜欢吃蛋炒饭”,这肯定是不行的,因为连最大的阶层主题都不对了。另外可不可以在主题上做一些主动式的引导。今天机器人知道我喜欢看F1,所以今天在跟它聊天的时候,它可能不知道怎么回答,但它跟我说“我不太理解你的意思,但是上海的F1快要开赛了,你今年要不要买票?”所以这个机器人是不是有机会主动去跳转话题,原本聊的话题万一聊不下去了,除了投降以外,能不能主动地去引导话题?它根据你前面讲过的话,根据对你的记忆,你喜欢什么?不喜欢什么?根据你的这个人的user profile,你的用户画像,它可不可以这么做?甚至机器人不再是被动的,不是永远说有人来问问题它才回答,它可以主动式地推荐,会说“今天NBA什么时候重重播,你要不要看?”因为早上在上班,你可能看不了。上下文理解上下文的理解,这也是一个重点,我们基本上不会每次都讲一个完整的句子。举个例子,我的问句都是“那后天呢?”,但是“那后天呢?”代表什么意思要看我的上下文。“明天我们去看电影好不好?”“不行,明天有事。”“那后天呢?”“那后天呢?”代表说后天我们去看电影,好不好?“明天上午会不会下雨?”“会,明天上海小雨,气温几度到几度。”“那后天呢?”这个就代表后天上海会不会下雨?这是过去的那种指代消解,或者是主谓宾的缺失,因为这句话缺了主词或者缺什么词,所以去上面的句子把这些缺的信息把它拉下来。另外一种是用对话主题式的方式:“你们有卖净水器呀?”“有啊”“它占不占地方啊?”(目前对话主题是净水器)什么东西占不占地方?净水器占不占地方。“怎么卖呀”什么东西怎么卖?净水器怎么卖。因为现在对话主题是净水器。用户突然说“你们信用卡目前有促销活动吗?”,我的对话主题从净水器跳到信用卡了,那这是我后面的对话,上下文又可以根据这个信用卡,这个会比较像人的正常交流。至少不会像右边的这个,我可能问“我要买什么样的T恤?”,然后它给我三件,那我跟它说“要黑色的。”,因为没有上下文,它就根本听不懂在讲什么,它就跟我解释说黑色的定义是什么?让人一看就觉得你这个机器人很笨。所以上下文理解也是一个机器人要做到最基本功能之一,因为人不会每次都讲完整的句子。长时记忆和短时记忆机器人可不可以记得你喜欢什么?你不喜欢什么?如果我是你的朋友的话,我总是要主动避开你不喜欢的话题,让你喜欢的话题去接近你。所以说你不会有一个朋友是那种失忆症的患者,你每次跟它讲话都跟游戏的NPC一样,它完全不记得你是谁,只有机械式的回答。我跟它说我不喜欢吃辣的,我喜欢大张伟,它可不可以记得?两个月以后再问说“附近有什么餐馆?”,川菜跟湘菜就不应该出现了。我跟它说“来一首我喜欢的歌吧”,它知道我喜欢大张伟,就会放大张伟的歌给我听。我住在上海,它记得了,所以当我问后天会不会下雨,指的可能就是上海后天会不会下雨。这是长时记忆,基本上不太会变。短时记忆又是另外一个,比如我明天要去苏州见张先生,等下去超市要买牛奶,等下去超市我还要买鸡蛋。到了晚上我要回家的时候问机器人,“去超市我到底要买什么?”,它能告诉我是牛奶跟鸡蛋。所以这个短时记忆大概48小时到一周,之后就可以把它洗掉。自然语言理解的重要性接下来讲到NLU(Natural Language Understanding,自然语言理解)的重要性。我们公司在NLU上做的东西也比较多。中文分词:“我在黄浦江边”,应该分成“黄浦”跟“江边”还是分成“黄浦江”跟“边”。分词是一切东西的根本,分词分错了,后面也不会对。词性标注,这个词到底是名词、动词、形容词还是副词?关键词是什么?人称实体:是第一人称、第二人称还是第三人称。言外行为:我说“等一下我们去吃麦当劳好不好?”,这句话是Question for Opinion,我在询问你的个人意见,所以通常你的回答可以是一个肯定句或者是一个否定句,或者是反问我一个问句,“那我们几点去”,这

上一页  [1] [2] [3] [4]  下一页


竹间智能CTO翁嘉颀:如何打造主动式对话机器人 | 吃瓜笔记