金融行业标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111267287.0 (22)申请日 2021.10.28 (71)申请人 上海嬉燃科技有限公司 地址 200030 上海市徐汇区裕 德路126号氪 空间2005室 (72)发明人 龚渠成 潘其威 臧雨晨  (74)专利代理 机构 北京知果之信知识产权代理 有限公司 1 1541 代理人 高科 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/33(2019.01) G06F 40/30(2020.01) G06N 20/00(2019.01) (54)发明名称 用于聊天的数据处 理方法以及相关装置 (57)摘要 本申请公开了一种用于聊天的数据处理方 法以及相关装置。 该方法包括接收用户输入的聊 天内容; 基于多轮对话内容, 在识别所述聊天内 容中存在目标信息的情况下, 保存 所述目标信息 至预设记忆系统; 响应于基于所述聊天信息的数 据请求指令, 调用所述预设记忆系统中的记忆信 息并通过预设机器人对话系统生成符合当前语 境的与所述记忆信息关联的对话聊天内容。 本申 请解决了对于聊天的数据处理效果不佳, 无法更 好地满足自然语 言处理的技术问题。 通过本申请 将长短期记忆内容与自然语言处理结果融合后 提升用户聊天体验。 本申请适用于聊天应用。 权利要求书3页 说明书15页 附图4页 CN 114003702 A 2022.02.01 CN 114003702 A 1.一种用于聊天的数据处 理方法, 其特 征在于, 包括: 接收用户输入的聊天内容; 基于多轮对话内容, 在识别所述聊天内容中存在目标信息的情况下, 保存所述目标信 息至预设记忆系统, 其中, 所述预设记忆系统为基于多轮对话使用多组数据通过机器学习 训练得出 的, 多组数据中的每组数据均包括: 基于 自然语言的对话数据以及所述对话数据 的语义标签; 响应于基于所述聊天信 息的数据请求指令, 调用所述预设记忆系统中的记忆信 息并通 过预设机器人对话系统生成符合当前语境的与所述记忆信息关联的对话聊天 内容, 其中所 述预设机器人对话系统中至少包括虚拟聊天角色。 2.根据权利要求1所述的方法, 其特 征在于, 所述预设记 忆系统还用于: 基于多轮对话内容, 识别所述聊天内容中是否存在属于短期记 忆的目标信息; 和/或, 基于多轮对话内容, 识别所述聊天内容中是否存在属于 长期记忆的目标信息; 和/或, 基于多轮对话内容, 识别所述聊天内容中是否不存在关键记 忆信息。 3.根据权利要求2所述的方法, 其特征在于, 所述响应于基于所述聊天信 息的数据请求 指令, 调用所述预设记忆系统中的记忆信息并通过预设机器人对话系统生成符合当前语境 的与所述记忆信息 关联的对话聊天内容, 其中所述预设机器人对话系统中至少包括虚拟聊 天角色, 包括: 响应于基于所述聊天信 息的数据请求指令以及多轮对话内容, 在所述预设记忆系统中 检索匹配出所述属于短期记忆的目标信息或者所述属于长期记忆的目标信息, 并基于动态 提示的模式通过预设机器人对话系统生成符合当前语境的与所述记忆信息关联 的自然语 言对话聊天内容, 以通过所述虚拟聊天角色与所述用户进行对话, 其中所述动态提示至少 包括如下之一: 所述虚拟聊天角色对所述用户的所述短期记忆、 所述长期记忆, 所述长期记 忆与所述短期记忆分开存储, 所述预设记忆系统与所述预设机器人对话系统两者用于 分别 处理所述用户聊天的数据; 响应于基于所述聊天信 息的数据请求指令以及多轮对话内容, 如果识别出不存在 关键 记忆信息, 则通过预设机器人对话系统生成符合当前语境的与所述记忆信息关联的自然语 言对话聊天内容。 4.根据权利要求2所述的方法, 其特征在于, 所述响应于基于所述聊天信 息的数据请求 指令, 调用所述预设记忆系统中的记忆信息并通过预设机器人对话系统生成符合当前语境 的与所述记忆信息 关联的对话聊天内容, 其中所述预设机器人对话系统中至少包括虚拟聊 天角色, 包括: 响应于基于所述聊天信 息的数据请求指令以及多轮对话内容, 在所述预设记忆系统中 实时检测 生成的所述对话聊天内容与所述预设记忆系统中的历史对话记录的的短期记忆 和/或长期记 忆是否存在冲突; 若存在内容冲突, 则调用所述预设记忆系统中的记忆信 息并通过预设机器人对话系统 调整得到符合当前语境的与所述记 忆信息关联的自然语言对话聊天内容。 5.根据权利要求1所述的方法, 其特 征在于: 所述接收用户输入的聊天内容之前, 还 包括: 接收用户通过社交账号选择的至少一个虚拟聊天角色的选择指令, 其中所述虚拟聊天权 利 要 求 书 1/3 页 2 CN 114003702 A 2角色至少包括如下之一的定制化属 性特征: 故事剧情、 语言风格、 角色性格, 所述故事剧情 用于建立所述虚拟聊天角色与预设故事剧情的关联属性, 所述语言风格用于表征所述虚拟 聊天角色的预设聊天属 性, 所述角色性格用于表征所述虚拟聊天角色的预设人设属 性, 所 述虚拟聊天角色用于在聊天过程中根据对所述预设故事剧情、 所述角色性格以及所述语言 风格动态调整 预设自然语言处理模型以使对话聊天内容符合预先定制化设置进行模仿, 所 述社交账号的唯一身份标识与所述至少一个虚拟聊天角色绑定; 响应于所述选择指令, 并确定当前拟进行聊天的所述虚拟聊天角色; 所述接收用户输入的聊天内容之后, 还 包括: 基于所述虚拟聊天角色以及所述预设自然语言处理模型生成符合当前语境的开放性 场景对话聊天 内容, 其中所述聊天内容用于在用户与所述虚拟聊天角色聊天过程中实时动 态切换, 以符合所述虚拟聊天角色的所述语 言风格, 和/或所述角色性格, 和/或所述 故事剧 情, 和/或所述用户意图; 将所述符合当前语境的聊天内容发送至所述社交账号对应的终端。 6.根据权利要求1所述的方法, 其特征在于, 所述基于多轮对话内容, 在识别所述聊天 内容中存在目标信息的情况下, 保存所述目标信息至预设记忆系统, 其中, 所述预设记忆系 统为基于多轮对话使用 多组数据通过机器学习训练得出的, 多组数据中的每组数据均包 括: 基于自然语言的对话数据以及所述对话数据的语义标签, 包括: 基于多轮对话内容, 在进行自然语言处理 的同时通过所述预设记忆系统识别所述聊天 内容中是否存在属于用户长期记忆的目标信息, 其中所述用户长期记忆的目标信息基于所 述多轮对话内容进行识别得到且与所述用户一一对应, 所述用户长期记忆用于根据用户在 所述预设记 忆系统中保留并更新; 如果不存在, 则进行自然语言处 理并不保存; 如果存在, 则单独保存所述用户长期记忆的目标信 息至预设记忆系统并将所述用户长 期记忆的目标信息作为用于 机器学习训练时使用的基于自然语言的对话数据。 7.根据权利要求1所述的方法, 其特征在于, 所述基于多轮对话内容, 在识别所述聊天 内容中存在目标信息的情况下, 保存所述目标信息至预设记忆系统, 其中, 所述预设记忆系 统为基于多轮对话使用 多组数据通过机器学习训练得出的, 多组数据中的每组数据均包 括: 基于自然语言的对话数据以及所述对话数据的语义标签, 包括: 基于多轮对话内容, 在进行自然语言处理 的同时通过所述预设记忆系统识别所述聊天 内容中是否存在属于用户短期记忆的目标信息, 其中所述用户短期记忆的目标信息基于所 述多轮对话内容进行识别得到且与所述用户一一对应, 所述用户短期记忆用于根据聊天时 间周期在所述预设记 忆系统中覆盖后并更新; 如果不存在, 则进行自然语言处 理并不保存; 如果存在, 则单独保存所述用户短期记忆的目标信 息至预设记忆系统并与 所述虚拟聊 天角色关联并将所述用户短期记忆的目标信息作为用于机器学习训练时使用的基于 自然 语言的对话数据。 8.一种用于聊天的数据处 理装置, 其特 征在于, 包括: 接收模块, 用于 接收用户输入的聊天内容; 识别模块, 用于基于多轮对话内容, 在识别所述聊天内容中存在目标信息的情况下, 保权 利 要 求 书 2/3 页 3 CN 114003702 A 3

.PDF文档 专利 用于聊天的数据处理方法以及相关装置

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 用于聊天的数据处理方法以及相关装置 第 1 页 专利 用于聊天的数据处理方法以及相关装置 第 2 页 专利 用于聊天的数据处理方法以及相关装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:03:17上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。