金融行业标准网
ICS 33.030 CCS M21 YD 中华人民共和国通信行业标准 YD/TXXXXXXXXX 基于表述性状态转移(REST)技术的业务能 力开放应用程序接口(APDAI语音业务管 理及控制 RESTful based service capability open API AI speech service management and control (报批稿) XXXX- XX- XX 发布 XXXX-XX-XX 实施 发布 中华人民共和国工业和信息化部 YD/T XXXXX-XXXX 創言 前 本文件按照GB/T1.1一2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定 起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。 本文件由中国通信标准化协会提出并归口。 本文件起草单位:中讯邮电咨询设计院有限公司、中国联合网络通信集团有限公司、中国电信 集团有限公司。 本文件主要起草人:王至柔、陈浩然、王瑶、谢攀、赵晨斌、高宇昊。 II YD/T XXXXX—XXXX 基于表述性状态转移(REST)技术的业务能力开放应用程序接口 (APDAI语音业务管理及控制 1范围 本文件规定了基于表述性状态转移(REST)的针对AI语音业务管理及控制的API接口定义,包括 接口数据结构,接口定义和接口安全要求。 本文件适用于提供AI语音业务管理及控制的应用程序接口。 2规范性引用文件 下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。 凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 YD/T2423-2012 基于表述性状态转移(REST)技术的电信业务能力开放平台技术要求 IETF RFC 7231 超文本传输协议(HTTP/1.1):语义和内容(HypertextTransferProtocol (HTTP/1.1): Semantics and Content) OMA 网络应用程序接口(API)授权框架(AuthorizationFrameworkforNetwork OMA-ER-Autho4API-V1_0 APIs) OMA 基于表述性状态转移(REST)技术的网络应用程序接口(API)通用定义 OMA-TS-REST_NetAPI_C (Common definitions for RESTful Network APIs) ommon-V1_0 3术语、定义和缩略语 3.1术语和定义 下列术语和定义适用于本文件。 3.1.1表述性状态转移representationalstatetransfer 一种针对网络应用的设计和开发方式,指的是一组架构约束条件和原则,可以降低开发的复杂性, 提高系统的可伸缩性。 [来源:YD/T2423-2012] 3.1.2 2Web服务Webservice 1 YD/T XXXXX-XXXX Webservice是一个平台独立的,低耦合的,自包含的、基于可编程的Web的应用程序,可使用开 放的XML(标准通用标记语言下的一个子集)标准来描述、发布、发现、协调和配置这些应用程序,用 于开发分布式的互操作的应用程序。 3.1.3通知通道notificationchannel 一个在客户端请求下创建的通道,用于服务器向客户端发送通知。该通道被表示为一个资源,该通 道为服务器发布通知和客户端通过发送机制接收通知提供不同的方式。 3.1.4通知服务器notificationserver 一个具有创建和维护通知通道能力的服务器。 3.1.5客户端侧通知URLclientsidenotificationURL 一个由客户端发布的HTTPURL。它用于客户端接收和订阅通知。 3.1.6服务器侧通知URLserversidenotificationURL 一个由通知服务器发布的HTTPURL。它用来标识一个通知通道并可被客户端用于订阅通知。 3.2缩略语 下列缩略语适用于本文件。 API 应用程序接口 ApplicationProgramming Interface ASR 自动语音识别技术 Automatic SpeechRecognition HTML 超文本标记语言 Hyper Text Mark-up Language HTTP 超文本传输协议 Hypertext Transfer Protocol JSON JavaScript对象表示法 JavaScript Object Notation NLP 自然语言处理 Natural Language Processing REST 表述性状态转移 REpresentational State Transfer SDP 会话描述协议 Session Description Protocol SIP 会话开始协议 Session Initiation Protocol TS 技术规范 Technical Specification TTS 从文本到语音 Text To Speech URI 统一资源标识符 Uniform Resource Identifier URL 统一资源定位符 Uniform Resource Lcator XML 可扩展标识语言 eXtensible Markup Language XSD 可扩展标识语言架构定义 XML Schema Definition 4AI语音业务管理及控制业务特征概述 2 YD/T XXXXX—XXXX ASR TTS NLP 引擎层能力调用接口 AI外呼系统 AI客服系统 人工客服系统 AI坐席辅助 AI外呼接口 AI客服接口 坐席辅助接口 语音通信 语音通信 音视频通信 坐席服务质检 AI质检接口 音视频中继网关 AI质检系统 SBC () () 运营商网络 · 用户 用户 用户 图1AI语音业务与运营商网络的关系 如上图1AI语音业务与运营商网络的关系图所示,AI外呼系统和AI客服系统通过音视频中继网关 与运营商网络相连接,从而实现触达用户的业务场景。AI坐席辅助系统和AI质检系统与人工客服系统 相连接,为企业人工客服提供AI应用服务。 a)AI语音引擎层原子能力提供,包含ASR、TTS、NLP等; b)AI语音业务能力提供,包含以下四项: 1)AI外呼:使用标准话术,针对分配而来的不同场景进行批量合规化语音外呼操作,成功 解决了语音外呼中的质量保证及效率提升的问题,结合多样化的外呼场景进行智能语音 交互,构建外呼机器人; 2) AI客服:针对来电场景,应用AI语音技术技术,自动识别和理解用户的自然语言中包含 的准确业务需求,处理企业日益增长的信息咨询、电话交易和服务需求,拓展及丰富企 业的对外服务渠道,提供更快捷的客户服务响应能力; AI坐席辅助:对客服人员和用户通话过程进行实时分析,提供实时业务指导和监控管理 3 的一体化解决方案。帮助客服人员快速准确的回复客户,而且可以实时提醒客服人员在 通话过程的服务情绪、语速等检测,注意服务细节,提高服务技能,提供高质量的业务 服务。同时管理人员还能对客服服务过程进行实时的查看和监管,即时了解当前的服务 情况,降低运营风险,提高管理效率: 4) AI语音质检:AI语音质检可以检验人工坐席的客服人员话术是否规范统一,语速语调是 否合规,语言间的前后逻辑是否准确,违禁词敏感词是否规避;即通过机器的手段来检 测客服人员服务过程、监督客服人员是否按照规定进行服务、是否妥善解决客户问题等。 同时还可甄别客户情绪,当识别到客户投诉意图时,及时记录反馈,便于进行后续的补 偿措施。 3 YD/TXXXXXXXXX 5引擎层接口定义 5.1语音识别(ASR) 5.1.1 请求方式 POST 5.1.2 请求头部 请求头部参数见表1。 表1请求头部参数 参数 类型 必选 说明 string Content-Type 是 application/json string X-Hci-Access-Token 是 从get-access-token接口获取的令牌 String X-Tenant-Id 否 租户ID 5.1.3包体 其它参数都放在包体里,以json形式提供, 请求包体参数见表2 表2 请求包体参数 参数 类型 必选 缺省 说明 config object 是 识别配置信息 要识别的语音数据,base64编码 string 是 audio 要求base64编码后大小不超过4M,音频时长不超过1分钟。 客户端设置的信息串,服务器端只做记录,或将来作为定制版本的 extralnfo string 否 空 一些特殊信息 客户端设置的信息串,服务器端记录详细记录或者音频文件时会作 为文件名的一部分,以便将来和客户端的信息关联。 recordld string 否 空 只能包括数字、大小写字母、下划线。其它字符在作为文件名时会 被转为下划线,最长64字节,超过会被截断 string userld 否 用户Id,如果使用用户资源时需要给出 Config的结构见表3。 表3config的结构 参数 类型 必选 缺省 说明 参数集名称 profile string 否 DEFAULT 缺省为DEFAULT,表示缺省参数集 audioFormat string 香 AUTO 音频数据格式,取值参见下面的audioFormat取值表格。 nbest number 否 候选结果数量,可以为1至10之间的数字 bool 否 false 是否输出拼音 outputPinyin 4 XXXX—XXXXX 1/

.pdf文档 YD-T 6464-2025 基于表述性状态转移 REST 技术的业务能力开放应用程序接口 API AI语音业务管理及控制

文档预览
中文文档 66 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共66页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
YD-T 6464-2025 基于表述性状态转移 REST 技术的业务能力开放应用程序接口 API AI语音业务管理及控制 第 1 页 YD-T 6464-2025 基于表述性状态转移 REST 技术的业务能力开放应用程序接口 API AI语音业务管理及控制 第 2 页 YD-T 6464-2025 基于表述性状态转移 REST 技术的业务能力开放应用程序接口 API AI语音业务管理及控制 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2025-12-06 10:06:46上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。