(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210981995.9
(22)申请日 2022.08.16
(71)申请人 浙江大学
地址 310058 浙江省杭州市西湖区余杭塘
路866号
(72)发明人 巫英才 陈然 翁荻 黄彦玮
(74)专利代理 机构 杭州天勤知识产权代理有限
公司 33224
专利代理师 曹兆霞
(51)Int.Cl.
G06F 16/25(2019.01)
G06F 16/22(2019.01)
(54)发明名称
一种基于声明式映射的用 于交互式表格数
据转换的方法
(57)摘要
本发明公开了一种基于声明式映射的用于
交互式表格数据转换的方法, 包括: (a1)构建基
于声明式映射的映射模型; (a2)获取待 转换的数
据, 并将待转换的数据转换成关系型数据表格形
式, 提取数据中的数据属性并可视化; (a3)基于
声明式映射的映射模型中的映射方式, 对数据属
性构造表格映射, 并依据表格映射生成数据目标
表格并可视化; (a4)对数据目标表格进行变体,
生成一系列的数据变体表格并可视化推荐给用
户。 该方法通过基于声明式映射的数据转换模
型, 适用各种数据转换需求。
权利要求书3页 说明书9页 附图2页
CN 115391437 A
2022.11.25
CN 115391437 A
1.一种基于声明式映射的用于交互式表格数据转换的方法, 其特征在于, 包括以下步
骤:
(a1)构建基于声明 式映射的映射模型;
(a2)获取待转换的数据, 并将待转换的数据转换成关系型数据表格形式, 提取数据中
的数据属性并可视化;
(a3)基于声明式映射的映射模型中的映射方式, 对数据属性构造表格映射, 并依据表
格映射生成数据目标表格并可视化;
(a4)对数据目标表格进行变 体, 生成一系列的数据变 体表格并可视化推荐给用户。
2.一种基于声明式映射的用于交互式表格数据转换的方法, 其特征在于, 包括以下步
骤:
(b1)构建基于声明 式映射的映射模型;
(b2)获取待转换的数据, 并将待转换的数据转换成关系型数据表格形式, 提取数据中
的数据属性并可视化;
(b3)用户将步骤(b2)得到的关系型数据表格中的数据拖拽到空目标表格中, 或根据数
据在空目标表格的单 元格中键入文本, 以构建表格样例;
(b4)根据表格样例生成表格映射, 结合基于声明式映射的映射模型并依据表格映射生
成数据目标表格并可视化;
(b5)对数据目标表格进行变 体, 生成一系列的数据变 体表格并可视化推荐给用户。
3.根据权利要求1所述的基于声明式映射的用于交互式表格数据转换的方法, 其特征
在于, 所述基于声明 式映射的映射模型被描述成:
以关系型数据表作为源表格输入至声明式映射的映射模型, 源表格中, 每一列称为单
个原始数据属 性, 每列中单元格包含数据属 性的数值, 每列中所有单元格的数值组成的集
合成为数据属性的取值 集合;
将目标表格表示为三个通道: 行、 列和单元格, 基于该表示源表格实例建模为数据到三
个通道的映射, 形式化定义 为:
table:=(ro w),(column)→(cell) (1)
row|column|cel l:=var (2)
其中, 公式(1)理解为将源表格中的原始数据属性映射为目标表格table中的行row、 列
column和单元格cell三通道, 公式(2)理解为表中的行row、 列column以及单元格cell均是
数据属性var;
当需要通过一个或多个现有数据属性进行若干数据操作得到的新数据属性, 则新数据
属性被定义 为:
Var’=f(var) (3)
其中, Var ’表示新数据属性, f( ·)表示数据操作对应的转换函数;
当需要多个数据属性映射到目标表格的同一通道时, 采用公式(4)和公式(5)的方式生
成新数据属性:
var:=var ×var (4)
var:=var+var (5)
其中, 公式(4)用于生成数据属性的笛卡尔积映射至目标表格的行或列, 公式(5)用于权 利 要 求 书 1/3 页
2
CN 115391437 A
2连接多个数据属性并映射至目标表格的单 元格, 以表示多维数据;
为保证公式(1)所示的形式化定义对应的目标表格有意义且唯一, 规定合法的形式化
定义需要满足以下两条规则:
公式(1)中的ro w和column通道至少有一个非空;
公式(1)中的ro w和column通道均非空时, 不可使用公式(5)生成新数据属性。
4.根据权利要求3所述的基于声明式映射的用于交互式表格数据转换的方法, 其特征
在于, 所述 转换函数包括:
函数union(A,B), 表示 为: 连接两个数据属性A、 B 及其对应关系;
函数ascsor t(A), 表示 为: 对数据属性A的取值升序排列;
函数descsor t(A), 表示 为: 对数据属性A的取值降序排列;
函数concat(A), 表示 为: 将数据属性A的取值按顺序拼接为 一个字符串;
函数filterByB ound(A,l,r), 表示为: 对数据属性A的取值按区间[l,r)进行筛选, 仅适
用于定量的数据属性;
函数filterByValue(A,a1,a2,…), 表示为: 对数据属性A的取值按指定值a1,a2,…进行
筛选, 仅适用于 定性的数据属性;
函数split(A,pattern)[index], 表示为: 将数据属性A的每个取值视为一字符串, 按照
参数pattern所表示的字符或字符串进行分割得到一字符串数组(该数组的每个元素均不
包含pattern所表示的字符或字符串本身), 并取得到的该数组中下标为参数index对应值
(从0始计)的字符串;
函数sum(A), 表示 为: 对数据属性A的取值 求和, 仅适用于 定量的数据属性;
函数avera ge(A), 表示 为: 对数据属性A的取值 求平均值, 仅适用于 定量的数据属性;
函数count(A), 表示 为: 计算数据属性A不同取值的个数;
函数bin(A,l,r,step), 表示为: 将[l,r] 区间等分为step个子区间, 每个子区间的长度
相同, 返回这些子区间。 该函数仅适用于定量的数据属性; 当参数l和r被省略时, 此时被等
分的区间为数据属性A的值 域。
5.根据权利要求1所述的基于声明式映射的用于交互式表格数据转换的方法, 其特征
在于, 所述 步骤(a2)和步骤(b2)均包括:
获取待转换的数据, 当数据不为数据表格形式, 将数据转换为数据表格形式, 并检查数
据表格形式是否为关系型 数据表格形式后, 可视化关系型 数据表格;
将关系型数据表格中每列定义数据属性, 列中的所有单元格包含的数值组成取值集
合, 该取值集合通过柱状图或直方图的形式呈现给用户。
6.根据权利要求3所述的基于声明式映射的用于交互式表格数据转换的方法, 其特征
在于, 步骤(a3)中, 用户采用拖拽或标记方式, 将数据属性映射到空目标表格的行、 列或单
元格通道, 以显式地指明想要的表格映射, 基于该显示指明, 采用基于声明式映射的映射模
型中如公式(1)和(2)中定义的映射方式, 构建关系型数据 表格中的数据属性到目标表格的
表格映射, 然后基于该表格映射 生成数据目标表格, 并可视化呈现给用户。
7.根据权利要求2所述的基于声明式映射的用于交互式表格数据转换的方法, 其特征
在于, 步骤(b3)包括:
用户从关系型数据表格中将一个单元格的数值拖拽至空目标表格的单元格中, 以构建权 利 要 求 书 2/3 页
3
CN 115391437 A
3
专利 一种基于声明式映射的用于交互式表格数据转换的方法
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-24 01:01:48上传分享