金融行业标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111230642.7 (22)申请日 2021.10.2 2 (71)申请人 中山大学 地址 510275 广东省广州市海珠区新港西 路135号 (72)发明人 王金凯 郭文冰  (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 代理人 颜希文 郝传鑫 (51)Int.Cl. C12Q 1/6886(2018.01) C12N 15/11(2006.01) G06F 30/27(2020.01) G06K 9/62(2022.01) (54)发明名称 一种基于RNA编辑水平的乳腺癌分子标志物 及诊断模型 (57)摘要 本发明提供了一种基于RNA编辑水平的乳 腺 癌分子标志物及诊断模型, 属于分子生物医学技 术领域。 本发明的基于RNA编辑水平的乳腺癌分 子标志物, 以人类参考基因组hg19为基准, 所述 分子标志物包括以下RNA编辑位点: chr12: 51324639:METTL7A、 chr1:160966434:F11R、 chr2:128951720:UGGT1、 chr1:100489619: SLC35A3、 chr12:69237519:MDM2、 chr8: 11700419:CTSB、 chr4:177252238:SPCS3、 chr1: 179042905:FAM20B、 chr1:168220280:TBX19和 chr7:17384440:AHR。 本发明基于上述RNA编辑位 点, 提出了一种基于随机森 林算法构建的乳腺癌 诊断模型, 该模型鉴定乳腺癌的AUC值达到 0.9858。 相较于现有技术, 本发明的诊断模型具 有以下优点: (1)所需样品量少; (2)诊断结果稳 定, 准确性高, 具有良好的临床使用和推广价 值。 权利要求书1页 说明书5页 附图2页 CN 113981081 A 2022.01.28 CN 113981081 A 1.一种基于RNA编辑水平的乳腺癌分子标志物, 其特征在于, 以人类参考基因组hg19为 基准, 所述 分子标志物包括以下 RNA编辑位点: chr12:51324639:METT L7A、 chr1:1609 66434: F11R、 chr2:128951720:UGGT1、 chr1:100489619:SLC35A3、 chr12:69237519:MDM2、 chr8: 11700419:CTSB、 chr4:177252238:SPCS3、 chr1:179042905:FAM20B、 chr1:168220280:TBX19 和chr7:17384 440:AHR。 2.如权利要求1所述的分子标志物, 其特征在于, 所述分子标志物 的RNA编辑位点的编 辑水平在乳腺癌中异常增高。 3.如权利要求1所述的分子标志 物在制备检测乳腺癌的产品中的应用。 4.如权利要求3所述的应用, 其特征在于, 所述产品采用多重PCR方法或高通量测序的 方法检测样本的RNA编辑 位点的编辑水平。 5.一种基于RNA编辑水平的乳腺癌诊断模型的构建方法, 其特 征在于, 包括以下步骤: (1)获取乳腺癌患者和正常组织样本的RNA编辑水平数据, 得到每行为分析样本, 每列 为RNA编辑 位点的编辑水平信息的二维矩阵; (2)剔除未检测到RNA编辑水平的位 点; (3)根据特 征重要性筛 选候选RNA编辑 位点; (4)将步骤(3)筛选出的RNA编辑位点作 为特征, 利用随机森林算法进行拟合, 构 建乳腺 癌诊断模型。 6.如权利要求5所述的基于RNA编辑水平的乳腺癌诊断模型的构建方法, 其特征在于, 所述步骤(2)的剔除的未检测到RNA编辑水平的位点为在20%及以上的样 本中未检测到RNA 编辑水平的位 点。 7.如权利要求5所述的基于RNA编辑水平的乳腺癌诊断模型的构建方法, 其特征在于, 所述步骤(3)的筛 选候选RNA编辑 位点, 具体包括: (1)在步骤(2)保留下来的RNA编辑位点中, 采用R软件包DMwR2的knnImputation函数进 行缺失值的插补; (2)以样本类别(乳腺癌、 正常)作为唯一标识, 使用R软件包h2o的splitFrame函数随机 选取2/3的样本作为训练集, 剩下的1/ 3样本为验证集; (3)在训练集中, 基于步骤(1)中插补后的所有RNA编辑位点, 利用随机森林算法建模, 以评价每 个特征的重要性; (4)使用R软件 包h2o的varimp函数获取每 个RNA编辑 位点对于乳腺癌检测的重要性; (5)筛选重要性高于 0.01的RNA编辑 位点。 8.如权利要求5所述的基于RNA编辑水平的乳腺癌诊断模型的构建方法, 其特征在于, 所述步骤(3)筛选出的重要性RNA编辑位点包括以下RNA编辑位点: chr12:51324639: METTL7A、 chr1:160966434:F11R、 chr2:128951720:UGGT1、 chr1:100489619:SLC35A3、 chr12:69237519:MDM2、 chr8:11700419:CTSB、 chr4:177252238:SPCS3、 chr1:179042905: FAM20B、 c hr1:1682 20280:TBX19和c hr7:17384 440:AHR。 9.一种如权利要求5~8任一项所述方法构建的基于RNA编辑水平的乳腺癌诊断模型。 10.如权利要求9所述的诊断模型在制备 预测乳腺癌的产品中的应用。权 利 要 求 书 1/1 页 2 CN 113981081 A 2一种基于RNA编辑 水平的乳腺癌分子标志物及 诊断模型 技术领域 [0001]本发明属于分子生物医学技术领域, 具体涉及一种基于RNA编辑水平的乳腺癌分 子标志物及诊断模型。 背景技术 [0002]乳腺癌是发生在乳腺上皮组织的恶性肿瘤, 在我国的发病率约为21.6/ 10万, 是女 性中最常见 的癌症。 分子诊断与分型技术已经成为乳腺癌检测的突破点, 并取得了一系列 进展。 雌激素受体ER ‑α、 孕激素受体PR、 原癌基因HER ‑2以及血清标志物CA15 ‑3/BR27.29已 经作为预后因子用于分子诊断, 此外, 国外的70种基因表达谱检测以及21种基因检测分别 被证明有能效预测乳腺癌的预后和复发。 然而, 乳腺癌的发病率和死亡率都呈现逐年上升 的态势, 说明现在的诊断和治疗技术还远远不能满足临床的需要, 寻找新的用于乳腺癌诊 断、 预后以及监测的分子标志 物, 开发新的检测方法是乳腺癌分子诊断技 术发展的瓶颈 。 [0003]A‑I(腺嘌呤到次黄嘌呤)RNA编辑是人类中最普遍的一种RNA编辑类型, RNA中的腺 嘌呤核苷在RNA腺苷脱氨酶(ADAR)的催 化下脱去氨基从而变成次黄嘌 呤, 由于次黄嘌 呤(I) 和胞嘧啶(C)进行配对, 因此在细胞内被各种蛋白机器识别 为鸟嘌呤(G)。 近年来, A ‑I RNA 编辑在癌症尤其是乳 腺癌的发生中的重要作用已经引起了广泛关注。 比如, 在2015年, 美国 德州大学的MD  Anderson癌症研究中心的Han  Liang教授团队分析了TCGA( The Cancer  Genome Atlas)项目中17种癌症共6236例癌症样品以及正常组织, 发现RNA编辑的程度在大 多数的癌症类型中都显著增高, 值得注意的是在所有的17种癌症中, 乳腺癌中共有5834个 RNA编辑位点的编辑水平异常增高, 是17种癌症中RNA编辑位点改变最多的。 同时, 该研究还 发现了2057个RNA编辑位点在乳腺癌的不同的亚型中有显著差异。 在乳 腺癌中, 这些发生异 常的RNA编辑 位点又在3’UTR区域显著富 集。 [0004]Han Liang教授团队筛选出的在乳腺癌病人中异常增高的RNA编辑位点为乳腺癌 的分子检测提供了 分子标志物的候选, 然而这些数量庞大的位点并非都是合适的分子标志 物, 目前尚未有有效的方法能够从庞大的候选位点中筛选出合适的用于乳腺癌分子检测的 RNA编辑位点。 发明内容 [0005]针对上述问题, 本发明的目的在于提供一种基于RNA编辑水平的乳腺癌分子标志 物及诊断模型。 [0006]为实现上述目的, 本发明采取的技术方案为: 一种基于 RNA编辑水平的乳腺癌分子 标志物, 以人类参考基因组hg19为基准, 所述分子标志物包括以下RNA编辑位点: chr12: 51324639:METTL7A、 chr1:160966434:F11R、 chr2:128951720:UGGT1、 chr1:100489619: SLC35A3、 chr12:69237519:MDM2、 chr8:11700419:CTSB、 chr4:177252238:SPCS3、 chr1: 179042905:FAM20B、 c hr1:1682 20280:TBX19和c hr7:17384 440:AHR。 [0007]作为本发明所述的乳腺癌分子标志物的优选实施方式, 所述分子标志物的RNA编说 明 书 1/5 页 3 CN 113981081 A 3

.PDF文档 专利 一种基于RNA编辑水平的乳腺癌分子标志物及诊断模型

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于RNA编辑水平的乳腺癌分子标志物及诊断模型 第 1 页 专利 一种基于RNA编辑水平的乳腺癌分子标志物及诊断模型 第 2 页 专利 一种基于RNA编辑水平的乳腺癌分子标志物及诊断模型 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 21:41:03上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。