(19)中华 人民共和国 国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202111575070.6
(22)申请日 2021.12.2 2
(65)同一申请的已公布的文献号
申请公布号 CN 113962335 A
(43)申请公布日 2022.01.21
(73)专利权人 北京恒信启华信息技 术股份有限
公司
地址 100193 北京市海淀区东北旺北京中
关村软件园孵化器2号楼二层2 220室
(72)发明人 梁志强 段自川 赵晓旭 郑帅
尚俊成 汪成鸽 刘晓星
(74)专利代理 机构 北京鼎德宝 专利代理事务所
(特殊普通 合伙) 11823
代理人 牟炳彦
(51)Int.Cl.
G06K 9/62(2022.01)
G06F 16/215(2019.01)
G06F 30/20(2020.01)
G06F 17/16(2006.01)G06F 111/10(2020.01)
(56)对比文件
WO 201814 4834 A1,2018.08.09
CN 111649817 A,2020.09.1 1
CN 10279 9656 A,2012.1 1.28
CN 103412557 A,2013.1 1.27
CN 112149988 A,2020.12.2 9
CN 113420733 A,2021.09.21
CN 113536999 A,2021.10.2 2
CN 113742650 A,2021.12.0 3
CN 113434685 A,2021.09.24
CN 111177639 A,2020.0 5.19
田建勇等.融合布尔矩阵和项目特性的关联
规则挖掘算法. 《控制工程》 .2020,第27 卷(第6
期),
Dunhong Yao等.A Course Teac her
Recommendation Algorithm Based o n
Improved Latent Factor Model and
PersonalRank. 《 IEEE Access》 .2021,第9卷
审查员 周亚芳
(54)发明名称
一种可灵活配 置的数据全过程处 理方法
(57)摘要
本发明提供了一种可灵活配置的数据全过
程处理方法, 首先根据用户要求以及数据性质对
所需处理的数据进行分类采集, 并将采集到的数
据信息转换成能被接收处理的形式, 随后对接收
到的数据进行预处理, 所述预处理为对数据进行
编码分组以及运算储备处理, 目的在于降低数据
维度; 再对数据进行精准处理, 所述精准处理为
对数据进行特征提取及分析, 最后将处理后的数
据进行输 出。 解决了现有技术中数据处理的灵活
性不够, 处理速度较慢, 且处理过程较为复杂的
技术问题, 实现了较灵活、 相对快速且简单的数
据处理。
权利要求书2页 说明书7页 附图1页
CN 113962335 B
2022.04.12
CN 113962335 B
1.一种可灵活配置的数据全过程处理方法, 其特征在于: 首先根据用户要求以及数据
性质对所需处理的数据进行分类采集, 并将采集到的数据信息转换成能被接收处理的形
式, 随后对接 收到的数据进行预处理, 所述预处理为对数据进行编码分组以及运算储备处
理, 目的在于降低数据维度; 再对数据进 行精准处理, 所述精准处理为对数据进 行特征提取
及分析, 最后将处 理后的数据进行输出;
所述方法包括以下步骤:
S1.首先对所需处理数据根据数据类型进行分类采集, 并将采集到的数据信息转换成
能被接收处 理的形式;
S2.对接收到的数据进行预处理, 得到预处理后的变换数据矩阵集合, 为接下来精准处
理做准备;
S3.最后, 通过构造权重数学模型对预处理后数据矩阵集合进行清洗去噪, 并将所得数
据矩阵集 合中矩阵逐个进行矩阵分解以及特 征提取处 理, 最后得到数据输出;
所述步骤S3具体包括:
根据用户具体需求, 通过构造权重数学模型
, 从预处理后的数据矩阵集合J中筛选出
最为满足需求的数据矩阵;
构建权重数学模型为:
其中, A表示为用户对数据要求的所有可能数据矩阵,
, B表示为用户对数据要求
矩阵的权 重, C表示 为用户对数据要求矩阵的权 重的评分,
表示为模型输出矩阵集 合;
权重数学模型的输入为矩阵A、 矩阵B和矩阵C, 对三个输入矩阵做如下运算, 定义中间
变换矩阵F:
其中,
表示矩阵中每个对应元素之间相乘, 得到与矩阵A、 矩阵B、 矩阵C同维度的中
间变换矩阵F, 定义阈值
, 将矩阵F中的每一个元素与
进行比较, 取出大于
的元素, 作为
权重数学模型的输出
。
2.如权利要求1所述的一种可灵活配置的数据全过程处理方法, 其特征在于,所述步骤
S2具体包括:
将采集到的数据用集合
表示, 其中
,
表示第i个数据, N表示数据
个数;
对集合
进行分组编码, 即按顺序对集 合
根据交织 准则构造矩阵, 可表示 为:
权 利 要 求 书 1/2 页
2
CN 113962335 B
2其中, m, n 为分组编码后矩阵D的行 数与列数, 且N = m╳n。
3.如权利要求2所述的一种可灵活配置的数据全过程处理方法, 其特征在于, 所述步骤
S2具体包括:
通过引入权重因子ofo对重构的矩阵D进行加 权运算处理, 得到加权运算后的矩阵
,
从矩阵的性质出发 获得更有研究价 值的矩阵, 为数据处 理的准确性全面 性提供依据。
4.如权利要求1所述的一种可灵活配置的数据全过程处理方法, 其特征在于, 所述步骤
S3具体包括:
对权重数学模型
的输出数据矩阵集合人工筛选的数据矩阵集合
逐项进行数据
矩阵分解, 得到更易处理的数据矩阵, 即根据分解矩阵的性质获得与矩阵相同性质的对角
阵, 可代替数据矩阵进行进一 步处理分析。权 利 要 求 书 2/2 页
3
CN 113962335 B
3
专利 一种可灵活配置的数据全过程处理方法
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 01:50:30上传分享