国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211003815.6 (22)申请日 2022.08.22 (71)申请人 中国工商银行股份有限公司 地址 100140 北京市西城区复兴门内大街 55号 (72)发明人 张斯纯 邱琳 丁浩 许佳玮 (74)专利代理 机构 中科专利商标代理有限责任 公司 11021 专利代理师 张琛 (51)Int.Cl. G06F 16/242(2019.01) G06F 16/2452(2019.01) G06F 16/2453(2019.01) G06F 16/2455(2019.01) G06N 20/00(2019.01) (54)发明名称 问题查询方法、 装置、 设备、 介质和程序 产品 (57)摘要 本公开提供了一种问题 查询方法, 可以应用 于人工智能技术领域。 该方法包括: 获取待查询 问题, 其中, 所述待查询问题为自然语言; 将待 查 询问题输入至预训练得到的问题识别模型, 获取 与所述待查询问题匹配的SQL语句; 以及将所述 与所述待查询问题匹配的SQL语句输入 数据库系 统, 获取问题查询结果, 其中, 所述获取问题查询 结果包括从数据库表中获取与所述待查询问题 匹配的字段值, 其中, 所述预训练得到的问题查 询模型基于双重训练集, 利用Bert模型训练得 到, 其中, 所述双重训练集包括问题样本数据集 和CSpider数据集。 本公开还提供了一种问题查 询装置、 设备、 存 储介质和程序 产品。 权利要求书2页 说明书13页 附图6页 CN 115292352 A 2022.11.04 CN 115292352 A 1.一种问题查询方法, 其特 征在于, 包括: 获取待查询问题, 其中, 所述待查询问题为自然语言; 将所述待查询问题输入至预训练得到的问题识别模型, 获取与 所述待查询问题匹配的 SQL语句; 以及 将所述与所述待查询问题匹配的SQL语句输入数据库系 统, 获取问题查询结果, 其中, 所述获取问题查询结果包括从数据库表中获取与所述待查询问题匹配的字段值, 其中, 所述预训练得到的问题查询模型基于双重训练集, 利用Bert模型训练得到, 其 中, 所述双重训练集包括 问题样本数据集和CSpider数据集, 其中, 所述 问题样本数据集用 于训练模型对于问题文本与数据库表实体的映射关系的识别能力, 所述CSpider数据集用 于训练模型对于问题语句逻辑以及问题语句和SQ L语法的映射关系的识别能力。 2.一种根据权利要求1所述的方法, 其中, 预训练得到所述问题识别模型的训练方法包 括: 基于问题样本数据集对Bert模型进行预训练, 获取第一识别模型, 所述第一识别模型 用于获取第一识别结果, 其中, 所述第一识别结果包括与问题样本匹配的实体, 所述 实体包 括表名, 以及字段名和/或字段类型中的至少一种; 基于CSpider数据集样本对所述第一识别模型进行训练, 获取第二识别模型, 所述第二 识别模型用于获取第二识别结果, 所述第二识别结果包括第一识别结果, 问题语句 逻辑以 及问题语句和SQ L语法的映射关系; 基于所述第二识别结果和SQ L语句拼接规则获取SQ L样本语句; 以及 基于所述SQL样本语句的逻辑准确率和执行准确率优化所述第一识别 模型和/或SQL语 句拼接规则, 直至所述逻辑 准确率和执 行准确率达 到预设的阈值, 获取 所述问题 识别模型。 3.根据权利要求2所述的方法, 其中, 所述基于问题样本数据集对Bert模型进行预训 练, 获取第一识别模型还 包括: 判断所述第一识别结果的准确率是否小于阈值; 以及 当所述第 一识别结果的准确率小于阈值时, 对所述第 一识别结果进行优化, 其中, 所述 优化包括新增匹配关系和/或新增问题样本中的至少一种, 其中, 所述新增匹配关系包括新 增特殊问题样本与实体的匹配关系。 4.根据权利要求2所述的方法, 其中, 获取 所述问题样本数据集的方法包括: 对所述待查询问题样本进行预处理, 获取所述问题样本数据集, 其中, 所述预处理包括 对所述待查询问题样本进行分词和构建特 征向量。 5.根据权利要求2所述的方法, 其中, 基于所述SQL样本语句的逻辑准确率和执行准确 率优化所述第一识别模型包括增 加问题样本数据进行训练。 6.根据权利要求2所述的方法, 其中, 所述问题语句逻辑以及 问题语句和SQL语法的映 射关系包括: 基于问题语句触发的表关联关系, 聚合关系, 关键词操作, 逻辑嵌套关系, 多子 句中的至少一种。 7.根据权利要求1所述的方法, 其中, 所述获取待查询问题还 包括: 获取用户提问信息, 其中, 所述用户提问信息包 含语音信息; 以及 对所述用户提问信息进行语音识别, 获取 所述待查询问题。 8.根据权利要求1所述的方法, 其中, 所述问题查询方法用于进行客户风险识别, 其中,权 利 要 求 书 1/2 页 2 CN 115292352 A 2所述待查询问题包括风险提问信息, 所述问题查询结果包括风险客户信息和/或客户风险 信息。 9.一种问题查询装置, 其特 征在于, 包括: 问题获取模块, 配置为获取待查询问题, 其中, 所述待查询问题为自然语言; 语言转化模块, 配置为将所述待查询问题输入至预训练得到的问题识别模型, 获取与 所述待查询问题匹配的SQL语句, 其中, 所述预训练得到的问题查询模型基于双重训练集, 利用Bert模型训练得到, 其中, 所述双重训练集包括问题样本数据集和CSpider数据集, 其 中, 所述问题样本数据集用于训练模型对于问题文本与数据库 表实体的映射关系的识别能 力, 所述CSpider数据集用于训练模 型对于问题语句逻辑以及问题语句和SQL语 法的映射关 系的识别能力; 以及 问题查询模块, 配置为将所述与所述待查询问题匹配的SQL语句输入数据库系统, 获取 问题查询结果, 其中, 所述获取问题查询结果包括从数据库表中获取与所述待查询问题匹 配的字段值。 10.一种电子设备, 包括: 一个或多个处 理器; 存储装置, 用于存 储一个或多个程序, 其中, 当所述一个或多个程序被所述一个或多个处理器执行时, 使得所述一个或多个 处理器执行根据权利要求1~8中任一项所述的方法。 11.一种计算机可读存储介质, 其上存储有可执行指令, 该指令被处理器执行时使处理 器执行根据权利要求1~8中任一项所述的方法。 12.一种计算机程序产品, 包括计算机程序, 所述计算机程序被处理器执行时实现根据 权利要求1~8中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115292352 A 3
专利 问题查询方法、装置、设备、介质和程序产品
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 13:06:39
上传分享
举报
下载
原文档
(909.8 KB)
分享
友情链接
GB/T 40997-2021 经外奇穴名称与定位.pdf
YD-T 1728-2008 电信网和互联网安全防护管理指南.pdf
GB-T 30950-2014 闸位计.pdf
T-CI 032—2022 矿山酸性污染全过程控制与治理技术指南.pdf
DB5301-T 79-2022 计量器具监督抽查工作规范 流通领域 昆明市.pdf
GB-T 39047-2020 政务服务平台基本功能规范.pdf
GB 42250-2022 信息安全技术 网络安全专用产品安全技术要求.pdf
T-CNAEC 1304—2022 民用建筑无障碍设施评价标准.pdf
DB14-T 712-2018 高速公路施工驻地、场站、工地试验室 建设指南 山西省.pdf
WS-T 305-2009 卫生信息数据集元数据规范.pdf
赛迪 中国网络安全发展现状.pdf
GB-T 29148-2012 温室节能技术通则.pdf
GB-T 22719.1-2008 交流低压电机散嵌绕组匝间绝缘 第1部分:试验方法.pdf
GB/T 40143-2021 志愿服务组织基本规范.pdf
淮南市科技创新促进条例.pdf
GM-T 0003.3-2012 SM2椭圆曲线公钥密码算法第3部分:密钥交换协议.pdf
GB-T 41780.1-2022 物联网 边缘计算 第1部分:通用要求.pdf
GB-T 40652-2021 信息安全技术 恶意软件事件预防和处理指南.pdf
GB-T 3078-2019 优质结构钢冷拉钢材.pdf
T-SSACE 018—2022 成都市回弹法检测泵送混凝土抗压强度技术标准.pdf
1
/
3
22
评价文档
赞助2.5元 点击下载(909.8 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。