9月4日,保险业智能创新联合实验室揭牌成立仪式在北京大学举行,第三方保险科技平台豆包网联合北京大数据研究院正式对外发布该实验室首期研究成果及二期的规划方向。
保险产品条款是投保、核保、核赔、理赔的重要依据,也是保险大数据分析的基础,然而现实中保险产品不仅分类复杂、条款设计复杂,而且标准数据缺乏,用户理解困难。因此,保险业智能创新联合实验室将注意力首先放在了保险条款上。据实验室主任、北京大数据研究院自然语言处理与认知智能实验室主任、博士生导师赵东岩介绍,实验室首期目标是围绕保险产品条款的智能解析,构建保险产品知识图谱。
实验室率先发布了保险产品条款智能解析引擎(PPE)。该引擎可以对版式文档(PDF)进行智能解析,通过结构化提取和通过版面理解、自然语言处理技术,以及文本分析、机器学习与计算机视觉等核心技术,实现全自动、高精准度的保险产品条款智能解析,且已申报相关发明专利4项。目前,实验室已对2万多个保险产品条款进行了解析,对其中的3000多个重疾类保险产品条款进行了深度解析。
实验室保险语义知识库(PME)已收录知识图谱节点4.2万个,且还在持续增加中。实验室从智能解析引擎到知识库,通过保险产品条款深度解析,提取语义标签,形成了保险产品条款知识库图谱。目前实验室的知识库拥有上百家保险公司2万多款保险产品,其中重疾险3100多个,承保疾病4万项,涉及疾病460种,形成图谱节点4.2万个,关系5.5万个。目前,这一数据还在不断增加中。
赵东岩表示,实验室通过数据采集、数据清洗、知识发现等手段,构建覆盖更全面、知识更加精准的知识图谱。同时通过保险产品比对、量化分析及智能推荐等,为智能核保和智能理赔提供数据、算法及模型,最终实现核保、理赔一体化AI方案。
豆包网CTO孙字弋介绍了实验室二期的规划目标及应用方向。下一步,实验室将围绕保险责任的量化与新保险责任的发现两方面深入推进。孙字弋解释,这一应用方向将涉及到如何定量分析一份保险涵盖的责任,以及对一个如涵盖意外+重疾的保障方案如何定量描述它的组合责任等,还可以为销售场景下家庭综合保险保障缺口提供定量分析。
行业专家表示,实验室这一规划,可以帮助销售场景下,保险销售人员在面对客户为什么要买保险、能买那些责任、应该买多少保额等这些实际应用问题时,提供更加有效的量化分析工具,从而建立不同场景下的赔付额与责任之间的精确匹配关系。不仅如此,在当前保险产品不断更新的背景下,如何对一个保险产品快速解析出其保险责任,为销售人员和用户提供这款保险产品的独特性,更为具有重要的应用价值。(经济日报-中国经济网记者 秦海波)