大数据背景下健康保险定价机制研究
来源:知网 发布日期:2024-12-25
【摘要】:
随着社会信息化进程的不断深化,人们在生活中的每时每刻都产生了与健康相关的信息,这些海量信息被录入到电子信息系统汇聚成了健康大数据。健康大数据因具有数据量增长速度极快、内容多样化、信息真实度高等特征,使其在健康保险领域蕴含着非凡的应用价值。近年来,一系列政府出台的文件明确了深化健康大数据的应用以健全健康保障体系的发展方向。同时,健康保险发展迅速,已经成为国民健康保障的重要支撑。然而,在健康保险的发展过程中也暴露了诸多问题,目前,市场上的健康保险产品形态单一,缺乏创新性,大量趋同,难以满足国民个性化、多样化的健康保险需求,这严重阻碍了健康保险的良态发展,使其难以充分发挥健康保障的功能。而其中很大程度上的根源在于健康保险现有的定价方法、定价模式存在明显弊端,难以精准评估健康风险水平和预测其未来的变化。而健康大数据平台的逐步完善以及大数据分析技术的普及与成熟,为健康保险定价机制的发展带来了新的契机。基于健康大数据的健康保险定价相较于传统定价的本质区别在于:(1)相较于健康大数据,传统的精算定价所利用的数据信息维度较小,其中所考察的健康风险因素较为单一,难以精准预测健康风险的变化;(2)与健康大数据相比,传统定价方法的数据资料来源因其在数据更新时间滞后、更新频率低、数据供应端范围较窄等方面的短板,造成了其难以实现精细化与全面化的健康风险监控,这阻碍了科学的健康保险定价体系的形成;(3)健康保险定价的传统方法较于大数据分析技术更大程度地基于大数定律的思想,它是针对于大量客户群体对健康风险的平均估计,由于数据多样性的缺乏、数据来源真实性的偏差等原因,使其难以针对小量的特征客户群体进行精准定价,这导致了商业健康保险产品缺乏个性化。本文以大数据作为题目的关键词之一,不仅是指要利用健康大数据作为数据基础进行健康保险定价,还指利用大数据分析技术拓展现有的健康保险定价方法。依据社会学中“机制”一词的概念,本文的机制研究体现在:通过对健康保险定价进行数据标准、数据来源、定价理论、定价方法以及实证应用这一系列的系统性研究,探究了如何在大数据背景下更科学、更精准地厘定健康保险费率。本文的研究内容分为八个章节:第1章为绪论,首先从政策导向和健康保险发展现状论述了研究本文的背景,以及本文研究的理论意义和现实意义;然后是对于与本文相关的研究文献从三个方面进行梳理,第一个方面是关于健康大数据发展影响的研究综述,第二个方面是关于健康大数据与健康保险风险防范的研究综述,第三个方面是大数据背景下健康保险定价的研究综述,之后针对这些文献做出总结和评述,以突出本文研究的价值;最后是研究思路与方法、创新点与不足之处的总结。第2章为基于保险学视角的健康大数据理论分析,这部分的研究逻辑是以健康风险的基本特征归纳为起点,再对健康大数据的定义和来源进行概述,基于这两部分理论再根据保险学原理对健康大数据的特征进行归纳,最后分析了健康大数据的应用对健康保险领域的意义。为后文进行大数据背景下健康保险定价的理论研究和实证研究奠定数据理论基础。第3章为大数据背景下健康保险定价的资料来源,即关于健康保险获取健康大数据的路径分析,主要研究保险公司如何利用自身优势获取健康大数据的使用权限,得到高质量的健康大数据。通过对我国健康大数据共享的现状进行分析,揭示了保险公司在其中所面临的挑战以及亟待解决的困境。然后从健康保险获取健康大数据的动机和优势分析,说明健康保险参与健康大数据共享具有较高的可行性。再从社保与商保合作、健康保险资金运用、健康管理三种途径论述了健康保险获取健康大数据的主要路径。最后,以健康管理理念下的健康大数据共享模式为例,构建基于商业健康保险进行健康管理的博弈模型,论证了该数据共享模式的可行性和可持续性。第4章为大数据背景下健康保险传统定价原理的适用性分析,首先从健康保险的定价原则、理论基础、原理、过程与方法以及资料来源与基础假定多个方面阐述了健康保险的定价基础。然后分别从短期个人健康险、长期个人健康险以及团体健康险这三个产品分类阐述大数据背景下对健康保险传统定价理论的沿用、变迁和改进。第5章为大数据分析算法与健康保险定价,将本文所研究的大数据分析算法分为监督学习、半监督学习、无监督学习、强化学习四大类,并分别梳理其中常用算法的数学原理,再分别针对每一种算法讨论它应用于健康保险定价中的可能场景及其可行性。通过对相关实证类文献的查阅,以及对各种算法在健康大数据中的适用性进行分析,发现由于健康大数据区别于一般的大数据,在利用大数据分析算法时往往不能照搬,需要依据实际的应用场景和现实数据对算法进行适当的调整。而六、七章的内容正是通过对大数据分析算法进行适用性改进,以实现其在健康保险定价中的可行性。第6章为大数据背景下健康保险的精准定价,通过利用区别于传统定价的数据基础——多维的医疗服务过程结算数据,即利用一定意义上的健康大数据进行健康保险定价。基于这些数据构造一个贝叶斯网络,然后用韦伯分布很好地拟合每一类费用的发生规律,再用蒙特卡洛随机模拟总医疗费用的分布状况,最后基于贝叶斯公式进行分年龄分性别的健康保险定价。这其中也分析了基于健康大数据利用大数据分析算法进行定价所得到的结果,是传统定价方法依据传统数据所难以做到的原因。第7章为大数据背景下商业健康保险的动态定价,是在健康保险精准定价的基础上,后期依据记录的与被保险人健康生活轨迹相关的健康大数据对保费进行调整。通过基于马尔可夫决策过程进行建模,将被保险人的健康状态和生活轨迹的健康信息都纳入模型中。然后在健康大数据的背景下,利用大数据分析算法——隐马尔可夫模型来优化模型的三个问题:观测序列发生概率的估计问题、最大发生概率的状态序列解析问题以及转移矩阵参数的优化问题,来证明所构建的模型在健康大数据的应用场景下具有一定的可操作性。最后通过健康保险动态定价的数值模拟,比较传统定价方式和基于奖惩机制的动态定价的差异,分析基于健康大数据的动态定价机制的优势所在。第8章为研究结论及展望。随着大数据的发展健康保险的产品设计将更加多样化、个性化。本章就将健康管理服务纳入健康保险产品设计、开发全生命周期的健康保险产品、设计针对特定人群的个性化健康保险、UBI健康保险的出现、基于NCD机制的健康保险定价这些方面,对未来健康保险的发展做出了展望,并提出了相关发展建议。本文的创新之处主要有:(1)创新了关于健康大数据的理论研究:在现有的相关文献中对于健康大数据的定义和特征尚没有明确统一的标准归纳。本文以健康风险的基本特征为研究起点,以健康大数据的价值在于识别健康风险的逻辑,明确健康大数据的定义,同时说明其主要来源,然后基于保险学视角对健康大数据的特征进行归纳,保证了特征归纳的有理有据,为基于健康大数据的健康保险定价研究奠定理论基础。(2)丰富了以大数据为背景的健康保险精算定价理论研究:一方面是以健康保险传统定价理论为模板,以健康大数据为研究背景,探究传统定价理论在大数据背景下能否被沿用,哪些是仍然需要遵循的准则?哪些是需要在大数据背景下变迁的?哪些又是需要克服摒弃的?本文就这些都做了探讨;另一方面是以机器学习算法为主梳理各种算法的数理逻辑,探讨算法的优缺点,然后以健康保险定价为应用场景,分析各个算法在其中的可行性。(3)创新、丰富了健康保险的精准定价技术,探索了健康保险定价研究的新思路。相比于已有的研究,本文的研究并没有停留在理论分析层面,而是进一步采用实证方法对这一问题进行分析。利用医疗费用结算的明细数据以及一些就医信息,将研究的数据基础设定为有别于传统定价资料的一定意义上的健康大数据。通过采用新型大数据分析技术——贝叶斯网络模型,将更多的数据信息纳入保费的估计中,保证了保费估计的稳健性。(4)提出了基于奖惩机制的健康保险动态定价方案。基于健康大数据的背景引入一个马尔可夫决策过程系统,将更多维的健康信息纳入到建模中。通过利用隐马尔可夫模型对模型进行解析,证明了本文所构造的模型在健康大数据背景下的可行性,且相较于传统定价方法有更强的适用性。通过对健康保险动态定价进行数值模拟,论证了本文所构建的大数据背景下商业健康保险的动态定价机制在一定程度上能有效防范逆向选择和道德风险,以更好地控制赔付风险。
【学位授予单位】:西南财经大学
【学位级别】:博士
【学位授予年份】:2023