健康研究中的空间集群检测方法(2)
Cuzick-Edward 检验(1990)[12]将观测到的k阶近邻病例对子数与病例组和对照组均为空间随机分布情形下的预期数进行比较,若前者明显大于后者则表明存在明显的空间集群。它主要用于人群密度不均匀的情形[13,14],其中,阶数k与病例对照比的选择是影响检测结果的关键因素,最佳k的选择依赖于先验知识或通过多重检验调整得到。
2.核估计、空间K/L函数
以上所述方法大多是以发病率确定疾病的高危区域,其结果可能受到人口规模与年龄结构的影响。为此,人们又提出一些方法,如核估计、最近邻估计和空间K/L函数,以消除疾病集群确定过程中的偏差[15]。
核估计(1955)直接从数据本身出发研究数据的分布特征,因此也可用于研究事件的空间集群特征。该方法可定量绘制出疾病分布的二维和三维图,直观地刻画疾病的空间分布特征,包括疾病分布的聚集中心及其程度,但其结果受窗宽大小的影响,其应用相对较少[16-19]。
空间K函数(1977)可检测达到一个给定距离范围内的集群或分散特征,其最大优点是能够在任意尺度下探索空间格局。K函数难以直观地解释,因此通常对其进行平方根变化,即用L函数来替代(1981)[20-21]。空间K函数只使用连续距离范围内点事件数目的计数,在应用时通常需要进行数据汇总而造成信息损失。有研究者通过对英国诺福克道路交通事故和兰开夏郡肺癌与喉癌两个案例的分析,认为生存分析可以更好地刻画事件间的距离分布,对空间格局分析更加深入,且对尺度效应更为敏感,从而可以作为K函数的有益补充[22]。
空间集群检测方法的发展
1.等值线图
近年来的研究超越了假设检验的思想,对空间集群检测方法进行了拓展且能够用于定义风险地形。等值线图(isopleth map)基于地统计数据,最初主要用于可视化气温、降水、地形等的连续变化,尤其适合于帮助查看潜在风险的地理分布,现已成为空间集群检测的方法之一[15,23-24]。传统上基于发病率确定空间集群的方法存在无法外推到其他地区的局限,因此,有研究者认为等值线图可以克服这一局限,且其结果更为稳健[15],但其结果容易受到人工插值的影响,从而产生偏倚[24]。
检验、LISA(local index of spatial autocorrelation)和Getis G*系数
全局Moran 指数等方法能够从总体上判断整个研究区域是否存在集群,但无法对集群的位置进行准确定位,从而存在捕捉人群分布和医疗地点的影响区域不充分等问题,由此产生了Besag-Newell 检验、LISA和Getis G*系数等方法。
Besag-Newell 检验(1991)[25] 考虑了基础人群密度的异质性,专门用于罕见疾病如血吸虫病等的局部空间集群检测[14]。但它基于多重比较的思想容易产生集群的误检,且其在实际应用中通常需要同时指定不同的集群规模(只有在不同规模上均通过统计学检验才认为存在空间集群),因此倾向于检测到最高风险区域而忽略其他区域。
Anselin(1995)[26]和Getis(1995)[27]分别基于局域Moran 指数和局域Getis G系数提出LISA和Getis G*系数,它们被广泛用于识别某种疾病的高发区域及分析卫生和服务的可及性[1,28-33]。大多数情况下,这两种方法的结果相似,但也有研究者基于模拟的空间区域比较它们的检测结果,发现后者优于前者[34]。在识别累计发病率低但严重程度高的地区时,仅使用年发病率作为集群检测的唯一指标存在局限性。为此,有研究者利用LISA分析了三种时空指数即病例发生概率、平均每波持续时间和传输强度,不仅考虑了疾病发病规模,还考虑到疾病的潜在严重程度。通过分析,他认为国家和地方的卫生官员更应将重点放在持续时间长及传播强度高的疾病风险区域[31]。
3.空间扫描统计
总体来说,识别疾病高风险区域的方法较为丰富。然而,许多空间集群检测方法只能说明整个研究区域是否存在空间集群,而无法揭示出集群地点或组成方面的更多信息,且大多没有考虑基础人群异质性可能造成的影响。为此,Kulldorff(1997)[35]提出空间扫描方法,不仅能够检测疾病在研究区域是否存在集群,还能够对集群的大小和位置进行定位,已成为近年空间集群检测的常用方法。空间扫描统计(简称空间扫描)通常根据相对风险找出风险值较高的主要集群,并利用蒙特卡罗方法生成的抽样分布检验集群的显著性。
扫描窗口与被扫描区域的形状是否一致是影响检测结果的关键因素。在实际研究中,被扫描区域的形状可能不是规则的,因此,Kulldorff与Nagarwalla等研究者对扫描窗口进行了研究,其形状也由最初的圆形、椭圆形发展为任意多边形[35-37]。空间扫描能够同时考虑到多个空间尺度上的附近集群,而没有事先假定集群的大小或位置,避免了常见的选择偏倚问题且易于根据人口密度或年龄等协变量进行调整,从而能够消除因构成不一致而引起的偏差[14]。
文章来源:《测绘地理信息》 网址: http://www.chdlxx.cn/qikandaodu/2021/0419/556.html
上一篇:医疗大数据核心问题是人不是技术
下一篇:中国药材产地生态适宜性区划