Khmaladze变换及其在检验理论中的应用研究综述

陈强

计量经济学报 ›› 2024, Vol. 4 ›› Issue (4) : 1031-1063.

PDF(400 KB)
PDF(400 KB)
计量经济学报 ›› 2024, Vol. 4 ›› Issue (4) : 1031-1063. DOI: 10.12012/CJoE2023-0170
论文

Khmaladze变换及其在检验理论中的应用研究综述

    陈强1,2()
作者信息 +

Review of Khmaladze Transformations with Their Applications on Testing Theorem

    Qiang CHEN1,2()
Author information +
文章历史 +

摘要

在探讨复合假设检验问题时, 基于经验过程的检验统计量往往缺乏分布无关性. Khmaladze变换, 包括鞅变换和酉变换, 为克服这一难题提供了有效的解决方案. 首先, 20世纪80年代初期, Khmaladze提出了鞅变换, 专门用于处理连续分布函数的检验问题. 随着时间的推移, 鞅变换的理论基础得到了不断的深化和完善; 其应用范围也日益扩大, 涵盖了分布函数与回归模型等众多检验问题. 进入21世纪, Khmaladze在2013年和2016年进一步提出了酉变换. 其不仅适用于离散分布, 也适用于连续分布, 为统计学领域带来了新的视角和工具. 然而, 尽管Khmaladze变换在国际上已有一定的研究基础, 但在中国, 这两种变换方法的研究和应用尚未得到充分的认识. 本文旨在对Khmaladze变换的起源、理论原理、发展过程以及当前的应用状况进行梳理, 并对其进一步拓展和应用前景提出一些思考.

Abstract

When addressing composite hypothesis testing, empirical process-based statistical tests often lack distribution-free. The Khmaladze transformation, including both the martingale and unitary transformations, provides an effective solution to this challenge. Initially, in the early 1980s, Khmaladze introduced the martingale transformation, specifically designed for testing problems involving continuous distribution functions. Over time, the theoretical foundation of the martingale transformation has been continuously deepened and refined; and its application scope has broadened, covering a wide range of testing problems, including distribution functions and regression models. Entering the 21st century, Khmaladze further proposed the unitary transformation in 2013 and 2016, which is applicable not only to discrete distributions but also to continuous distributions, bringing new perspectives and tools to the field of statistics. However, despite a certain research foundation for the Khmaladze transformation internationally, these two transformation methods have not yet been fully recognized in China. This article aims to sort out the origin, theoretical principles, development process, and current application status of the Khmaladze transformation and to propose some thoughts on its further development and application prospects.

关键词

经验过程 / 检验 / 分布无关性 / 鞅变换 / 酉变换

Key words

empirical process / test / distribution-free / martingale transformation / unitary transformation

引用本文

导出引用
陈强. Khmaladze变换及其在检验理论中的应用研究综述. 计量经济学报, 2024, 4(4): 1031-1063 https://doi.org/10.12012/CJoE2023-0170
Qiang CHEN. Review of Khmaladze Transformations with Their Applications on Testing Theorem. China Journal of Econometrics, 2024, 4(4): 1031-1063 https://doi.org/10.12012/CJoE2023-0170

1 引言

Khmaladze变换通过将特定的经验过程转换为具有已知大样本分布的等效过程, 实现了基于经验过程的检验统计量的渐近分布无关性. 该方法起源于统计推断领域中关于分布函数拟合检验, 并旨在解决早期分布函数拟合检验中存在的一些问题.
具体而言, 分布函数假设检验存在两种类型: 简单假设(simple hypothesis) 检验和复合假设(composite hypothesis) 检验. 以分布函数拟合检验为例, 简单假设检验考察变量分布是否服从某个具体函数, 复合假设检验考察变量分布是否来自某一类函数族. 例如, 对于一组实值随机变量Xi,i=1,,n, 假设其定义域为D(x_,x¯), x_<x¯+. 简单假设检验用于检验这组随机变量的分布是否等于某个已知的参数分布函数(参数θ0给定, 如一维标准正态分布的两个参数分别为均值μ等于0和方差σ2等于1), 即:
H10:()=F(,θ0).
而复合假设检验用于检验这组随机变量的分布函数是否来自某个实数参数空间Θ下的一类函数族(如一维正态分布族的两个参数均值μ和方差σ2为参数空间内的两个随机数), 即:
H20:(){F(,θ):θΘ}.
关于参数结构的检验方法大体上也可以分为两种类型: 局部平滑检验(locally smoothing test)和全局平滑检验(globally smoothing test). 局部平滑检验一般需要涉及非参数估计技术(如Hardle et al., 1993; Zheng, 1996; Fan and Li, 1996; Fan and Huang, 2001; Li, 2007). 全局平滑检验通常是经验过程泛函的平均(如Bierens, 1982; Stute, 1997; Stute et al., 1998; Dette and Podolskij, 2008; Chen et al., 2015). 例如, 针对分布函数的全局平滑检验的常见办法是基于经验分布函数构造经验过程, 进而构建相应的检验统计量. 全局平滑检验因不需要选择平滑参数(或窗宽)和较好的渐近性质而成为检验方法的一个重要分支.
基于经验过程的检验统计量对一维分布函数的简单假设检验具有优良性质, 其在原假设条件下的极限分布不依赖于原假设函数形式, 即满足分布无关性(distribution-free). 然而, 当涉及复合假设检验问题, 以及多元分布函数的检验问题(无论是简单假设还是复合假设), 基于经验过程的检验统计量在原假设条件下的极限分布变得复杂, 其极限分布会依赖于原假设的函数形式, 相应的检验统计量将不满足分布无关性. 因此, 对不同的原假设, 检验统计量的检验临界值(critical value) 也不一样; 这使得应用这类检验统计量很不方便. 为了解决上述问题, Khmaladze提出了两种不同的变换方法, 以改善检验统计量的分布特性. 首先, 在20世纪80年代初, Khmaladze (1979, 1981)提出了一种鞅变换方法, 解决了复合假设检验中的Durbin问题(具体含义见下文2.1节), 学者们通常称此变换为“Khmaladze鞅变换/鞅转化(martingale transformation)”. 该鞅变换方法极大方便了基于经验过程来构建具有渐近分布无关性的检验统计量. Khmaladze鞅变换方法最初主要针对连续分布函数的复合假设检验问题. 为了使变换方法同样适用于离散分布函数的复合假设检验问题, Khmaladze在近些年(2013, 2016)进一步提出了酉变换(unitary transformation). 后来, 一些学者(如Roberts, 2021) 将前者称为“第一类Khmaladze变换(KT1)”, 而将后者称为“第二类Khmaladze变换(KT2)”或者“Khmaladze旋转/反射(rotation/reflection)”.
很长一段时间来由于某种原因, Khmaladze鞅变换方法虽然一直没融入到主流的统计实践中, 甚至一直没正式写入教材(见Koul, 2006), 但其在各类检验方法的理论研究中已被逐渐采用, 并且其优势正逐渐获得认可. 另外, Khmaladze酉变换提出的时间较短, 相关的理论发展与应用都还很少. 在国内, 这两类Khmaladze变换方法还并不为大家熟知. 为此, 本文旨在系统梳理和展望Khmaladze变换的理论发展和应用进展, 以期提升学术界对此方法的认识和了解.
本文结构如下: 第2节介绍Khmaladze鞅变换产生的理论背景. 第3节介绍Khmaladze鞅变换的基本原理. 第4节介绍Khmaladze鞅变换方法的发展与应用现状, 包括基于经验分布函数的鞅变换和基于标记经验过程的鞅变换. 第5节对Khmaladze鞅变换的检验功效与多维鞅变换问题做简要说明. 第6节介绍Khmaladze酉变换方法的基本内容. 第7节是结论.

2 Khmaladze鞅变换产生的理论背景

2.1 一维简单经验过程的分布无关性

为了具体说明基于经验过程的检验统计量存在的问题以及Khmaladze鞅变换方法的产生原因, 本节从分布函数拟合检验方法开始介绍. 令Fn为来自分布函数Fn个独立一维随机变量的经验分布函数, 即:
Fn(x)1ni=1nI(Xix),
其中I()为示性函数. 考虑如下正规化的经验过程(empirical process):
Vn(x)=n(Fn(x)F(x)).
(1)
由于经验分布函数Fn(x)会收敛于真实的分布函数F(x), 过程(1)的极限过程是一个基于分布F的布朗桥(以F为时间尺度的布朗桥). 可见, 过程(1)的极限分布可能会依赖于分布F. 令人惊奇的是Kolmogorov (1933)发现: 若F为连续分布函数, 可以通过改变过程的时间尺度为t=F(x) (也称为Kolmogorov变换), 从而得到一个均匀经验过程(uniform empirical process) Vn(F1(t)), 该均匀经验过程具有统一的且与F相独立的极限过程.
类似地, 针对上文简单假设H10, 可以考虑如下正规化的经验过程:
Vn(x)=n(Fn(x)F(x,θ0)).
(2)
H10条件下, 经验分布函数Fn(x)会收敛于分布函数F(x,θ0), 过程(2)的极限过程是一个基于F(,θ0)的布朗桥. 同理, 通过新的时间尺度变量t=F(x,θ0)可以将(2)等价转化为如下中心化的(centered) 均匀经验过程:
Un(t)n(Gn(t,θ0)t),
(3)
其中Gn(t,θ0)Fn(F1(t,θ0)). 根据概率积分转换原理, 如果一维随机变量X服从连续分布函数F(x,θ0), 则概率积分转换后的随机变量F(X,θ0)服从[0,1]区间上的均匀分布. 于是在H10条件下, 式(3)的均匀经验过程Un(t)会弱收敛于[0,1]区间上的标准布朗桥过程. 可见, 该Un(t)的构建虽然依赖于原假设的分布F(,θ0), 但Un(t)在原假设下的极限分布完全不依赖于F(,θ0). 而且, Un(t)在原假设和在备择假设下的极限过程是不一样的, 从而确保了基于Un(t)的检验统计量的检验功效. 因此, 经验过程Vn(x)Un(t)可用于构造具有分布无关性的检验统计量, 从而方便地应用于对任意分布函数的统计推断. 例如可以基于经验过程Vn(x)Un(t)构造检验统计量, 如常见的Kolmogorov-Smirnov (KS) 检验统计量:
KS=supxD|Vn(x)| 或 KS=supt[0,1]|Un(t)|.
对于参数已知的分布函数F(,θ0), 该KS检验统计量在原假设条件下会依分布收敛于稳定不变的分布(标准布朗桥的函数), 即满足渐近分布无关性. 有了渐近分布无关的检验统计量, 便可以通过单次的数值模拟得到适用于不同原假设问题的检验临界值.

2.2 参数估计的影响

上文(3)的均匀经验过程Un(t)渐近分布无关性的构造思路为后续统计推断理论开启了一个重要的研究方向. 然而, 上述针对一维随机变量的经验过程通过时间变换t=F(x,θ0)得到具有分布无关性过程的方法无法直接拓展至多维随机变量情形和一般的参数经验过程.
首先, 针对多维随机变量的类似时间变换一般可用Rosenblatt (1952)变换. 如针对二维随机变量, 类似定义时间变量t1=F(x1,θ0), t2=F(x2|x1,θ0). 此时, 对于二维及更高维随机向量X, 即使其分布函数是绝对连续的, 其条件概率积分转换后的随机向量F(X,θ0)也会依赖于F (见Simpson, 1952; Rosenblatt, 1952). 因此, 难以构造出不依赖于F的经验过程.
其次, 简单假设的检验方法在实际应用中存在很大局限性. 因为, 通常在作参数函数检验时, 并不知道其参数的具体值. 此时必须首先估计参数值的大小, 然后再检验实际数据是否与所估计的参数函数形式吻合. 因为参数估计量是来自某个参数空间的随机变量, 所以此时的假设检验问题属于复合假设检验. 到了19世纪五六十年代, 统计学家发现在很多情形下, 用估计参数θ^代替参数分布函数F(x,θ)的未知参数θ得到的参数经验过程:
V^n(x)=n(Fn(x)F(x,θ^))
的极限过程不同于(2)中的Vn(x)的极限过程. 其通过时间尺度t=F(x,θ^)代换得到的参数均匀经验过程(见下文(4)式)也失去了渐近分布无关性(如Gikhman, 1954; Kac et al., 1955). 随后出现了大量的研究文献试图解决此问题, 但寻找渐近分布无关性的经验过程并不顺利, 在后续的20多年时间里, 学者们一度认为参数经验过程的复杂极限性质似乎不可避免.
为了说明参数估计的影响, 在此以一维均匀经验过程Un(t)为例. 假定存在θ0的某个估计量θ^满足常见的n-相合(n-consistent) 估计条件: n(θ^θ0)=Op(1), 则对分布函数参数形式复合假设H20的检验问题可以基于如下中心化的参数均匀经验过程:
U^n(t)n(Gn(t,θ^)t),
(4)
其中, Gn(t,θ^)Fn(F1(t,θ^)). 对式(4)利用泰勒展开定理可以将其表示为1:
U^n(t)=Un(t)g¯(t)Tn(θ^θ0)+op(1),
(5)
1此处及下文过程表达式中的op(1)表示随机过程序列在相应时间区域内一致地依概率收敛于0.
其中,
g¯(t)plim1ni=1nFiθ(x,θ0)|x=Fi1(t,θ0),i=1,,n.
由于式(5)右边第二项g¯(t)Tn(θ^θ0)的存在, (4)的U^n(t)所收敛到的极限过程会与(3)的Un(t)不同, 即不再是[0,1]区间上的标准布朗桥过程. 通常g¯(t)Tn(θ^θ0)会与原假设或其所含参数的估计值有关, 因此U^n(t)的极限会同时依赖于原假设的分布和参数估计量. 基于U^n(t)的检验统计量不再具有(渐近) 分布无关性. 这种因为包含了估计参数而破坏了检验统计量的分布无关性的现象是由Durbin (1973a)基于Vn(x)分析原假设含有估计参数的Kolmogorov-Smirnov检验时提出的. 因此Koenker and Xiao (2002)也将此类问题称为Durbin问题.
解决Durbin问题的其中一种常见方法是通过自助法(bootstrap) 得到检验统计量的检验临界值. 利用自助法的缺陷在于: 针对不同的原假设模型都必须重新模拟来得到相应统计量的检验临界值. 因此, 自助法比较麻烦和耗时, 且针对不同模型参数形式的检验没有一个统一的判断标准. 还有一些研究(如Durbin, 1973b, 1975, 1985; Parker, 2013)探讨了针对检验统计量分布的不同近似计算方法来获取其检验临界值. 这些研究仍存在局限而没得到广泛应用.
很长一段时间, 学术界普遍认为当面对一个复合假设检验问题, 基于经验过程的检验统计量通常不再具有(渐近) 分布无关性. 直到20世纪80年代初Khmaladze提出了一种鞅变换方法从根本上改变了人们之前的悲观论断. Khmaladze (19791981)提出的鞅变换是将一维参数经验过程变换成具有独立增量的过程, 通过布朗运动而不是布朗桥的极限过程进行检验. 近些年, Khmaladze (2013, 2016)提出的酉变换是将定义在某个空间的过程映射到另一空间上, 通过该变换可以将某个特定分布的检验问题转化成熟悉的简单分布的检验问题. 因此, Khmaladze提出的两种变换都是解决上述Durbin问题的有效途径.

3 Khmaladze鞅变换方法的原理

3.1 Khmaladze鞅变换与Doob-Meyer分解

Khmaladze鞅变换方法的基本思想是将参数经验过程(通常为一个半鞅过程) 通过Doob-Meyer分解后转化为一个鞅过程. 根据Doob-Meyer分解定理: 对于任何一个非负半鞅z(t), 总存在一个递增右连续的可预测过程α(t) (E(α(t))<)和一个右连续鞅β(t), 使得:
z(t)=α(t)+β(t)a.s.
针对分布函数拟合检验, 考虑上文提到的针对分布函数的简单假设H10的检验中对经验分布函数的分析. 假定v1,,vn是来自给定参数θ0的分布F(,θ0)的独立同分布随机变量, 则根据概率积分转换原理, uiF(vi,θ0), i=1,,n将是[0,1]区间上独立均匀分布的随机变量. 于是, 经验分布函数Gn(t,θ0)=1ni=1nI(uit)可视为一种半鞅(实际上为下鞅) 过程. 令ΨHn{ΨtHn:0t1}为对应的域流(filtration), 则顺序统计量u(1),,u(n)是关于ΨHn的马尔可夫时间且Gn(t,θ0)为马尔可夫过程. Khmaladze (1981)注意到对任意的时间间隔Δt0, 变量nΔGn(t,θ0)n[Gn(t+Δt,θ0)Gn(t,θ0)]会服从一个次数为n(1Gn(t,θ0))概率为Δt/(1t)的二项分布, 即:
nΔGn(t,θ0)Binomial(n(1Gn(t,θ0)),Δt1t),
且有Gn(0)=0. 于是,
E(ΔGn(t,θ0)|ΨtHn)=1Gn(t,θ0)1tΔt.
这意味着Gn(t,θ0)可做如下Doob-Meyer分解:
Gn(t,θ0)=0t1Gn(s,θ0)1sds+βn(t),
(6)
其中, βn(t)为一个鞅. 根据式(6)可以得到中心化的均匀经验过程Un(t)n(Gn(t,θ0)t)的Doob-Meyer分解为:
Un(t)=Wn(t)0tUn(s)1sds,
(7)
其中, Wn(t)=nβn(t)会弱收敛于[0,1]区间上的标准布朗运动(记为B(t)).
当分布函数的参数θ不是给定的数值, 而是来自某个参数空间Θ的随机数, 即θΘ (如θ0未知且用估计的θ^代替) 时, 要得到上述过程(7)的类似结果, 需要进一步将以上分解方法扩展到一般的参数经验过程. 令gi为映射θGn(,θ)关于θi, i=1,,d的弗里歇导数(Fréchet derivative), 定义g(t)(t,g¯(t)T)=(t,g1(t),,gd(t))T, 则g(t)[0,1]区间上的d+1维的实值函数. 其对应原假设的扩展切平面(extended tangent space corresponding to the null, 简记为ETS; 见文献Li (2009)) 的基为g(t)=dg(t)/dt (亦可称为扩展得分函数). 假定该导数g(t)t=1附近线性独立, 从而保证矩阵Γs=s1g(r)g(r)Tdr非奇异. 基于这些设定, Khmaladze (1981)提出如下的鞅变换公式:
Kg(Un(t))=Un(t)Tg(Un(t)),
(8)
其中,
Tg(Un(t))0tg(s)TΓs1s1g(r)dUn(r)ds.
式(8)同样会弱收敛于[0,1]区间上的标准布朗运动B(t). 容易验证当g(t)=t时: Tg(Un(t))=0tUn(s)1sdsKg(Un(t))=Wn(t); 即式(8)退化为式(7). 可见, 关于一般参数经验过程的Khmaladze鞅变换(8)是经验过程Doob-Meyer分解(7)的推广与应用.
一般来说, 对于来自分布函数FxD, 令h(x)为相应ETS的基向量、ΓF(z)=zh(r)h(r)TdF(r), 则对于任意二次可积实值函数φ的Khmaladze鞅变换Kh可定义为:
Kh(φ(x))φ(x)Th(φ(x)),
(9)
其中,
Th(φ(x))x_xh(z)TΓF(z)1zx¯h(r)dφ(r)dF(z).
鞅变换(9)可以看作是基于区间(x,x¯]的信息, 通过递归最小二乘估计对φ(x)预测得到的残差(见下文5.1节). 通过引入新的时间尺度变量t=F(x), 并令Un(t)=φ(F1(t))g(t)=h(F1(t)), 容易验证式(9)与式(8)相同.
Khmaladze鞅变换是线性的垂直映射和保距映射(见Khmaladze and Koul, 20). 例如对过程(2)和(3)有:
7Kg(Un(t))=Un(t),Kh(Un(t))=Un(t),7Kh(Vn(x))=Vn(x),Kh(Vn(x))=Vn(x),
其中为范数算子. 这意味着Khmaladze鞅变换后的过程与原过程有着相同的极限. 于是, 过程(2)通过鞅变换得到的过程Kg(Vn(x))会弱收敛于以F(x)为时间尺度的标准布朗运动, 即BF(x); 而过程(3)通过鞅变换得到的过程Kg(Un(t))会弱收敛于[0,1]区间上的标准布朗运动.
多数文献会对Khmaladze鞅变换公式(8)与(9)中的ΓsΓF(z)作出非奇异可逆的假设. 不过, 一些研究(如Tsigroshvili, 1998; Khmaladze and Koul, 2009; Koul and Zhu, 2015)发现, 即使ΓsΓF(z)是奇异的, Khmaladze鞅变换公式仍可以被定义和计算.

3.2 关于参数经验过程的Khmaladze鞅变换

现在我们回到式(4)参数均匀经验过程U^n(t)的分析. 首先, 根据Bai (2003)的附录A知: 式(8)的Tg是一种线性算子, 且其对任意常数或随机数c0满足Tg(c0g)=c0g. 取c0=n(θ^θ0), 根据式(5)有:
Tg(U^n(t))=Tg(Un(t))g¯(t)Tn(θ^θ0)+op(1).
(10)
再根据式(8)与(10)可知关于参数经验过程U^n(t)的鞅变换过程满足:
Kg(U^n(t))=Kg(Un(t))+op(1)=Wn(t)+op(1).
(11)
式(11)表明: 对U^n(t)的鞅变换渐近等价于对Un(t)的鞅变换. 于是, Kg(U^n(t))的极限为标准布朗运动. 根据连续映射定理(continuous mapping theorem), 基于U^n(t)构造的KS统计量会依分布收敛于标准布朗运动的函数, 即随机变量maxt[0,1]|B(t)|. 如Bai (2003)所示, 通过对随机变量maxt[0,1]|B(t)|的模拟得到KS统计量在10%、5%和1%显著性水平的检验临界值分别为1.94、2.22和2.80. 从而得到适用于不同分布函数族原假设问题的检验临界值.
应用Khmaladze鞅变换公式对分布函数拟合检验的一个重要步骤是找到并计算得分函数g(t). 对于某些原假设分布(如正态分布或学生t分布) 的拟合检验问题, g(t)的函数形式是完全确定的. 如对于正态分布函数的检验, 其g(t)具有非常简洁的形式:
g(t)=(1,Φ1(t),1Φ1(t)2),
其中, Φ(t)表示标准正态分布函数的累积分布函数.
对于一般的分布函数检验的g(t)可能会依赖于未知的参数θ. 一个自然的方法是用n-相合估计量θ^代替未知的θ, 则以上g(t)函数可以用gn(t)=(1,g¯˙n(t))T估计, 其中,
g¯˙n(t)1ni=1nfiθ(x,θ^)fi(x,θ^)|x=Fi1(t,θ^),i=1,,n.
还有一些检验, 如Bai and Ng (2001)将鞅变换方法应用于回归模型残差分布条件对称性的检验, 其鞅变换公式中的g()采用的是非参数估计. Bai (2003)还给出当g(t)用满足一定条件的估计量代替时, 式(11)所述鞅变换的渐近等价性仍成立.

4 Khmaladze鞅变换方法的发展与应用

自Khmaladze于1981年正式提出鞅变换方法以来, 该方法理论自身被不断拓展和完善. Li (2009)基于Bickel (2006)的理论观点, 从更一般的角度讨论了检验应用中的Khmaladze鞅变换的内涵. 另外, Khmaladze鞅变换方法也已逐渐被广泛应用于各类检验问题的理论研究中. 纵观Khmaladze鞅变换方法在各类检验问题上的应用, 可以发现这些研究大体可以归为两类: 基于经验分布函数的分布函数拟合检验和基于标记经验过程(marked empirical process) 或部分和过程(partial sum process) 的模型设定检验. 鞅变换方法应用的一个重要步骤是针对检验问题构造相应的经验过程, 并基于包含估计参数的参数经验过程与不含估计参数的经验过程的差异分析选择相应的鞅变换公式. 下文就鞅变换的上述两类应用, 分别选择代表性的检验问题并构造相应的参数经验过程, 以便展示鞅变换所要处理的问题与应用场景.

4.1 基于经验分布函数的鞅变换

最初, Khmaladze (1981)主要是针对一维分布函数的复合检验中存在的Durbin问题, 基于Doob-Meyer分解定理, 提出了针对分布函数拟合检验的鞅变换理论. 相关的研究是检验随机变量是否服从某些特定分布, 这涉及对随机变量的经验分布函数进行鞅变换. 此类研究很容易推广至回归模型误差分布的检验. 此时则基于模型残差构造的经验过程进行鞅变换. 相关的研究是检验模型误差是否服从某些特定分布. 为了方便介绍, 本小节将对位置尺度(location-scale) 模型检验、双样本问题(two-sample problem)、Copula模型拟合检验、计数过程密度函数的检验与应用依次进行说明.
实际上, 大部分模型误差分布检验的研究都可以归为位置尺度模型的研究. 如Bai (2003)利用鞅变换理论讨论了动态模型的参数条件分布的检验属于位置尺度类模型. Nguyen (2010)将鞅变换方法应用于一般形式的资产定价模型(general asset pricing model) 条件均值(conditional mean) 的检验方法. Nguyen (2010)的检验实际上是先将连续时间模型的漂移函数检验问题转化为分布函数的拟合检验, 然后利用Bai (2003)的基于鞅变换的分布函数检验统计量来检验. 包括下文所要介绍的双样本问题、Copula模型检验等也可以含有位置尺度模型的设置(由于这些检验的鞅变换具有各自的结构特征, 下文将单独介绍). 另外, Khmaladze鞅变换方法也可以应用于其他类型分布特征的检验, 如Delgado et al. (2005, 2009)将鞅变换方法应用时间序列过程和动态回归模型误差的序列相关性检验. Haywood and Khmaladze (2008)Parker (2013)将鞅变换应用于包含未知参数的指数分布(exponential distribution)的检验.

4.1.1 位置尺度分布

统计界的一个经典问题是检验某个随机样本是否来自某个具有位置参数和尺度参数的分布类型. 位置尺度分布族的建立可以获得数学表达式的便利性和数据分析的易解释性. 首先考虑单样本的位置尺度模型, 针对来自分布函数F的单变量的观测数据{Xi}i=1n, 存在某些位置参数m和尺度参数v. 一个常见的问题是针对所有xD, 检验其分布是否满足某个分布函数F0, 即:
H30:F(x)=F0(xmv).
假设F0存在连续密度函数f0, 密度函数的导数为f˙0. 根据上文2.1节分析知, 当位置参数m和尺度参数v已知时, 基于其经验分布函数Fn(x)构建经验过程Vn(x)=n(Fn(x)F0(x))可以用于构造渐近分布无关性的检验统计量. 而当位置参数m和尺度参数v未知, 用其n-相合估计量m^v^代替得到的经验分布函数为F^n(x). 根据Durbin (1973a)知, 估计的参数经验过程V^n(x)=n(F^n(x)F0(x)满足:
V^n(x)=Vn(x)+n(m^m)vf0(x)+n(v^v)vxf0(x)+op(1).
(12)
由(12)知, 基于估计的经验过程V^n(x)构建的检验统计量的极限值会受到参数估计和密度函数f0的影响, 即不具有渐近分布无关性. 此时, 可以采用Khmaladze鞅变换(8)消除参数估计的影响. 定义
Un(t)=1ni=1n(I(F0(ηi)t)t),U^n(t)=1ni=1n(I(F0(η^i)t)t),
其中, ηi=Ximvη^i=Xim^v^为标准化真实与估计的残差. 类似于Bai (2003)的分析知:
U^n(t)=Un(t)+f0(F01(t))pn+f0(F01(t))F01(t)qn+op(1).
其中, pnqn为与t无关的有界随机变量. 此时Khmaladze鞅变换(8)需要的g(t)函数为:
g(t)=(1,f˙0(F01(t))f0(F01(t)),1+F01(t)f0F01(t))T.
由此得到的Khmaladze鞅变换后的过程Kg(U^n(t))会弱收敛于标准布朗运动B(t).
针对单样本位置尺度模型残差经验过程的鞅变换与针对参数回归模型Y=mθ(X)+vϑ(X)ξ的残差经验过程的鞅变换具有相同的形式. 具体而言, 假设对于观测数据Xi, 一个常见的检验问题是检验以下标准化残差,
ξi=Ximθ(Xi)vϑ(Xi)
是否满足某类分布函数. 在参数回归模型中, 对于误差项的参数分布的拟合检验可以利用回归模型的残差ξi构造残差的经验过程. 在实际应用中, 我们并不知道上式中θϑ的具体值, 因此, 必须用其n-相合性估计量代替得到估计的残差ξ^i. 此时所构造的参数经验过程不满足分布无关性, 因此可采用Khmaladze鞅变换方法消除参数估计的影响. 这类检验问题包含了众多回归模型残差分布的检验, 如通常的线性回归模型的残差分布检验、ARMA-GARCH类非平滑模型参数分布的检验等.
更一般的问题是关于非参数回归模型m~()误差分布的拟合检验, 此时的位置参数函数和尺度参数函数是纯粹的非参数函数. Akritas and Van Keilegom (2001)表明: 基于非参数回归模型残差经验过程的渐近分布会依赖于原假设的误差分布. 基于非参数回归残差Xim^n(Xi)构造的经验过程V^n(x)与对应的不含估计的经验过程Vn(x)满足如下渐近表达式:
V^n(x)=Vn(x)+f0(x)Rn+op(1).
其中Rn=1ni=1n(m^n(Xi)m~(Xi)). 基于此, Khmaladze and Koul (2009)发现只要Rn=Op(1)成立, 便可以通过鞅变换将f0(x)Rn的影响消除; 从而将鞅变换理论推广至非参数回归模型中残差分布的拟合检验. Akritas and Van Keilegom (2001), Muller et al. (2007, 2009)先后给出了在一元回归和多元回归条件下Rn=Op(1)成立的条件. 随后, Khmaladze and Koul (2009)的理论被应用于其他一些回归模型的误差分布检验; 如Muller et al. (2012)的部分线性回归模型(partially linear regression model) 的误差分布检验, Koul and Zhu (2015)的非参数自回归条件异方差模型误差分布的检验和Chown et al. (2019)的多变量间接回归(indirect regression) 模型的误差分布的检验.

4.1.2 双样本问题

考虑两个独立的样本序列{Xi}i=1n1{Xi}i=1n2. 双样本常见问题就是对这两样本分布函数是否相等的检验. 经典的解决办法是通过构造如下双样本经验过程(如Smirnov, 1939)进行统计量的构造:
Vn(x)=(n1(n1+n2)n2)1/2(Fn1(x)Fn1+n2(x)).
其中, Fn1(x)=1n1i=1n1I(Xix)Fn1+n2(x)=1n1+n2(i=1n1I(Xix)+i=1n2I(Xix))分别表示第一样本的经验分布函数和混合样本的经验分布函数. 通过Kolmogorov (1933)变换改变经验过程的时间尺度, 一维空间的双样本Smirnov检验在原假设下具有分布无关性. Urinov (2006)在一维空间下构造了不同形式的双样本经验过程, 也得到了类似的渐近分布无关的检验统计量.
当考虑多维空间下的双样本经验过程, 就难以通过Kolmogorov (1933)变换获得渐近分布无关的经验过程(见Bickel, 1969). Einmahl and Khmaladze (2001)针对多维空间的双样本问题提出了类似的扫描式(scanning)的鞅方法(扫描式的鞅的含义见下文5.3节) 使得双样本的检验统计量在多维空间下仍保持渐近分布无关性. 同样的, 针对双样本问题, 当存在未知参数并需要用样本估计参数构造经验过程时, 即使一维过程情形下, 所构造的经验过程也不满足分布无关性. Mora and Neumeyer (2005)探讨了鞅变换后的经验过程来检验回归模型残差分布的双样本问题. Chung and Olivares (2021)研究存在参数估计误差时的处理效应(treatment effect) 的排列检验(permutation test)也属于双样本问题. 具体而言, 假设{Xi}i=1n1{Xi}i=1n2分布对应于控制组样本和处理组样本, 其经验分布函数分别对应于Fn1Fn2. 对于常数处理效应δ的检验可以基于这两组的经验分布函数构造如下双样本经验过程:
Vn(x,δ)=(n1n2n1+n2)1/2(Fn2(x+δ)Fn1(x)).
处理效应δ已知时, 该经验过程在原假设下会收敛至某个布朗桥过程. 然而, 处理效应δ未知并用其估计量δ^代入得到的参数经验过程Vn(x,δ^)满足:
Vn(x,δ^)=Vn(x,δ)+(n1n2n1+n2)1/2f1(x)(δ^δ)+op(1),
其中, f1(x)是控制组样本的边际密度函数. 可见, 参数经验过程Vn(x,δ^)的极限会依赖于参数估计和数据生成过程. 为此, Chung and Olivares (2021)探讨了Khmaladze鞅变换应用于此双样本情形, 以此消除估计误差的影响来得到渐近分布无关的检验统计量. 其对应Khmaladze鞅变换(8)需要的g(t)函数为: g(t)=(1,f˙1(F11(t))f1(F11(t)))T.

4.1.3 Copula模型

Copula模型是分析数据间的非线性相依结构与尾部特征的重要工具. 由于Copula模型允许独立地对边际密度函数和边际密度函数间的相依结构分别建模, 其在金融、医学、气候等领域有着广泛的应用(如Nelsen, 2006; Durante and Sempi, 2016). 根据Sklar (1959)的表示定理, 对于具有连续边际密度函数F1,,Fdd维分布函数F, 存在唯一的Copula函数C满足:
F(x)=C(F1(x1),,Fd(xd)),x=(x1,,xd)TRd.
可见, Copula函数C反映了边际密度函数间的相依结构. 随着大量不同的Copula函数的参数形式的提出, 对Copula函数的拟合检验也变得更加重要.
对于边际分布函数和Copula函数都作参数函数设定的检验的一类重要方法是构建如下参数经验过程:
V^(u)=1ni=1n[I(U^u)C(u;ϑ^)],
其中, U^i=(U^1,,U^d)=(F1(X;θ^1),,Fd(X;θ^d)). 上述参数经验过程涉及的边际分布函数Fi(X;θi)和Copula函数C(u;ϑ)都包含了参数函数形式设定, 并用估计的参数代替未知参数来构造参数经验过程. 为简单起见, 以下给出i.i.d. 数据环境下的参数经验过程V^(u)与不含估计参数的经验过程Vn(u)的渐近关系式:
V^(u)=V(u)GT(u)ϖn+op(1).
(13)
其中,
G(u)=(C(u;ϑ0)u1R1T(u,θ1,0),,C(u;ϑ0)udRdT(u,θd,0),(C(u;ϑ0)ϑ)T)T,Rj(u,θj,0)=Fj[Fj1(u;θj,0);θj]θj|θj=θj,0,j=1,,d,ϖn=(n(θ^1θ1,0),,n(θ^dθd,0),n(ϑ^ϑ0))T.
从(13)右边第二项的成分可以看出, 基于V^(u)的Copula函数参数形式的拟合检验统计量的极限分布会依赖于不同的Copula原假设C(u;ϑ)和边际分布函数Fi(X;θi)的设定; 因此这些统计量不满足(渐近) 分布无关性. 为此, 一些学者应用Khmaladze鞅变换改进Copula的拟合检验方法. 如Can et al. (2015, 2020)在i.i.d. 数据环境下将Khmaladze鞅变换应用于copula函数的拟合检验. Lu and Zheng (2020)进一步探讨了针对时间序列数据动态边际分布函数设置下的copula函数的拟合检验. 这些研究进一步丰富了多元Khmaladze鞅变换的应用. 为了应用Khmaladze鞅变换(8), 定义G~(u)(C(u;ϑ0),G(u)T)T, 相应的鞅变换需要的g函数为G~(u)C(u;ϑ0)的拉东-尼科迪姆导数(Radon-Nikodym derivative), 即: g(u)=dG~(u)dC(u;ϑ0).

4.1.4 计数过程

计数过程(counting process)在具有删失观测(censored observation) 的生存分析(survival analysis)等领域有重要应用(见Andersen et al., 1993). 令N(t)=(Ni(t),i=1,,n), t[0,s]为一个随机强度函数(intensity function) λ(t)的点过程(point process), Ni(t)记录了个体i到时间t为止可能经历的事件次数.
对于点过程应用需要关心的一个检验问题是判断其对应的随机强度函数λ(t)是否满足某参数函数形式λ(,θ). 假设对于任意t[0,s], 当n时, 存在λ(t,θ)/nf(t,θ)λ˙(t,θ)/nf˙(t,θ). 其中, λ˙(t,θ)f˙(t,θ)分别为λ(t,θ)f(t,θ)关于参数向量θ的偏导数. 针对上述检验问题的一种可能的解决办法是构造出如下鞅过程:
M(t)=N(t)0tλ(s,θ)ds.
当参数θ已知时, n1/2M(t)会是一个渐近独立的高斯鞅, 即0tf1/2(s,θ)dB(s) (如Sun and Zalkikar, 2001). 然而, 如果强度函数λ(,θ)包含某未知参数θ时, 用估计的参数θ^代入可得到过程:
M^(t)=N(t)0tλ(s,θ^)ds
(14)
满足:
n1/2M^(t)=n1/2M(t)[0tf˙(s,θ)ds]Tψ1n(θ^θ0).
其中, ψ=0τf˙(s,θ)f˙(s,θ)T/f(s,θ)ds. 此时估计的过程nM^(t)不再是鞅过程, 甚至不再是渐近独立过程. 这种复杂的极限特征使得其难以被用于构造Kolmogorov-Smirnov、Cramer-von Mises等类型检验统计量(除参数θ维度为1情形, 如Hjort, 1990). 对于参数θ维度大于1情形, 相关统计量的分布甚至还会依赖于数据删失机制(censoring mechanism).
不少学者利用Khmaladze鞅变换来处理此问题. 由上文知nM^(t)的极限仍不是一个标准的布朗运动, 而是与f˙(s,θ)有关的鞅过程; 而且, 极限过程不同, 需要构造的鞅变换方法也不一样. 应用Khmaladze鞅变换(8)前, 一般会先对过程(14)作标准化处理或加权变换. 不论怎样, Khmaladze鞅变换(8)需要的g函数是与f˙(s,θ)有关的函数. 应用鞅变换方法于计数过程的相关研究包括: Maglaperidze et al. (1998)对计数过程的参数强度函数的检验. Nikabadze and Stute (1997)Sun (1997)Koul and Yi (2006)考察了具有删失数据的模型诊断. McKeague et al. (1995)探讨了生存时间(survival time)的独立性检验. Marzec and Marzec (1997)Sun and Zalkikar (2001)探讨了鞅变换方法在多变量的计数过程参数强度函数的检验. O'Quigley (2003)Scheike and Martinussen (2004)在研究相应的风险模型的统计推断也应用了Khmaladze鞅变换方法. Zamba and Adekpedjou (2019)应用Khmaladze鞅变换方法及多变量点过程模型研究了具有复发事件(recurrent event) 设置下的生存函数参数结构的拟合检验.

4.2 基于标记经验过程或部分和过程的模型设定检验中的鞅变换

Khmaladze鞅变换方法虽然最初只是针对分布函数的拟合检验提出的, 但它也可以推广至回归模型的检验. 其在回归模型检验的应用主要是针对回归模型残差构造标记经验过程(或部分和过程) 进行鞅变换处理. 相关的研究是检验回归模型是否满足某些特定的参数方程, 其回归模型误差分布通常是未知的. 为了方便介绍, 本小节将对回归模型的设定检验、Berkson测量误差模型检验、平衡混合效应模型与连续时间模型(波动函数结构)的检验依次展开说明.
需要说明的是: 下文4.2.1介绍的Stute et al. (1998)所拓展的Khmaladze鞅变换方法成为一类追求分布无关性模型检验的基本方法. 其他相关的应用研究包括: Koul and Stute (2009)将鞅变换方法应用到时间序列数据的AR(1.1)模型中条件均值的检验, 包括线性与非线性的情形. Koenker and Xiao (2002, 2006) 分别将鞅变换方法应用于分位数回归模型和分位数自回归模型的统计推断. 夏强等(2019)将鞅变换方法应用于参数单指标分位数自回归模型的诊断检验. Song (2011)将鞅变换应用于Tobit均值回归模型的检验. Song (2010)将鞅变换方法应用于含有非参数估计的条件矩限制(conditional moment restrictions) 模型, 拓展鞅变换方法至半参数模型的检验, 如单一指标限制(single index restrictions) 模型、部分参数回归(partially parametric regression) 模型、部分参数分位数回归(partially parametric quantile regression). Khmaladze and Koul (2004)在同一框架下研究了Khmaladze鞅变换在多元参数经验过程的误差分布的拟合检验以及回归模型的诊断. 实际上, 下文将要介绍的Berkson测量误差模型检验、平衡混合效应模型检验、连续时间模型的检验等都是基于Stute et al. (1998)的思路进行分析的. 当然, 这些拓展还存在一些自身特殊之处, 为此将在随后章节简要展开说明.

4.2.1 回归模型设定检验

为了检验回归模型的参数形式, Stute (1997)构造了基于残差标记经验过程(residual marked empirical process)的检验统计量. Stute et al. (1998)较早将鞅变换方法应用于独立同分布(i.i.d.) 数据的回归模型的设定检验, 他们通过构建标记经验过程并利用Khmaladze鞅变换得到渐近分布无关的过程. 为了具体说明, 令(Y,X)d+1维欧式空间的随机观察变量. 考虑如下的均值回归模型设定:
Y=m(X)+ξ,ξ=σε,
(15)
其中, m(x)=E(Y|X=x), 误差项ε与自变量X相互独立且满足E(ε)=0, Var(ε)=1.
本小节只考虑Xd=1的一维变量情形(在5.3节会讨论d>1情形). 令(Xi,Yi), i=1,,n为来自模型(15)的随机样本. 关于这一模型设定存在两种有意义的检验问题: 一是对模型误差项ε的参数分布的拟合检验(见上文4.1.1节), 二是对回归模型参数函数形式的设定检验. 后者对于回归模型参数函数形式的设定检验的原假设为:
H40:m(){m(,θ0):θ0Θ}.
H40的回归模型的设定检验可以基于如下用残差εiYim(Xi,θ0)σ标记的经验过程:
Vn(x)=1ni=1nεiI(Xix).
(16)
不同于一些文献(如Bierens, 1982)用指数族函数作为权重函数, 此处用示性函数作为权重函数. 采用基于示性函数加权得到的经验过程构造统计量(如cramer-von Mises统计量)可以避免不同积分函数的选择, 这是因为其通过{Xi}i=1n的自然经验分布函数来计算.
根据泛函中心极限定理, (16)的Vn(x)会弱收敛于一个以分布函数F(x)为时间尺度的标准布朗运动, 即BF(x). 基于Vn(x)的检验满足渐近分布无关性. 同样的, 由于Vn(x)存在未知的参数θ0σ, 基于Vn(x)的检验是不可行的. 当εi中的θ0σ用估计量θ^σ^代替得到ε^i时, 对回归模型参数形式复合假设的设定检验可以基于如下ε^i标记的参数经验过程:
V^n(x)=1ni=1nε^iI(Xix).
(17)
类似于上文式(5)中对U^n(t)的分析可以推导出:
V^n(x)=Vn(x)E[m˙(X,θ0)I(Xx)n(θ^θ0)]+op(1),
(18)
其中, m˙(x,θ0)m(x,θ0)θ0. 由于式(18)右边第二项E[m˙(X,θ0)I(Xx)n(θ^θ0)]的存在, V^n(x)所收敛到的极限过程会与Vn(x)不同. 此时V^n(x)的极限过程会与原假设形式有关, 即不是标准布朗运动BF(x). 这也使得基于V^n(x)的检验不再具有(渐近) 分布无关性. 为了使回归模型函数的设定检验统计量是渐近分布无关的, 可以对V^n(x)进行Khmaladze鞅变换处理. 取h(x)=m˙(x,θ^), 通过Khmaladze鞅变换公式(9)得到的Kh(V^n(x))可以渐近地把参数经验过程中与原假设有关的成分E[m˙(X,θ0)I(Xx)n(θ^θ0)]剔除, 即:
Kh(V^n(x))=Kh(Vn(x))+op(1).
(19)
由3.2节知Kh(Vn(x))会弱收敛于BF(x). 于是, 式(19)表明基于Kh(V^n(x))构建的检验统计量渐近地不依赖于原假设与参数估计, 从而保证基于Kh(V^n(x))的检验统计量具有渐近分布无关性.

4.2.2 Berkson测量误差模型

Berkson测量误差模型在医药、农业、经济等方面有广泛的应用. Koul and Song (2008, 2010a)将鞅变换方法应用于具有Berkson测量误差的模型检验. Song and Yao (2011)将鞅变换应用于存在测量误差的Tobit回归模型的检验. Balakrishna (2020)将鞅变换应用于存在测量误差的AR(1)模型的检验.
简单起见, 考虑回归模型(15), 实际应用中可能出现真实自变量X难以观测到的情况; 而直接观测的是替代变量Z, 其与真实变量X存在误差项η, 并假定ηξ相互独立. 在经典的测量误差模型中, 往往假定Z=X+η. 这里η与真实变量X是相互独立的. 对于Berkson测量误差模型, 假定X=Z+η, Berkson测量误差模型同经典测量误差模型的不同之处就在于测量误差η与可观测变量Z相互独立. 测量误差文献常用如下校准回归模型(calibrated regression model):
Y=m~(Z)+ς
来估计m~(z)E[Y|Z=z]=E[m(X)|Z=z]=m(x)fη(xz)dx, 其中E(ς|Z)=0.
对于带有Berkson测量误差模型的检验可类似上文(17)构造标记参数经验过程. 不过, 此时要用观测到的变量Zi代替不可观察变量Xi, 并用m~(Zi,θ^)代替m(Xi,θ^), 其中,
m~(z,θ0)E[m(X,θ0)|Z=z]=m(X,θ0)fη(xz)dx.
并用s(z){E[(Ym~(Z,θ0))2|Z=z]}1/2的相合估计量s^(z)来标准化残差Yim~(Zi,θ^). s(z)可分解为两项之和, 即s2(z)=E[(m(X,θ0)m~(Z,θ0))2|Z=z]+E[ξ2]. 在原假设成立时, Koul and Song (2008)在给定测量误差分布的条件下给出了相合估计量s^(z). 从而得到如下标记参数经验过程:
V^n(z)=1ni=1nYim~(Zi,θ^)s^(Zi)I(Ziz).
(20)
然而, 基于式(20)的检验统计量通常不满足渐近分布无关性. 为此, Koul and Song (2008)参照Stute et al. (1998)的做法讨论了对V^n(z)的鞅变换. 其在一定条件下, 得出V^n(z)与不含估计参数的经验过程Vn(z)满足如下渐近关系式:
V^n(z)=Vn(z)E[m~˙(Z,θ0)s(Z,θ0)I(Zz)n(θ^θ0)]+op(1),
其中, m~˙(,θ^)m~(,θ^)对参数的导数, m~˙(z,θ0)=E[m˙(z,θ0)|Z=z]. 此时Khmaladze鞅变换(9)需要的h函数为h()=m~˙(,θ^)s(,θ^).

4.2.3 平衡混合效应模型

Khmaladze鞅变换也可应用于面板数据类型模型的设定检验, 如Song and Du (2010)将鞅变换应用于平衡混合效应模型(balanced mixed effects model) 中的固定效应函数形式的设定检验. 平衡混合效应模型主要用来处理具有复杂层级结构的数据, 例如对于临床试验研究的数据可以来自不同时期各种病人的观察, 其中来自不同病人的观察值可以认为相互独立, 而来自同一个病人的重复观察值将可能存在相关性. 对这类数据的研究可以采用平衡混合效应模型来研究:
Yij=m(Xi)+ZijTβi+ξij,i=1,,n;j=1,,k.
其中, m(Xi)是回归模型的固定效应成分, βik×1维i.i.d. 不可观测的随机效应的向量, 其均值向量为0协方差阵为Vβ, ξij是i.i.d. 的均值为0方差为Vξ的扰动项. 一类重要研究是关注模型中的固定效应函数是否来自某参数函数m(,θ). 为了构造相应的部分和过程, 定义:
Si=j=1k[Yijm(Xi)]=j=1k[ZijTβi+ξij].
容易验证Si是i.i.d. 的均值为0, 条件方差为Var(Si|Xi,Zij)=kVξ+Z~iTVβZ~i, 进而构造如下部分和过程:
Vn(x)=1ni=1nSikVξ+Z~iTVβZ~iI(Xix).
上述经验过程在原假设条件下会收敛于以Xi的分布为时间尺度的标准布朗运动. 相应的参数经验过程为:
V^n(x)=1ni=1nSi(θ^)kV^ξ+Z~iTV^βZ~iI(Xix).
其中, Si(θ^)=j=1k[Yijm(Xi,θ^)]. 此时参数经验过程的极限在原假设下不满足分布无关性, 其会依赖于Xi的分布、固定效应函数结构m(,θ)Si的条件方差. 为此, Song and Du (2010)将鞅变换应用于此平衡混合效应模型中的固定效应函数形式的设定检验. 此时, Khmaladze鞅变换需要h(Xi,Z~i)=km˙(Xi,θ^)kV^ξ+Z~iTV^βZ~i; 相关的变换公式与上文回归模型和测量误差模型的处理类似(见Song and Du, 2010).

4.2.4 连续时间扩散模型

连续时间扩散模型是刻画金融资产价格、收益等动态过程的有力工具. 许多金融变量都可以统一地描述为如下形式的时间齐次扩散过程:
dXt=μ(Xt)dt+σ(Xt)dBt.
(21)
其中, XtD=(x_,x¯), x_<x¯+, Xt表示状态变量水平, 其服从分布F(); μ(Xt)为漂移函数, σ(Xt)为波动(或扩散) 函数, Bt为标准维纳过程. 早期, 已有不少文献提出了漂移函数和波动函数的联合设定检验方法(见Chen et al. (2015)的简短综述). 实际应用中也存在对漂移函数或波动函数进行单独设定检验的需要. 例如我们只关心扩散模型的波动函数形式, 而又不希望对其判断受到漂移函数设定的影响; 反之亦然. 基于经验过程方法, 陈强等(2014, 2016)、Chen et al. (2015, 2022)先后将鞅变换方法应用于连续时间纯扩散模型中漂移函数、波动函数的单独检验与联合检验.
在此以波动函数设定检验为例, 考虑的原假设问题为波动函数的参数函数形式设定是否正确, 即:
H50:σ2(Xt)=σ2(Xt,θ0)XtD(a.s.)  对于某些未知的  θ0Θ.
由于针对连续时间模型的统计推断是基于离散抽样的数据, 连续时间模型的设定检验通常需要将模型离散化. 式(21)的离散化版本为:
Xi+1Xi=μ(Xi)Δn+σ(Xi)Δnεi,i=0,,n1,
其中, {εi}为独立标准正态分布序列; 且对任意si, {εi}{Xs}相互独立.
针对连续时间模型的离散抽样数据主要存在三种抽样机制; (i) Δn固定, T, (ii) Δn0, T, (iii) Δn0, T固定. 第(i)种抽样机制下的分析与离散时间模型的分析类似; (ii)与(iii)中抽样机制适合于高频数据的分析. 通常, 涉及漂移函数的统计推断需要T, 而针对波动函数的统计推断允许TT固定. 根据Fan and Zhang (2003)知, 当Δn0时, 有:
E((Xi+1Xi)2Δn|Xi=x)=σ2(x)Δn+O(Δn),
(22)
Var((Xi+1Xi)2Δn|Xi=x)=2σ4(x)(1+O(Δn)).
(23)
为了得到渐近分布无关的检验统计量, Chen et al. (2015)首先利用(22)与(23)得到标准化的残差, 进而构造如下标记经验过程:
Vn(x)=12ni=1n((Xi+1Xi)2σ2(Xi,θ0)Δn1)I(Xix).
该经验过程在原假设条件且θ0给定时会收敛至标准布朗运动.
在实际应用中, 更多情况下我们并不知道θ0的具体值, 因此必须首先对θ0进行估计. 假定存在θ0的某个n-相合估计量θ^, 则对波动函数参数形式复合假设的设定检验可以基于如下标记参数经验过程:
V^n(x)=12ni=1n((Xi+1Xi)2σ2(Xi,θ^)Δn1)I(Xix).
Chen et al. (2015)给出V^n(x)Vn(x)满足如下渐近表达式:
V^n(x)=Vn(x)+E[2σ˙(X,θ0)σ(X,θ0)I(Xx)n(θ^θ0)]+op(1).
同理, 基于V^n(x)构造的检验统计量的极限会依赖于原假设与参数估计. 为此, 取h(x)=2σ˙(x,θ^)σ(x,θ^), Chen et al. (2015)利用Khmaladze鞅变换(9)得到渐近分布无关性的检验统计量.
在离散时间模型框架下, 也有一些文献将鞅变换方法应用于回归模型残差的方差函数形式检验, 如Dette and Hetzler (2009, 2018)、Koul and Song (2010b). 对于一般回归模型残差方差函数的检验通常不存在高阶矩与低阶矩间的固定关系, 这些文献通常利用非参数估计把高阶矩的信息估计出来用于残差或过程的标准化. 连续时间扩散过程由于其特殊的函数结构(如式(22)与(23)体现的高阶矩与低阶矩间的联系), 使得对扩散模型的波动函数检验统计量不需要引入非参数估计方法或者将波动函数的原假设信息引入到残差的标准化处理(如Gao et al., 2008; Chen et al., 2019), 使得针对扩散模型波动函数的检验统计量更充分地利用了原假设信息, 从而让统计量具有更加优良的性质.
连续时间模型是高频数据环境的理想建模选择. 针对金融市场高频数据的建模除了涉及不同抽样机制的影响外, 很多时候还需要考虑市场的跳跃特征及微观噪音的影响. 为此, 陈强与龚玉婷(2020)Chen et al. (2022)将鞅变换方法应用至跳跃扩散模型的检验, 提出对跳稳健的波动函数设定检验. Tan et al. (2022)Chen et al. (2024)又将鞅变换方法应用至存在市场微观噪音时的波动函数设定检验. 从模拟表现来看, 基于鞅变换方法(Chen et al., 2024)比非参数方法(陈强等, 2024)在处理噪音环境下的波动函数设定检验表现更佳.

5 Khmaladze鞅转换的特征与问题

5.1 Khmaladze鞅变换计算特征

Khmaladze鞅变换公式(11)涉及较复杂的积分结构, 从而造成相关统计量的计算偏复杂, 这在一定程度上限制了Khmaladze鞅变换的广泛应用. 为了直观理解Khmaladze鞅变换的计算, 根据Bai (2003)的分析, 将Khmaladze鞅变换(11)的W^n(t)Kg(U^n(t))写成如下微分表达式:
dW^n(t)=dU^n(t)g(s)TΓs1s1g(r)dU^n(r)ds.
(24)
式(24)可以解释为连续时间版本的递归最小二乘法(recursive least squares method) 的递归残差(recursive residua). 具体而言, 考虑离散时间数据的线性回归模型:
yi=xiTβ+ei(i=1,,n),
其中, ei为i.i.d. 的误差项, xi为非随机的自变量. 则基于该回归模型得到的残差估计值e^i=eixiT(β^β)会依赖于普通最小二乘估计参数β^. 然后, 利用Khmaladze鞅变换微分表达式(24)可以将序列{e^i}i=1n转化为鞅差分序列(martingale-difference sequence). 在此把积分运算替换为求和运算, 并将dU^n(t)g(s)TdrΓss1g(r)dU^n(r)分别看作e^ixij=i+1nxjxjTj=i+1nxje^j. 于是(24)可以表示为:
e^ixiT(j=i+1nxjxjT)1j=i+1nxje^j=yixiTβ^ni,
(25)
其中, β^ni=(j=i+1nxjxjT)1j=i+1nxjyj表示基于后ni个观测值得到的最小二乘估计量. 只要对(25)做一定的常数正则变换便可得到第i个向后递归残差(backward recursive residual):
ξ^i=yixiTβ^ni1+xiT(j=i+1nxjxjT)1xi.
可见, Khmaladze鞅变换可以将线性回归模型的普通最小二乘估计残差映射至递归最小二乘估计残差. 由于递归残差ξ^i的鞅差分性质, 用其构造的部分和过程将会收敛于布朗运动. 相应的, 连续时间版本的递归残差(即式(24))的积分(即式(11)) 会收敛到布朗运动. Khmaladze鞅变换的递归最小二乘估计思想可以结合数值积分来计算Khmaladze鞅变换公式, 具体可参考Bai (2003)Parker (2013)Chen et al. (2015).
最近, Kim (2020)通过对Khmaladze鞅变换的结构分析提出一种更加快速、准确的计算方法, 其所提出算法的主要思想为“提前集成策略(the strategy of integration-in-advance)”. 由于Kim (2020)的研究结果仅限于对正态分布的假设检验, Kim (2023)进一步将此算法应用于位置尺度家族的非正态分布的假设检验. Kim对此算法提供了相关的R软件包“GofKmt”, 见 https://cran.r-project.org/web/packages/GofKmt/index.html (命令为: KhmaladzeTrans). 目前, R软件还提供了基于Khmaladze鞅变换的其它问题的检验程序包: 如Koenker and Xiao (2002, 2006)的分位数回归的软件包有“quantreg”和“Qtools”, 分别见 https://cran.r-project.org/web/packages/quantreg/index.html (命令为: KhmaladzeTest)与 https://cran.r-project.org/web/packages/Qtools/index.html (命令为: KhmaladzeFormat); Chung and Olivares (2021)的排列检验(permutation test)的软件包为“RATest”, 见 https://cran.r-project.org/web/packages/RATest/index.html (命令为: PT.Khmaladze.fit、PT.Khmaladze.fit和PTQTE.Khmaladze.fit).

5.2 基于Khmaladze鞅变换检验的功效特征

基于Khmaladze鞅变换的检验统计量一般都能达到n-的局部功效, 这也是大部分检验统计量所能达到的局部功效. Khmaladze鞅变换的一个很重要的优点是可以得到渐近分布无关的计量检验方法. 有了渐近分布无关的检验统计量, 便可以很方便地得到相应检验统计量的检验临界值; 而且分布无关的检验方法能够较好地避免或减轻因不同数据特征差异对估计和检验结果的影响. 因此, Khmaladze鞅变换是处理Durbin问题的一个便捷方法.
多数情况下, Khmaladze鞅变换被看作是自助法的一个很好的替代. 正如上文提到过, 自助法应用起来比较麻烦且耗时, 而基于Khmaladze鞅变换方法的检验统计量的应用相对要方便. 除此之外, 基于Khmaladze鞅变换的检验方法还可能比基于自助法的检验方法有更好的检验效果. Koul and Sakhanenko (2005)针对非线性回归模型的检验, 通过蒙特卡罗模拟比较了基于Khmaladze鞅变换的Kolmogorov-Smirnor检验方法与其他若干种基于自助法的检验方法. Koul and Sakhanenko (2005)模拟结果发现: 基于Khmaladze鞅变换的检验方法总体上要好于基于自助法的检验方法. Kim (2016)还通过模拟比较了鞅变换方法与经验似然(empirical likelihood)法对单样本位置尺度族分布函数的检验效果, 结果表明鞅变换方法在大多数情形下具有更好的检验功效. 之所以Khmaladze鞅变换方法对参数经验过程做了投影后仍保持比较好的检验功效的一个重要原因在于: 它是线性的垂直映射和保距映射.
然而, 采用Khmaladze鞅变换方法并不是没有代价的. 正如Song (2010)所述, 对于某些备择假设, Khmaladze鞅变换方法可能会增大检验统计量的功效; 而对于另一些备择假设, Khmaladze鞅变换方法可能会减小检验统计量的功效, 甚至检验统计量在某个方向的功效被完全消除. 不过, Khmaladze鞅变换方法的这一不利影响方向通常是可以找到的, 并且其影响通常也是很微小的. 为了具体说明此问题, 对上文原假设H20的检验, 考虑如下局部备择假设:
H21:F(){(1δn)F(,θ)+δnH(,θ):θΘ}.
其中, F(,θ)H(,θ)是不同的函数. 根据Bai (2003)的推导过程, 可以类似得到:
U^n(t)=Un(t)g¯(t)Tn(θ^θ0)+δκ(t)+op(1),
其中, κ(t)plim1ni=1nHi(Fi1(t,θ0),θ0)t.
显然在H21下, κ(t)0. 对(8)式的U^n(t)进行Khmaladze鞅变换可以得到:
Kg(U^n(t))B(t)+δκ(t)δTg(κ(t))+op(1),
(26)
其中, KgTg定义见(8)式. 由式(26)知, 当
κ(t)Tg(κ(t))=0
(27)
时, 基于Kg(U^n(t))的检验统计量将不具有检验功效. 因此, 这可以看作是利用Khmaladze鞅变换方法的一个成本. 不过, 这样的成本影响是微乎其微的. 根据Bai (2003)的引理2知, 式(27)成立当且仅当存在某常数向量c(t)=Γg(t)1t1g(r)κ(r)dr (记为c) 使得κ(t)=cTg(t). 而是否存在这样的常数向量c仍不得而知. 实际上, Bai (2003)分析表明对于所有的位置尺度模型, κ(t)=cTg(t)当且仅当c=0. 可见, 至少对于所有位置尺度模型, Khmaladze鞅变换方法都不会改变检验统计量的相合性.

5.3 多维Khmaladze鞅变换问题

由于多维的鞅过程结构复杂, 且存在较多限制条件(见Gikhman, 1982; Nualart, 1983), 对多维随机变量形成的经验过程进行上述类似Khmaladze鞅变换处理存在不少困难, 如多维极限过程不唯一以及维数诅咒(curse of dimensionality) 问题.
首先, 关于多元随机变量分布的检验, Khmaladze(1988, 1993)提出了扫描式的鞅方法来变换多维经验过程得到渐近分布无关性. 从而, 将此鞅变换理论推广到多维分布的拟合检验以及更抽象的泛函分布的检验. 基于扫描式的鞅方法, Angrist and Kuersteiner (2011)将鞅变换方法与Rosenblatt变换结合, 对因果效应的时间序列模型提出了一套半参数的条件独立检验方法; Delgado and Stute (2008)同样结合了Rosenblatt变换, 将鞅变换方法应用于二维的参数条件分布的检验. 关于Copula检验的一些文献(如Can et al., 2015, 2020; Lu and Zheng, 2020)都利用到了扫描式的鞅方法来处理多维经验过程的鞅变换.
简单而言, Khmaladze通过定义一族正交投影算子{πλ}, 0λ1来构建新息过程(innovation process) 的增量. 为了直观理解该正交投影算子的构造, 定义扫描族(scanning family){Aλ:0λ1}d维实数空间Rd的一族可测子集, 且满足: (i) λλAλAλ, (ii) L(A0)=0,L(A1)=1, (iii) λλL(AλAλ)0, 其中L(A)表示子集A的勒贝格测度. 则对于函数f(x)做此投影的运算结果为πλf(x)=I(xAλ)f(x), 与其互补的投影运算结果为πλf(x)=I(xAλ)f(x). 若对任意0λ1, 矩阵Cλ=πλq,πλqT非奇异. 则w^(f)=v^(f)f,dπλqTCλv^(πλq)是关于参数函数经验过程v^(f)的扫描式新息(scanning innovation), 其中q为参数经验过程v^(f)相应的得分向量. 此处的子集族{Aλ}的选择不唯一. 需要说明的是{Aλ}的不同选择也会影响检验功效, 但还没有文献对最优的{Aλ}探讨过. 特别的, 当d=1时, w^(f)就退化为上文一维的鞅变换表达式(8).
由于针对多维经验过程的Khmaladze鞅变换不唯一, 且比较复杂. 一些研究将多元经验过程问题降为一维经验过程后再应用一维的Khmaladze鞅变换构建渐近分布无关的检验统计量(如Bai and Chen, 2008).
其次, 针对回归模型(15), 当X为多维变量(d>1), 若基于自变量向量联合分布构造多维经验过程, 同样会遇到多维经验过程的鞅变换问题. 对此, Khmaladze and Koul (2004)也给出基于扫描式的鞅方法, 并指出构建鞅变换的经验过程只需要基于X构建的扫描族{Az:zR}是关于z严格递增绝对连续函数. 例如, 令Xj表示d维变量X的第j分量, 若X1的边际分布是绝对连续, 我们就可以用Az={xR:x1x}作为扫描族; 亦或若X1++Xd的分布是绝对连续, 我们就可以用Az={xR:x1++xdx}作为扫描族.
不同于扫描式的鞅方法, Stute and Zhu (2002)在i.i.d. 框架下通过对广义线性模型的自变量向量X进行投影降维成βTX, 可得到如下标记的经验过程:
Vn(x)=1ni=1nYim(β0TX,θ0)vI(β0TXix).
(28)
与式(16)不同, 式(28)涉及两类参数(即β0θ0)需要估计. 通过估计β0θ0得到估计的参数经验过程后再利用Khmaladze鞅变换得到渐近分布无关的模型检验统计量.
不论是Khmaladze and Koul (2004)基于扫描式的鞅变换检验方法, 还是Stute and Zhu (2002)的投影后再鞅变换的检验方法, 都只是基于原假设下模型结构的部分维度的信息; 因此它们是一种方向性检验(directional test), 不具备全局性(omnibus), 即不能对所有的备择假设保持相合性.
为了得到既克服维数诅咒问题又具备全局性的多元参数回归模型的检验统计量, Escanciano (2006)同样采用了对自变量向量X进行投影降维成βTX的方法来克服多维变量的维数诅咒问题. 与Stute and Zhu (2002)只考虑将检验的方向固定到β0不同, Escanciano (2006)同时考虑了βSd (Sd={βRd:|β|=1})的所有方向. 为了统计量的计算可行, Escanciano (2006)定义新的Cramer-von Mises检验统计量将β积分消去. 理论上, Escanciano检验统计量虽然具备全局性, 但Escanciano (2006)也指出其检验效果未必一定优于Bierens (1982)Stute (1997)的检验统计量. 另外, Escanciano检验统计量的极限分布会依赖于实际数据生成过程(DGP)与原假设形式, 即不满足分布无关性; 因此其无法得到具有一般性的检验临界值, 而需要通过自助法(bootstrap)完成检验.
最近, Tan et al. (2018, 2019)结合Guo et al. (2016)所提出的适应于模型(adaptive-to-model)的降维技术和Khmaladze鞅变换探讨了高维回归模型的检验, 提出了同时满足全局性和渐近分布无关性的检验统计量. Tan et al. (2019)还进一步拓展了这类检验于自变量向量维度可以至无求大的情形. 这些高维模型的检验的众多文献也是通过投影降维后再应用Khmaladze鞅变换.

6 Khmaladze酉变换

6.1 Khmaladze酉变换产生的理论背景

Khmaladze酉变换的初衷是将离散分布的皮尔森卡方检验的渐近分布无关性, 推广至包括多维参数分布在内的一般情形. 由上文知, 针对一维连续分布函数, 根据Kolmogorov (1933), 通过变换时间为t=F(x), 可以得到分布无关的均匀经验过程. 基于此, 众多关于连续分布函数的渐近分布无关的检验统计量被提出. 然而在很长一段时间里, 除了皮尔森卡方检验统计量外, 针对离散分布的检验统计量都不满足分布无关性(见Khmaladze, 2013; Koul and Koenker, 2016). 也就是说, 针对离散分布函数的拟合检验无法通过类似Kolmogorov变换构造出多种满足渐近分布无关性的检验统计量. 为了让离散分布的参数函数检验也能有类似连续分布检验的渐近分布无关的统计量, Khmaladze(2013, 2016)提出第二种变换: Khmaladze酉变换.
为了具体说明针对离散分布函数的拟合检验存在的问题, 考虑总样本量为n的样本分配为N组, 每组出现样本的频率为(vin)i=1N. 令p=(p1,,pN)为对应的离散概率密度向量, 则所有pi>0i=1Npi=1. 考虑其对应的卡方检验统计量的成分:
Yin=vinnpinpi.
根据Khmaladze (2013)知向量Yn(Y1n,,YNn)会收敛至以下极限过程:
Yp=ΛΛ,pp.
(29)
其中, Λ(Λi)i=1N独立标准正态随机变量的向量, ,表示内积运算, Yp可视为将Λ投影至向量p=(pi)i=1N后得到的残差项. 显然, Yp的分布会依赖于p. 令人意外的是基于Yn的卡方统计量Yn,Yn=i=1NYin2会收敛至自由度为N1的卡方分布, 即其极限分布不依赖于p.
考虑如下基于Yin的部分和过程:
i=1kvinnpinpii=1kvinnpin,k=1,2,,N.
其可以看作基于离散分布版本的经验过程. 根据上文分析知该部分和过程会依赖于p. 自然的疑问是上述部分和过程是否也可以变换出类似连续分布所构造渐近分布无关的经验过程. 一些学者试图探讨针对离散分布来构造渐近分布无关的检验统计量. 如Greenwood and Nikulin (1996)提出用片段线性(piece-wise linear) 阶梯分布函数F~代替离散分布函数, 这为通过时间尺度变换t=F~(x)构造渐近分布无关检验统计量提供了可能性. 然而, 即使不去质疑对阶梯函数取值的近似误差影响, Greenwood and Nikulin (1996)的方法也只适用于一维随机变量情形. 为此, Khmaladze(2013, 2016)提出了一个新的变换试图将卡方检验统计量中的成分Yn映射至渐近分布无关的向量Zn(见下文(30)式). 从而, 基于Zn所构建的检验统计量同样满足渐近分布无关性.

6.2 Khmaladze酉变换原理

Khmaladze酉变换的大致想法是: 在检验分布p是否为真实分布时, 我们将基于(29)式的Yp进行推断; 而在检验另一分布q是否为真实分布时, 我们将类似地基于Yq进行推断. 其中, YpYq都可以看作是X的投影. 在此情形下, 若我们能将其中一种投影映射至另一投影(如把对p的检验问题映射至对q的检验问题, 或者都映射至另一个对τ的检验问题); 那么, 我们就可以选择某个特定的τ (如N维均匀分布), 使得检验问题变成标准化的检验, 以便于构造渐近分布无关的检验统计量.
根据上文6.1节知, Yn的极限Yp可视为将Λ投影至向量p=(pi)i=1N后得到的残差项. 且Yp的分布会依赖于p. 为了得到渐近分布无关的检验统计量, Khmaladze (2013)建议将关于分布p的检验问题转化为具有N维离散均匀分布的检验问题. 具体而言, Khmaladze酉变换应用到如下酉算子进行投影映射:
Uϕ1,ϕ2=I2ϕ1ϕ2F2(ϕ1ϕ2)ϕ1ϕ2,F,
其中, I为恒等算子(identity operator), ϕ1ϕ2为任意平方可积函数, ϕ1ϕ2F2=2(1ϕ1,ϕ2)表示两个函数间的Hellinger距离. 该酉算子Uϕ1,ϕ2ϕ1映射到ϕ2上, 且将ϕ2映射到ϕ1; 而将所有与ϕ1ϕ2垂直的成分映射到自身; 即: Uϕ1,ϕ2ϕ1=ϕ2, Uϕ1,ϕ2ϕ2=ϕ1Uϕ1ϕ2ϕ3=ϕ3,ϕ3ϕ1,ϕ2.
ϕ1q=pϕ2τ=(1/N,,1/N)T (Khmaladze (2013)还给出了其他形式的τ向量, 只要求其为单位范数的向量即可), 并对向量Yn作酉变换, 由此得到的Uq,τYn=Zn=(Zin)i=1N满足:
Zn=YnYn,τ11p,τ(τp).
(30)
Zin=vinnpinpi1Nj=1Nvjnnpjnpj11j=1mpj/N(1Npj).
(31)
向量Zn=(Z1n,,Zmn)会收敛至以下极限过程:
Z=ΛΛ,ττ=Λ1NΛ,ιι,
其中ι=(1,,1)TN维的单位向量. 该极限过程不依赖于p. 相应的, 对离散分布p的检验问题被转化成相同维度的均匀分布的检验问题. 此时, 部分和过程i=1kZin渐近表现为离散版本的布朗桥形式. Khmaladze (2015)还基于酉变换探讨了不同布朗桥之间的相互变换关系.

6.3 包含估计参数情形

当所检验的离散分布函数存在未知参数θ时, 离散分布的未知参数θ可用其n-相合估计θ^代替, 从而得到:
Y^in=vinnpi(θ^n)npi(θ^n).
Khmaladze (2013)证明了Y^n=(Y^1n,,Y^Nn)会收敛至以下高斯向量:
Y^p=ΛΛ,ppΛ,q^q^,
其中, q^为与参数估计产生的得分函数p˙/p有关的向量(p˙表示p(θ)对参数θ的导数), 且满足pq^. 可见, 极限过程Y^p可视为将Λ投影至向量p=(pi)i=1mp˙/p后得到的残差项. 此时的极限不仅依赖于p, 还依赖于参数估计.
为了消除分布函数设定和参数估计的影响, 同样可以对Y^n做酉变换来实现. 具体而言, 取两个相互垂直的单位范数的N维向量ττ^ (如取τ=(1/N,,1/N)Tτ^=(1/N,,1/N,1/N,,1/N)T)使得i=1Nτ^i=0. Khmaladze (2013)指出τ^可视为对τ标准化的得分函数. 进而对Y^n依次做酉变换Z^n=Uq~τ^UqτY^n得到Z^n=(Z^1n,,Z^Nn)的极限高斯向量为:
Z^=ΛΛ,ττΛ,τ^τ^.
此极限向量Z^只依赖于ττ^, 而不依赖于p(θ). 之所以如此的大致原理为: Uq,τ首先将Y^n中的q=p(θ)映射至τ, 且将q^映射至q~=Uq,τq^. 根据酉变换的性质有τq~. 由于q~τ^都与τ垂直, 则酉变换Uq~,τ^将不改变UqτY^n中的τ, 而会将UqτY^n中的q~映射至τ^. 因此可以基于Z^n构造渐近分布无关检验统计量.

6.4 拓展与应用

学术界对Khmaladze酉变换的探讨与应用仍十分有限. Khmaladze (2016)将上述基于卡方检验统计量的酉变换引入到经验过程的酉变换分析, 拓展了酉变换至更一般的多维分布函数的检验(包括连续分布、离散分布, 简单假设、复合假设等情形); 并探讨了此酉变换的唯一性、变换后的过程收敛速度等问题. Khmaladze(2017, 2021a)进一步将酉变换方法拓展至包含协变量(covariate) 情形的分布函数拟合检验及一般参数回归模型的检验. Khmaladze(2020, 2021b, 2021c)将酉变换方法分别应用于点过程随机强度函数、马尔可夫序列转移密度函数及连续时间Ornstein-Uhlenbeck过程的检验. Dumitrescu and Khmaladze (2019)将酉变换方法应用于色盲问题的边际分布函数检验.
Nguyen(2017a, 2018)在列联表(contingency table) 框架下基于Khmaladze酉变换研究了两个离散随机变量的独立性检验. Nguyen (2017b)还基于Khmaladze酉变换探讨了规则变化尾分布(regularly varying tail distributions)的检验. Roberts (2019)将酉变换方法应用于来自单一分布族伯努利实验(Bernoulli trials) 的拟合检验. Roberts (2021)通过引入一些简化条件从更基础的方式重新系统地推导了Khmaladze酉变换. Roberts et al. (2023)将Khmaladze酉变换应用拉普拉斯分布族的检验. Bancolita (2019)对Khmaladze酉变换的不同方法做了比较分析. 目前, 仍很少有文献将Khmaladze酉变换应用于实际数据的实证分析. Kennedy (2018)将Khmaladze酉变换应用于高频外汇数据的分析.

7 总结与展望

为了解决检验理论中Durbin问题, Khmaladze先后提出了两种不同形式的变换: 鞅变换和酉变换. Khmaladze所提出的两种变换都是通过特定的数学变换, 对经验过程进行投影, 获得不依赖于特定分布函数的经验过程, 从而可以基于变换后的经验过程构造渐近分布无关的检验统计量. 其中, Khmaladze鞅变换是将某经验过程(通常是某种布朗桥) 投影成布朗运动, 而Khmaladze酉变换是将某经验过程(如布朗桥) 投影成另一种布朗桥, 并且不会丢失任何统计信息(Roberts, 2021). 另外, 针对分布函数的拟合检验, Khmaladze鞅变换可用于连续分布的简单假设和复合假设的检验; 而Khmaladze酉变换不仅适用于连续分布情形, 也适用于离散分布情形. 总之, 从最初的分布函数拟合检验问题到回归模型的设定检验问题, 再到半参数非参数模型的检验问题等, Khmaladze变换的理论自身已被不断拓展和完善. 该理论方法也已逐渐被广泛应用于各类检验问题的研究中.
根据上文对Khmaladze变换的理论与应用的总结, 本文认为其仍存在一些值得进一步探讨的问题.
首先, 目前关于Khmaladze变换的理论主要集中于模型设定检验方法的应用, 暂未有其在估计方法的应用. Khmaladze变换的其中一个重要作用就是消除参数估计误差对统计量的影响. 对于一些需要采用分阶段估计模型的情形, 或许可以在前面阶段的估计参考Khmaladze变换方法抵消其对后面阶段估计的影响. 因此, 能否将Khmaladze变换方法拓展至估计方法的研究仍需要进一步摸索.
其次, Khmaladze变换与自助法都可以处理检验理论中Durbin问题. 通常认为两者可以相互替代. 但在有些情形, 自助法可能无能为力时, 此时可以考虑应用Khmaladze变换. 例如, Vetter and Dette (2012)提出的波动函数设定检验方法, 在存在噪声的情况下, 需要通过自助法来确定检验统计量的临界值. 然而, 自助法需要对噪声进行模拟, 这在处理具有相依性噪声的情况时变得复杂且难以应用. 相比之下, 基于Khmaladze变换的检验方法提供了一种替代方案, 它能够绕过对噪声模拟的需要, 从而可能适用于包含相依性噪声的情形. 因此, 在将来的理论方法研究中可以多挖掘和发展Khmaladze变换在类似相关情形的应用.
第三, Khmaladze鞅变换的一个很大优点是可以得到具有分布无关性的检验统计量, 从而在检验过程可以避开采用耗时的自助法. 这对于讲究时间成本的检验方法十分有利, 如高频数据模型的实时诊断检验等. 此外, 其对于一些在线数据更新、递归模型的诊断检验方法的研究也有参考价值.
最后, Khmaladze鞅变换方法已逐渐被广泛应用于各类检验问题的研究中. 然而, Khmaladze酉变换方法仍未得到学术界的广泛探讨. 相关的理论与应用还有不少问题需要探索.

参考文献

陈强, 陈娟, 陈道轮, 美元指数的动态演化机理——基于扩散模型的实证分析[J]. 国际金融研究, 2016, 4, 37- 48.
Chen Q, Chen J, Chen D L, The Dynamic Evolution Mechanism of the U.S. Dollar Index: Empirical Analysis Based on Diffusion Models[J]. Studies of International Finance, 2016, 4, 37- 48.
陈强, 龚玉婷, 基于近邻截断的跳跃扩散过程波动函数的设定检验[J]. 中国管理科学, 2020, 28(7): 45- 56.
Chen Q, Gong Y T, Specification Test of Volatility Functions in Jump Diffusion Processes Using Nearest Neighbor Truncation[J]. Chinese Journal of Management Science, 2020, 28(7): 45- 56.
陈强, 刘伟强, 胡美娣, 微观噪音下扩散模型波动函数的非参数设定检验及其应用[J]. 应用数学学报, 2024, 47(3): 443- 463.
Chen Q, Liu W Q, Hu M D, Nonparametric Specification Test for Volatility Function in Diffusion Model and Its Applications Under Microstructure Noise[J]. Acta Mathematicae Applicatae Sinica, 2024, 47(3): 443- 463.
陈强, 郑旭, 许秀, 基于鞅转化的利率模型漂移函数的设定检验[J]. 管理科学学报, 2014, 17(11): 43- 56.
Chen Q, Zheng X, Xu X, Martingale-transformation-based Specification Test for Drift Function of Interest Rate Model with Applications[J]. Journal of Management Sciences in China, 2014, 17(11): 43- 56.
夏强, 梁茹冰, 李高荣, 参数单指标分位数自回归模型的诊断检验[J]. 中国科学: 数学, 2019, 49(6): 879- 898.
Xia Q, Liang R B, Li G R, Model Checking for Parametric Single-index Quantile Autoregression[J]. SCIENTIA SINICA Mathematica, 2019, 49(6): 879- 898.
Akritas M G, Van Keilegom I, Nonparametric Estimation of The Residual Distribution[J]. Scandinavian Journal of Statistics, 2001, 28, 549- 567.
Andersen P K, Borgan O, Gill R D, Keiding N, Statistical Models Based on Counting Processes[M]. New York: Springer, 1993.
Angrist J D, Kuersteiner G M, Causal Effects of Monetary Shocks: Semiparametric Conditional Independence Tests With a Multinomial Propensity Score[J]. Review of Economics and Statistics, 2011, 93, 725- 747.
Bai J, Testing Parametric Conditional Distributions of Dynamic Models[J]. Review of Economics and Statistics, 2003, 85, 531- 549.
Bai J, Chen Z, Testing Multivariate Distributions in GARCH Models[J]. Journal of Econometrics, 2008, 143(1): 19- 36.
Bai J, Ng S, A Consistent Test for Conditional Symmetry in Time Series Models[J]. Journal of Econometrics, 2001, 103, 225- 258.
Balakrishna N, Kim J, Koul H L, Lack-of-fit of a Parametric Measurement Error AR(1) Model[J]. Statistics & Probability Letters, 2020, 166, 108872.
Bancolita J, (2019). Numerical Investigation of Khmaladze Projection Approach in Regression[R]. Research Report, SMS VUW.
Bickel P J, A Distribution Free Version of the Smirnov Two-sample Test in the Multivariate Case[J]. Annals of Mathematical Statistics, 1969, 40, 1- 23.
Bickel P J, Ritov Y, Stoker T M, Tailor-made Tests for Goodness of Fit to Semiparametric Hypotheses[J]. Annals of Statistics, 2006, 34(2): 721- 741.
Bierens H, Consistent Model Specification Tests[J]. Journal of Econometrics, 1982, 20, 105- 134.
Can S U, Einmahl J, Khmaladze E V, Laeven R, Asymptotically Distribution-free Goodness-of-fit Testing for Tail Copulas[J]. Annals of Statistics, 2015, 43(2): 878- 902.
Can S U, Einmahl J, Laeven R, Goodness-of-fit Testing for Copulas: A Distribution-free Approach[J]. Bernoulli, 2020, 26(4): 3163- 3190.
Chen Q, Gong Y, Wang X, Empirical-process-based Specification Tests for Diffusion Models[J]. Canadian Journal of Statistics, 2023, 51(4): 1055- 1083.
Chen Q, Hu M, Song X, A Nonparametric Specification Test for The Volatility Functions of Diffusion Processes[J]. Econometric Reviews, 2019, 38(5): 557- 576.
Chen Q, Liu W, Zhang Z, (2024). Specification Tests for The Volatility Function in Diffusion Model Under Microstructure Noise[R]. SUFE Working Paper.
Chen Q, Xu W, Gong Y, Jump-robust Testing of Volatility Functions in Continuous Time Models[J]. Canadian Journal of Statistics, 2022, 50(3): 1071- 1095.
Chen Q, Zheng X, Pan Z, Asymptotically Distribution-free Tests for The Volatility Function of a Diffusion[J]. Journal of Econometrics, 2015, 184, 124- 144.
Chown J, Bissantz N, Dette H, Goodness-of-fit Testing The Error Distribution in Multivariate Indirect Regression[J]. Electronic Journal of Statistics, 2019, 13(2): 2658- 2685.
Chung E, Olivares M, Permutation Test for Heterogeneous Treatment Effects With a Nuisance Parameter[J]. Journal of Econometrics, 2021, 225(2): 148- 174.
Delgado M, Stute W, Distribution-free Specification Tests of Conditional Models[J]. Journal of Econometrics, 2008, 143, 37- 55.
Delgado M A, Javier H, Carlos V, Distribution Free Goodness-of-fit Tests for Linear Processes[J]. Annals of Statistics, 2005, 33, 2568- 2609.
Delgado M A, Javier H, Carlos V, Distribution-free Specification Tests for Dynamic Linear Models[J]. Econometrics Journal, 2009, 12, 105- 134.
Dette H, Hetzler B, Khmaladze Transformation of Integrated Variance Processes With Applications to Goodness-of-fit Testing[J]. Mathematical Methods of Statistics, 2009, 18(2): 97- 116.
Dette H, Hetzler B, (2018). A Martingale-transform Goodness-of-fit Test for the Form of the Conditional Variance[R]. Technical Reports.
Dette H, Podolskij M, Testing the Parametric Form of the Volatility in Continuous Time Diffusion Models — A Stochastic Process Approach[J]. Journal of Econometrics, 2008, 143, 56- 73.
Dumitrescu L, Khmaladze E V, Asymptotic Hypotheses Testing for the Colour Blind Problem[J]. Electronic Journal of Statistics, 2019, 13, 4573- 4595.
Durante F, Sempi C, Principles of Copula Theory[M]. Boca Raton, FL: CRC Press, 2016.
Durbin J, Weak Convergence of the Sample Distribution Function When Parameters Are Estimated[J]. Annals of Statistics, 1973a, 1, 279- 290.
Durbin J, (1973b). Distribution Theory for Tests Based on the Sample Distribution Function[C]// Philadelphia, Society for Industrial and Applied Mathematics, (Regional Conference Series in Applied Mathematics).
Durbin J, Kolmogorov-Smirnov Tests When Parameters Are Estimated With Applications to Tests of Exponentiality and Tests on Spacings[J]. Biometrika, 1975, 62(1): 5- 22.
Durbin J, The First-passage Density of a Continuous Gaussian Process to a General Boundary[J]. Journal of Applied Probability, 1985, 22(1): 99- 122.
Escanciano J C, A Consistent Diagnostic Test for Regression Models Using Projections[J]. Econometric Theory, 2006, 22, 1030- 1051.
Einmahl J, Khmaladze E V, (2001). The Two-sample Problem in Rm and Measure-valued Martingales[Z]. IMS Lecture Notes Monograph, 36: 434–463.
Fan J Q, Huang L S, Goodness-of-fit Tests for Parametric Regression Models[J]. Journal of The American Statistical Association, 2001, 96, 640- 652.
Fan J, Zhang C, A Reexamination of Diffusion Estimators With Applications to Financial Model Validation[J]. Journal of the American Statistical Association, 2003, 98, 118- 134.
Fan Y, Li Q, Consistent Model Specification Tests: Omitted Variables and Semiparametric Functional Forms[J]. Econometrica, 1996, 64(4): 865- 890.
Gao J, Casas I, Specification Testing in Discretized Diffusion Models: Theory and Practice[J]. Journal of Econometrics, 2008, 147(1): 131- 140.
Gikhman J I, On the Theory of ω2 Test[J]. Matematicheskii Zhurnal Kievskogo Universiteta, 1954, 5, 51- 59.
Gikhman J I, Biparametric Martingales[J]. (Russian) Uspekhi Matematicheskikh Nauk, 1982, 37, 215- 237.
Greenwood P, Nikulin M S, A Guide to Chi-Square Testing[M]. New York: Wiley, 1996.
Guo X, Wang T, Zhu L X, Model Checking for Parametric Single-index Models: A Dimension Reduction Model-adaptive Approach[J]. Journal of the Royal Statistical Society, Series B: Statistical Methodology, 2016, 78(5): 1013- 1035.
Hardle W, Mammen E, Comparing Nonparametric Versus Parametric Regression Fits[J]. Annals of Statistics, 1993, 21, 1926- 1947.
Haywood J, Khmaladze E V, On Distribution-free Goodness-of-fit Testing of Exponentiality[J]. Journal of Econometrics, 2008, 143(1): 5- 18.
Hjort N L, Goodness of Fit Tests in Models for Life History Data Based on Cumulative Hazard Rates[J]. Annals of Statistics, 1990, 18, 1221- 1258.
Kac M, Kiefer J, Wolfowitz J, on Tests of Normality and Other Tests of Goodness of Fit Based on Distance Methods[J]. Annals of Mathematical Statistics, 1955, 26(2): 189- 211.
Kennedy A P, (2018). Analysis and Prediction of High Frequency Foreign Exchange Data[D]. Master's Thesis School of Mathematics and Statistics, Victoria University, Wellington, New Zealand.
Khmaladze E V, The Use of ω2-tests for Testing Parametric Hypotheses[J]. Theory of Probability and Its Application, 1979, 2, 283- 301.
Khmaladze E V, Martingale Approach to the Goodness of Fit Tests[J]. Theory of Probability and Its Application, 1981, 26, 240- 267.
Khmaladze E V, An Innovation Approach to Goodness-of-fit Tests in Rm[J]. Annals of Statistics, 1988, 16, 1503- 1516.
Khmaladze E V, Goodness of Fit Problem and Scanning Innovation Martingales[J]. Annals of Statistics, 1993, 21, 798- 829.
Khmaladze E V, Note on Distribution Free Testing for Discrete Distributions[J]. Annals of Statistics, 2013, 41, 2979- 2993.
Khmaladze E V, Some New Connections Between Brownian Bridges and Brownian Motions[J]. Communications on Stochastic Analysis, 2015, 9(3): 401- 412.
Khmaladze E V, Unitary Transformations, Empirical Processes and Distribution Free Testing[J]. Bernoulli, 2016, 22, 563- 588.
Khmaladze E V, Distribution Free Testing for Conditional Distributions Given Covariates[J]. Statistics & Probability Letters, 2017, 129, 348- 354.
Khmaladze E V, Projection Approach to Distribution-free Testing for Point Processes. Regular Models[J]. Transactions of A. Razmadze Mathematical Institute, 2020, 174, 155- 176.
Khmaladze E V, Distribution-free Testing in Linear and Parametric Regression[J]. Annals of the Institute of Statistical Mathematics, 2021a, 73(6): 1063- 1087.
Khmaladze E V, Testing Hypothesis on Transition Distributions of a Markov Sequence[J]. Journal of Statistical Planning and Inference, 2021b, 215, 72- 84.
Khmaladze E V, How to Test That a Given Process is An Ornstein–Uhlenbeck Process[J]. Statistical Inference for Stochastic Processes, 2021c, 24, 405- 419.
Khmaladze E V, Koul H L, Martingale Transforms Goodness-of-fit Tests in Regression Models[J]. Annals of Statistics, 2024, 32, 995- 1034.
Khmaladze E V, Koul H L, Goodness-of-fit Problem for Errors in Nonparametric Regression: Distribution Free Approach[J]. Annals of Statistics, Institute of Mathematical Statistics, 2009, 37, 3165- 3185.
Kim J, (2016). Goodness-of-Fit Test: Khmaladze Transformation vs Empirical Likelihood[R]. Unpublished Manuscript.
Kim J, Implementation of a Goodness-of-fit Test Through Khmaladze Martingale Transformation[J]. Computational Statistics, 2020, 35(4): 1993- 2017.
Kim J, (2024). A Goodness of Fit Test for Non-Gaussian Distributions With Unknown Location and Scale Parameters[R]. Unpublished Manuscript.
Koenker R, Xiao Z, Inference on the Quantile Regression Process[J]. Econometrica, 2002, 70, 1583- 1612.
Koenker R, Xiao Z, Quantile Autoregression[J]. Journal of the American Statistical Association, 2006, 101, 980- 990.
Kolmogorov A N, Sulla Determinazione Empírica Di Uma Legge Di Distribuzione[J]. Giornale dell'Istituto Italiano degli Attuari, 1933, 4, 83- 91.
Koul H L, (2006). Model Diagnostics Via Martingale Transforms: A Brief Review[M]// Fan J, Koul H L. Frontiers in Statistics: 183–206.
Koul H L, Koenker R, A Conversation With Estate V. Khmaladze[J]. Statistical Science, 2016, 31, 453- 464.
Koul H L, Sakhanenko L, Goodness-of-fit Testing in Regression: A Finite Sample Comparison of Bootstrap Methodology and Khmaladze Transformation[J]. Statistics & Probability Letters, 2005, 74, 290- 302.
Koul H L, Song W, Regression Model Checking With Berkson Measurement Errors[J]. Journal of Statistical Planning and Inference, 2008, 138, 1615- 1628.
Koul H L, Song W, Model Checking in Partial Linear Regression Models With Berkson Measurement Errors[J]. Statistica Sinica, 2010a, 20, 1551- 1579.
Koul H L, Song W, Conditional Variance Model Checking[J]. Journal of Statistical Planning and Inference, 2010b, 140, 1056- 1072.
Koul H L, Stute W, Nonparametric Model Checks for Time Series[J]. Annals of Statistics, 1999, 27, 204- 236.
Koul H L, Yi T, Goodness-of-fit Testing in Interval Censoring Case[J]. Statistics & Probability Letters, 2006, 76, 709- 718.
Koul H L, Zhu X, Goodness-of-fit Testing of Error Distribution in Nonparametric ARCH(1) Models[J]. Journal of Multivariate Analysis, 2015, 137, 141- 160.
Li B, Asymptotically Distribution-free Goodness-of-fit Testing: A Unifying View[J]. Econometric Reviews, 2009, 28, 632- 657.
Li F, Testing the Parametric Specification of the Diffusion Function in a Diffusion Process[J]. Econometric Theory, 2007, 23, 221- 250.
Lu X, Zheng X, A Goodness-of-fit Test for Copulas Based on Martingale Transformation[J]. Journal of Econometrics, 2020, 215, 84- 117.
Maglaperidze N O, Tsigroshvili Z P, Van Pul M, Goodness-of-fit Tests for Parametric Hypotheses on the Distribution of Point Processes[J]. Mathematical Methods of Statistics, 1998, 7, 60- 77.
Marzec L, Marzec P, Generalized Martingale-residual Processes for Goodness-of-fit Inference in Cox's Type Regression Models[J]. Annals of Statistics, 1997, 25(2): 683- 714.
McKeague I, Nikabadze A, Sun Y, An Omnibus Test for Independence of a Survival Time From a Covariate[J]. Annals of Statistics, 1995, 23, 450- 475.
Mora J, Neumeyer N, (2005). The Two-sample Problem With Regression Errors: An Empirical Process Approach[R]. Working Papers. Serie AD.
Müller U U, Schick A, Wefelmeyer W, Estimating the Error Distribution Function in Semi-parametric Regression[J]. Statist, 2007, 25, 1- 18.
Müller U U, Schick A, Wefelmeyer W, Estimating the Error Distribution Function in Nonparametric Regression With Multivariate Covariates[J]. Statistics & Probability Letters, 2009, 79, 957- 964.
Müller U U, Schick A, Wefelmeyer W, Estimating the Error Distribution Function in Semiparametric Additive Regression Models[J]. Journal of Statistical Planning and Inference, 2012, 142, 552- 566.
Nelsen R B, An Introduction to Copulas[M]. New York: Springer-Verlag, 2006.
Nguyen C, (2010). Time-changed Residual Based Tests for Asset Pricing Models in Continuous Time[Z]. Unpublished Manuscript, 2010.
Nguyen T T M, New Approach to Distribution Free Tests in Contingency Tables[J]. Metrika, 2017a, 80, 153- 170.
Nguyen T T M, (2017b). Asymptotic Methods of Testing Statistical Hypotheses[D]. School of Mathematics and Statistics, Victoria University, Wellington, New Zealand.
Nguyen T T M, (2018). Asymptotically Distribution-free Goodness-of-fit Tests for Testing Independence in Contingency Tables of Large Dimensions[M]// La Rocca M, Liseo B, Salmaso L. Nonparametric Statistics. ISNPS.
Nikabadze A, Stute W, Model Checks Under Random Censorship[J]. Statistics & Probability Letters, 1997, 32, 249- 259.
Nualart D, Two-parameter Diffusion Processes and Martingales[J]. Stochastic Processes and Their Applications, 1983, 15(1): 31- 57.
O'Quigley J, Khmaladze-type Graphical Evaluation of the Proportional Hazards Assumption[J]. Biometrika, 2003, 90, 577- 584.
Parker T, A Comparison of Alternative Approaches to Sup-norm Goodness of Fit Tests With Estimated Parameters[J]. Econometric Theory, 2013, 29(5): 969- 1008.
Roberts L A, Distribution Free Goodness of Fit Testing of Grouped Bernoulli Trials[J]. Statistics & Probability Letters, 2019, 150, 47- 53.
Roberts L A, (2021). On the Derivation of the Khmaladze Transforms[R]. Unpublished Manuscript.
Roberts B, Haywood J, Swordson E, Distribution Free Testing for the Family of Laplace Distributions[J]. Communications in Statistics-Simulation and Computation, 2023, 1- 12.
Rosenblatt M, Remarks on the Multivariate Transformation[J]. Annals of Mathematics and Statistics, 1952, 23(3): 470- 472.
Scheike T H, Martinussen T, On Estimation and Tests of Time-varying Effects in the Proportional Hazards Model[J]. Scandinavian Journal of Statistics, 2004, 31, 51- 62.
Simpson, Paul B, Note on the Estimation of a Bivariate Distribution Function[J]. Annals of Mathematics and Statistics, 1951, 22(3): 157- 176.
Sklar A, (1959). Fonctions De Répartition À n Dimensions Et Leurs Marges[C]// Annales De l'ISUP. 8(3): 229–231.
Sminov N V, Estimate of Deviation Between Empirical Distributions in Two Independent Samples[J]. Bulletin Moscow University, 1939, 2, 3- 16.
Song K, Testing Semiparametric Conditional Moment Restrictions Using Conditional Martingale Transforms[J]. Journal of Econometrics, 2010, 154, 74- 84.
Song W, Distribution-free Test in Tobit Mean Regression Model[J]. Journal of Statistical Planning and Inference, 2011, 141(8): 2891- 2901.
Song W, Du J, Distribution-free Lack-of-fit Tests in Balanced Mixed Models[J]. Statistics & Probability Letters, 2010, 80(17-18): 1378- 1387.
Stute W, Thies S, Zhu L, Model Checks for Regression: An Innovation Process Approach[J]. Annals of Statistics, 1998, 26, 1916- 1934.
Song W, Yao W, A Lack-of-fit Test in Tobit Errors-in-variables Regression Models[J]. Statistics & Probability Letters, 2011, 81(12): 1792- 1801.
Stute W, Nonparametric Model Checks for Regression[J]. Annals of Statistics, 1997, 25(2): 613- 641.
Stute W, Zhu L X, Model Checks for Generalized Linear Models[J]. Scandinavian Journal of Statistics, 2002, 29, 535- 545.
Sun Y, Weak Convergence of the Generalized Parametric Empirical Processes and Goodness-of-fit Tests for Parametric Models[J]. Communications in Statistics, 1997, 26(10): 2393- 2413.
Sun Y, Tiwari R C, Zalkikar J N, Goodness of Fit Tests for Multivariate Counting Process Models With Applications[J]. Scandinavian Journal of Statistics, 2001, 28, 241- 256.
Tan F, Zhu X H, Zhu L X, A Projection-based Adaptive-to-model Test for Regressions[J]. Statistica Sinica, 2018, 28, 157- 188.
Tan F, Zhu L X, Adaptive-to-model Checking for Regressions With Diverging Number of Predictors[J]. Annals of Statistics, 2019, 47(4): 1960- 1994.
Tang Y, Su T, Zhang Z, Distribution-free Specification Test for Volatility Function Based on High-frequency Data With Microstructure Noise[J]. Metrika, 2022, 85, 977- 1022.
Tsigroshvili Z, (1998). Some Notes on Goodness-of-fit Tests and Innovation Martingales[C]// Proceedings of A. Razmadze Mathematical Institute, 117: 89–102.
Urinov I K, Tests of Homogeneity Under Small Grouping. Martingale Limit Theorems[J]. Theory of Probability & Its Applications, 2006, 37(4): 676- 694.
Vetter M, Dette H, Model Checks for the Volatility Under Microstructure Noise[J]. Bernoulli, 2012, 18, 1421- 1447.
Zamba K D, Adekpedjou A, A Khmaladze-transformed Test of Fit With ML Estimation in the Presence of Recurrent Events[J]. Sequential Analysis, 2019, 38(3): 318- 341.
Zheng J X, A Consistent Test of Functional Form Via Nonparametric Estimation Techniques[J]. Journal of Econometrics, 1996, 75, 263- 289.

基金

中央高校基本科研业务费专项资金(2023110139)

版权

版权所有,未经授权。
PDF(400 KB)

1026

Accesses

0

Citation

Detail

段落导航
相关文章

/