2018年的高斯奖(Carl Friedrich Gauss Prize )授予了统计学教授David Donoho(大卫·多诺霍),以表彰他“在信号处理的数学、统计和计算分析方面做出的基本贡献。”
○ 斯坦福大学统计学教授David Donoho。| 图片来源:Stanford University
对高科技医疗护理来说,核磁共振成像扫描(MRI)是至关重要的一部分:它所呈现出的人体内部的三维视图,让医生得以发现处于破裂边缘的动脉瘤,能掠过大脑从而布局手术计划,或者精确地找到骨头上出现的微小裂缝——所有的这一切都无需动用到一把手术刀或一丝的辐射。而且对于接受扫描的病人来说,配合完成MRI扫描所需的技术要求则很低:病人只需静静地在一个狭窄的、嗡嗡作响的管子里,持续地躺约一小时的时间。
○ MRI。| 图片来源:IMU
但现在,冗长的扫描过程被加快了十倍之多,这都多亏了正进入临床使用中的一代新的MRI扫描仪。新的技术可为全球每年进行的8000万次MRI扫描节省大量时间和金钱,而且让那些无法长时间保持静止的孩子也能接受MRI扫描。扫描速度的加快还能帮助实现雄心勃勃的3D扫描和心脏跳动的MRI“影像”。
启发了将这些新设备推向市场的工程师和医生的,是发表于2006年的数学期刊上的一些见解。如今,这种见解被称为“压缩感知”(Compressed Sensing),这个词是由2018年高斯奖得主David Donoho所创造的术语。而高斯奖表彰的正是这些具有超越数学影响的数学研究。
Donoho与Emmanuel Candè、陶哲轩(Terence Tao)以及其他数学家一起,在21世纪00年代中期发表了数学分析,以显示压缩感知或许具有实际应用,并成功地提出了足以激发进一步研究的算法。随之而来的是大量的数学和实验工作,这一理论在应用数学家、谐波分析学家和信息理论家的推动得到了长足的发展;为了让计算称为可能,数值分析师和计算机科学家创造出快速地算法;MRI研究人员也提供了许多他们自己对核磁共振物理学的深刻理解和更多的开创性见解。
FDA(美国食品及药物管理局)对新医疗设备的任何潜在创新都设置了很高的标准。然而FDA在2017年批准了压缩感知设备,这距离压缩感知的论文首次出现在数学期刊上仅仅十年。这就是影响力!
I. 稀疏性
Donoho是最早发展用数学来描述稀疏信号的研究者之一。稀疏信号是指在多数情况下为零,只会偶尔出现非零波动的信号。这样的例子比比皆是:例如夜空,偶有一颗星星点缀着广袤的黑暗——那么少数出现的星星用孤独的“1”来代表,而无边的黑暗则可用“0”来表示。再例如人类的基因组,对两个不同的人来说,每300个核苷酸才会出现一次不同。
Donoho第一次接触到“稀疏性”(sparsity),是在大学毕业后从事石油勘探工作的过程中。为了寻找深藏于地底的石油,地球物理学家会引燃爆炸,让地震波传入地层。每当地震波触碰到一个新的岩层时,它就会传回一个回声;从回波信号中,科学家可以重建地下岩层的图像。由于岩层的变化相对较少,因此地震波的回波是稀疏的。
II. L1范数
21岁时,Donoho在无意中遇到了一个标志了他职业生涯的谜题。那时,原始的地震测量只能提供大致、模糊的岩层位置。但当时的地球物理学家已经开发出了一种能够有效地对信号进行“去模糊”化、并对地层变化进行精确识别的方法。这些测量距离的方法都是不同于传统方式的。
自数学巨人高斯奠定了基础性的工作以来,科学家就一直将所谓的L₂距离运用于数据处理中,这个距离也被称为“乌鸦的飞行”或欧几里德距离,它测量的是两点之间的直线路径的长度,就像我们在高中几何中所学到的一样。然而,令人惊喜的新方法使用的是“L₁范数”,也被称为曼哈顿距离,因为它测量的是如果你必须在矩形网格般的城市中行走,需要穿过多少街区才能从一个点走到另一个点(对角线走法是不被允许的)。(关于距离,可进一步阅读《如何找到距离最近的TA》)
稀疏信号与L₁范数的结合的有效性存在着一些神秘之处,但没人知道这是为什么。当Donoho回到研究生院攻读博士学位时,他决心要解开这个难题。在接下来的几年里,他发展了证明L₁范数与稀疏信号间的不合理的有效性的数学理论。
其中,有些现象看上去似乎不可思议。他首先使用“L₁+稀疏性”技术来恢复一个以某种未知、任意的方式模糊(现称为“盲反褶积”)的稀疏信号。接下来,他再用它们来恢复完全丢失的数据。在信号处理中,部分信号的缺失是常有出现的情况,就好比一台陈旧的录音机,它可能无法收录高频音和低频音。而Donoho、Philip Stark和Ben Logan则证明了,对于某些特殊信号,即稀疏信号,“L₁+稀疏性”技术可以很好地恢复缺失的低频信号。在其他的研究中,Donoho和他的合作者Jeffrey Hoch和Alan Stern开发了“L₁+稀疏性”技术来恢复缺失的高频信号(即声学角度的“高音”部分)。
“L₁+稀疏性”也能对信号“去噪”:如果我们在稀疏信号中加入噪声,然后再看它的绘图,就会看到许多的“雏菊”(信号)出现在“杂草”(噪音)之上;L₁最小化提供了一种去除“杂草”但又同时保留“雏菊”的方法。Donoho和Iain Johnstone证明了对稀疏信号来说,这是最优的方法。
III. 谐波分析
上世纪八九十年代,应用数学出现的“小波革命”(详见:《神通广大的小波理论》)进一步改变了Donoho的思维。当时的计算谐波分析专家——如2014年高斯奖得主Yves Meyer和与他合作的Ronald Coifman、Ingrid Daubechies和Stephane Mallat——正在构建许多新的工具,以将数字信号转变成更加有用的形式。他们发展的新的小波变换让Donoho大开眼界。他在用这些新的工具对数字数据进行转换之后发现,稀疏性无处不在——它出现在我们每天使用的图像以及其他媒体中。在Donoho看来,这大大扩展了“L₁+稀疏性”的应用平台。
Donoho的数学结果诱发了最大限度的稀疏化。这些结果能让他比使用小波来进行稀疏化要做得更好。他寻找那些能“超越小波”的系统,以揭示如图像中的边缘、薄片和细丝等几何现象的隐藏稀疏性。他的合作者Emmanuel Candè和Jean-Luc Starck也很快就瞄准了超越小波,想要达到“曲波”、“束波”,以及其他的某种波。
通过结合几种不同系统的谐波分析,Donoho更进一步地加深了对信号的稀疏化。例如,被几个尖刺污染的正弦波在传统的傅里叶分析法中就不是稀疏的,但可以同时使用傅里叶分析和小波对它进行稀疏地综合。与合作者Michael Saunders和Scott Chen一起,他开发了一种名为“基追踪”(Basis Pursuit)的算法,通过最小化L₁范数来解决综合问题。
这取得了令人难以置信的成功,因为解决一个待定方程的系统,并通过算法得到尽可能稀疏的答案,是一项复杂到令人生畏的任务。Donoho与Xiaoming Huo、Michael Elad和Vladimir Temlyakov等人合作,给出了一系列的基础数学结果,证明了L₁范数能够真正找到最稀疏的这种综合。
IV. 压缩感知
到了21世纪00年代中期,在I~III中所描述的三条研究路线聚合到了一起,产生了压缩感知。这是一种启发了那些正要遍布市场的快速MRI的数学理论。如前文所提到的,Donoho与Candès、Romberg以及陶哲轩一起,将在小波基视角下的图像的稀疏性、L₁范数的使用、待定方程的使用,这三个成分放在一起运作。他们的数学分析清楚地阐明了,为什么必须这三种成分都同时存在才能让速度加快,以及在某些假设下,这种组合是如何确保起作用的。如此清晰的数学理解是具有转换性的,并激发了MRI研究和其他领域的快速发展。
V. 不合理的有效性
从大学时代起,Donoho就相信数学家将通过为数据提供新的模型,提供新的处理算法,以及微妙且强大的理论见解,为信息时代做出贡献。这三件事情,他都做到了。
而当时年轻的Donoho不知道、也不可能知道的是,纯数学的持续发展会是如此的重要。例如,在他自己的研究工作压缩感知中,Donoho发现扮演重要角色的是随机矩阵理论、高维的巴拿赫空间理论、随机凸多胞形理论以及数学自旋玻璃的理论——在所有的这些情况下,纯数学都与信号处理无关,而且比Donoho本身都要年轻得多!
50年前,Eugene Wigner(尤金·维格纳)就提出“数学的不合理有效性”,他指的是纯数学激发实际应用的惊人趋势。
如果有一天,你也得益于快速的MRI扫描,或许你会记起维格纳的这句格言!