依随智能手机的大规模普及,数字摄影已经成为很多人生活中不可或缺的习惯。随着数字图像处理技术的蓬勃发展,PS作为数字图像处理的代名词(photoshop),在普罗大众中早已耳熟能详。数字图像处理中,最为基本的算法非“色彩变换”(Color Transfer)莫属。
直方图均衡化是提高灰度图像对比度的常见算法。如图1所示,左侧输入图像的灰度分布在一个狭窄区域,朦胧昏暗;右侧是直方图均衡化的结果,清晰明亮,对比鲜明。我们设输入图像像素的灰度为一随机变量,其取值范围为单位区间,其概率测度为,直方图均衡化算法的核心就是求灰度空间(单位区间)到自身的一个映射,这一映射将变换成均匀分布。
数据驱动的色彩变换可以视作是直方图均衡化的直接推广。
图2显示了一个算例,左侧是输入图像,阴霾遍布下的麦地,阴郁苍凉,中间是范例图像,晴空下的麦穗,右图是输出图像,一扫阴霾,麦浪金黄,明媚爽朗。我们将图像中的每个像素颜色表示成(红,绿,蓝)三元组,所有可能的颜色空间表示成单位立方体,像素为矢量值的随机变量,取值于颜色空间。输入图像的颜色分布的概率测度为,范例图像的颜色分布的概率测度为。我们寻找颜色空间的自映射,将概率测度映成概率测度。
这些颜色变换的算法是基于最优传输理论(Optimal Mass Transportation)。最近,最优传输理论被广泛应用于工程和医疗中的诸多领域,例如直接应用于图像颜色变换、图像注册、曲面保面积参数化和体的保体元参数化、曲面或体的注册。特别是在机器学习中,最优传输理论起到了至关重要的作用。
一个黎曼流形上的所有概率测度构成一个无穷维的流形,即所谓的Wasserstein空间。
任意两个概率测度之间存在最优传输映射,这个映射的传输代价给出了两个概率测度之间的距离,被称为是Wasserstein距离。因此,Wasserstein空间是一个黎曼流形。在工程和医学的诸多领域,算法的核心是寻找一个概率测度,例如机器学习算法。Wasserstein距离给出了衡量概率测度相似程度的严密方法,这是为什么近几年来最优传输理论异常火热的根本原因。