龙空技术网

西湖大学团队基于人眼感知,开发颜色空间编码与解码算法|专访

DeepTech深科技 723

前言:

此时姐妹们对“算法与编码”大致比较重视,小伙伴们都需要剖析一些“算法与编码”的相关内容。那么小编同时在网上搜集了一些有关“算法与编码””的相关内容,希望兄弟们能喜欢,看官们快快来学习一下吧!

眼见,真的为实吗?未必!

熬夜在网上订购了一款口红,收到货物时,却发现实际物品与电商平台对应的图片色泽不完全一致,相信不少有网购经历的女性都曾遇到过类似困惑。

图|口红色差对比(来源:Pixabay)

在数字化时代,随着电子设备的普及,屏幕正在取代纸张,成为人们获取信息的主要媒介,网购在人们消费领域的渗透率也越来越高。

而 “颜色” 这个古老而又新鲜的命题,又给人们带来了新的困扰,电子屏幕对颜色的二次呈现,往往给人一种 “所得非所见” 之感。

近日,西湖大学仇旻团队研究出一种基于人眼感知的颜色算法,为长期困扰着人们的 “色差” 问题,提供了全新解决方案。

该研究适用于对色度和亮度进行精确的操控,为下一代显示成像、激光通讯、人工视觉、虚拟 / 增强现实等应用开辟了道路。

图|仇旻(来源:受访者)

7 月 1 日,相关论文以《加性数字脉冲编码的非线性颜色空间》(Nonlinear Color Space Coded by Additive Digital Pulses)为题发表在光学期刊 Optica。

图|相关论文(来源:Optica)

西湖大学工学院光学工程讲席教授仇旻、西湖大学工学院王纪永博士担任共同通讯作者,该校与浙江大学的联合培养博士生唐妮为第一作者。

图|唐妮(来源:受访者)

该团队经过严谨的理论推导和实验验证,最终提出利用一套完备的、基于国际照明委员会(International Commission On ILLumination,CIE)标准的数字颜色编码和解码算法,该算法可解决颜色在保存和复现过程中的失真问题。

视频|CIE 颜色空间成果效果(来源:受访者)

本次研究揭示了造成 “色差” 的本质原因,即传统的红、绿、蓝(RGB,Red–Green–Blue)颜色空间与人眼对颜色的感知联系较为松散,造成颜色空间转换的复杂性和色域操作的不准确性。

首先,由于技术手段、制作标准等限制,不同厂家所使用的红、绿、蓝三基色光源本身存在色差,导致以它们为基础的其他颜色或多或少显示 “不准确”。

另外,设计环节也是造成 “色差” 的原因之一,以显示器为例,颜色标准与显示器由两个相互独立的团队来完成,在显示器颜色出厂校正之时,需要将 RGB 颜色空间转换到 CIE 规定的颜色空间。

仇旻向 DeepTech 表示,这就不难想象,由于光源颜色存在偏差,即便将同一张图片放在同一品牌的手机、平板、电脑和室外广告屏上显示,呈现在屏幕上的图片也必然有偏差,这为消除 “色差” 带来很大的困扰。

在此大背景下,该团队设想与其在 RGB 和 CIE 之间来回转换、校正,能不能跳过 RGB 颜色空间,直接在 CIE 上取色呢?带着这样的思考,他们将研究焦点从 RGB 转移到 CIE 颜色空间。

“消灭 ”色差,CIE 1931 x yY 算法可量化人眼看到的所有颜色

王纪永说,“我们一开始并没有将注意力放在颜色算法上,只是想单纯地研发一盏灯,既可以是用来美容的红蓝光治疗灯,也可以用来调节情绪和作息节律的睡眠灯…… ”

图|王纪永(来源:受访者)

然而,该团队发现,不论做哪种灯,都需要精准调节光的颜色,譬如保证光照度、颜色坐标还有色温度。照明是最贴近 CIE 颜色空间的应用,该团队先从如何定量、精确控制各种灯具的色温度和亮度开始研究。

经过研究发现,照明要求一般可归结为,对两种颜色光源进行混光问题。

当该团队成功研发出对两种颜色光源进行精确调光调色的算法时,发现可以将该算法自然而然地推广到三基色混光模型中,便产生了可应用于显示或成像领域的 CIE1931 x yY 颜色空间编码与解码算法。

图|CIE1931 x yY 颜色空间算法原理(来源:受访者)

CIE1931 x yY 颜色空间是一种与人类视觉感知相对应的颜色语言,以蓝色为例,将直接在 CIE 坐标系中找到人眼感知的蓝色称为 “基准蓝”,算法会结合实际光源,计算出一串代表 “基准蓝” 的数字信号,当光源执行这一编码时,呈现出的就是人眼感知的蓝色。

如果对 “基准红”、“基准绿”、“基准蓝” 三种基色同时进行编码,就可以实现在 CIE 颜色空间对任意颜色进行编码计算。

图|RGB 颜色空间(来演:受访者)

本次算法最大的亮点是,无需通过器件相关的 RGB 颜色空间,就能直接对 CIE 颜色空间进行编码和解码。以一幅图像或一组颜色为例,只要将所有颜色信息映射到一个绝对的 CIE 颜色空间里面,利用这种算法进行编码与解码计算,无论使用何种品牌的显示器,最终呈现出来的图像不会出现人眼可识别的 “色差”。

“该算法主要解决了颜色在保存和复现过程中的‘失真’问题,未来的显示器只要采取这套算法,不管使用的红、绿、蓝光源有多少差别,最终显示的都是与人眼感知无限接近的颜色。这样一来,不仅不同设备之间不再有色差,屏幕内外的世界也不再有色差。” 仇旻向 DeepTech 表示。

虽然 CIEx yY 1931 颜色空间算法在理论层面实现了完整的逻辑闭环,但在实际应用层仍面临一些问题。

以全彩显示器为例,由于显示领域已经形成了一种固有的历史生态,从源头、制造生产到出厂校正等各个环节都按照已有的方式在运行,新的方式需要在原有生态中找到可以兼容的突破口。

如何将这种 CIE 全新算法嵌入到如京东、淘宝、拼多多等电商生态系统、各大供应商的显示器中,也有很长一段路要走。

拓展研究边界聚焦人工视觉,致力于 CIE 新生态

真正令该团队兴奋的不是算法本身,而是当他们能够精准掌握颜色背后的光时,呈现在眼前的那些早已超越了 “色差” 的更多可能性。

因此,该成果在基础照明方面还有更多的延展性,除能精确控制一盏灯的颜色和强度外,还可定量控制人体分泌的某种激素。

第一,在照明方面,可以精确地控制一盏灯的颜色和强度,可以通过简单的设计,让办公室里的冷光源变得柔和惬意;在一些很难触达到太阳光的工作环境,可以动态地模拟自然光照明,进而定量调节或者改善人体某些荷尔蒙的分泌,影响或改善睡眠和情绪,为人体健康相关产业设计出一套全新照明方案。

第二,在显示器方面,可以做到不论用户使用哪个品牌的显示器,无需校正和适配,让显示器显示的图像与人眼感知的效果一模一样。

第三,在激光通信方面,可以将通信过程中一维信息(开或关)扩展成三维或者更高维度。光通信的原理是,通过电信号的二进制编码转换成光信号进行传输。

可以在开关维度上增加不同颜色信息,实现更多信息加载。在海底探测、采矿、空间无人机领域均有非常广泛的应用前景。

谈及商业化前景,仇旻告诉 DeepTech,“该算法在照明方向的落地比较简单,我们利用算法研发了一些产品,可以直接投放到市场;在显示器方向,需要对现有显示器做一些改变,在不改变固有器件的基础上,将我们的算法加进去做一些电子电路上的改进,即可使用。”

他还表示,“在图像储存方向是最难的,要想更真实地记录眼睛看到的一些景象,最起码要保证相机里面的光电探测器,与人眼灵敏性曲线相匹配,这一点我们还在研发之中。”

图|仇旻团队做 CIE 颜色空间算法试验场景(来源:受访者)

未来,该团队将利用先进的纳米技术来缩小光电探测器整体尺寸,并和人眼感光细胞的灵敏性曲线进行完美匹配,进而获得近乎人眼感知的人工视觉,给色盲、色弱患者一个多彩世界。

以创新研究为底色,汇团队之智克服技术难题

“与其他科研团队不同的是,我们善于跳出惯性思维思考问题。众所周知,在某些相对成熟的领域能有所突破很难。但反过来说,能在人们都习以为常的领域,时不时得跳出舒适圈,发现新的问题,在科学研究上做出哪怕是一点点改变,所带来的影响往往是巨大的。” 仇旻告诉 DeepTech。

王纪永则表示,“我是一个以兴趣为导向的人,只要是自己未知且感兴趣的事,不论有多难都想办法去学习、去克服。从性格上来讲,我可能不是一个好的匠人,相比日复一日的重复性工作,我更倾向多做一些有创造性、探索性和挑战性的工作,这一点正是一名科研工作者的必备素质。通过自己的努力将问题解决,在科研上取得哪怕一点点突破,我获得的成就感最大。”

据仇旻介绍,CIE 颜色空间算法能较容易地用于目前的商用显示器,最大限度提高动态范围和色域空间。除此之外,它还可以为虚拟 / 增强现实设备、微显示、人工视觉以及涉及多路激光脉冲的基础科学应用提供支持。

鉴于对颜色精确控制的优势,以人眼感知为基准的数码设备有望成为下一代照明、显示、成像和传感的前沿技术。

标签: #算法与编码