一组MIT研究人员提出了一种从模糊图像甚至视频中恢复丢失的细节的方法。他们开发了一种算法,可以识别并自动恢复视频和静止图像中的模糊部分。
该算法称为“视觉投影模型”,它基于卷积神经网络。科学家通过提供模糊图像和高质量的对应图像来训练算法。这样,该算法“学习”了一种模式,使其可以重新创建模糊的位并使它们清晰。
在他们的一项实验中,研究人员在指定区域行走的30个人的35个视频中测试了该算法。“他们将所有框架折叠成用于训练和测试模型的投影。该模型从一组六个看不见的投影中脱颖而出,精确地重新创建了人的步态的24帧,直至他们的腿部位置和人的大小(当他们走向或离开相机时)。例如,该模型似乎了解到,随着时间而变暗和变宽的像素可能对应于一个走近相机的人。”
该算法可用于处理我们模糊的照片或视频。或如Engadget的 Mariella 所说,它可以使CSI发挥更大的作用并增强现实。但是,该项目背后的科学家还有其他想法。他们目前正在与康奈尔大学的同事合作,将其算法应用于医学目的。它可用于从2D医学图像(例如X射线)中恢复3D解剖学信息,而无需支付额外费用。考虑到3D扫描(例如CT扫描)的成本要比X射线高得多,因此这在较贫穷的国家尤其有用。
via.diyphotography