本文共 971 字,大约阅读时间需要 3 分钟。
今年 AI 并不止停留在编写程序、游记、科学理论上。现在有些 AI 已经能够进行想象了,或者使用技术术语,产生幻觉(hallucinate),同时也是意义深远的比喻。深度学习不仅擅长模式识别,而且还擅长模式理解,因此创建新模式也很在行。
来自麻省理工和微软研究院的一支团队开发了一套深度卷积反图像网络(deep convolutioninverse graphic network),它有一种特殊训练的技术,可以让图形代码层的神经元分化成图像中有意义的转变。这么做,他们用深度学习构建一个图形引擎,可以用新二维图像来理解三维图像,可以以真实照片的角度想象,如果改变拍摄角度或光照诸如此类的因素,图像会是什么样。
来自纽约大学和 Facebook 的一支团队设计了一种方法从其他图像中它看过的有意义的合理的元素来生成逼真的新图像。使用金字塔形对抗网络——其中一些试图产生逼真的图像,而其他的来评判这些图像的逼真度——他们的系统在想象新图像方面做的越来越好。虽然网上的例子清晰度相当低,但是在离线的时候我看到了十分相关的高清晰度的结构。
此外,2015 年这方面重大的事件还有,基于简短英文描述的图像进行深度想象全新影像的能力。虽然场景渲染有象征意义,一些反对的声音存在很久了,今年已经见证了纯神经网络系统使用非确切编程的方式来做这些。多伦多大学的团队将关注机制(attention mechanisms )运用于图像生成,基于描述的各个成分的意思,处理每次请求的attention不同。所以,机器人现在可以梦到电动羊了。
今年,甚至在新动画短片中的计算机想象力方面也取得了令人印象深刻的进展。美国密歇根大学的团队创建了一个深度类推系统(deep analogysystem),可以识别范例中复杂的隐含关系,并且能够将这种关系当成查询案例的可生性转变。他们在许多合成应用上用到了这个系统,但是最令人印象深刻的要属这个案例(下面视频中 10:10-11:00的时间段),基于一张从未见过目标角色的单个静止的图像和不同角度的不同角色的对比视频短片,生成了一个全新的动画角色视频短片。
这里使用图像生成是为了便于演示,他们开发的计算想象技术可以运用于各种领域和模式。比如用于声音或音乐方面。
转载地址:http://tkgdx.baihongyu.com/