博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
《中国人工智能学会通讯》——2.34 虚构画面(Dreaming Up Visions)
阅读量:5833 次
发布时间:2019-06-18

本文共 971 字,大约阅读时间需要 3 分钟。

2.34 虚构画面(Dreaming Up Visions)

今年 AI 并不止停留在编写程序、游记、科学理论上。现在有些 AI 已经能够进行想象了,或者使用技术术语,产生幻觉(hallucinate),同时也是意义深远的比喻。深度学习不仅擅长模式识别,而且还擅长模式理解,因此创建新模式也很在行。

来自麻省理工和微软研究院的一支团队开发了一套深度卷积反图像网络(deep convolutioninverse graphic network),它有一种特殊训练的技术,可以让图形代码层的神经元分化成图像中有意义的转变。这么做,他们用深度学习构建一个图形引擎,可以用新二维图像来理解三维图像,可以以真实照片的角度想象,如果改变拍摄角度或光照诸如此类的因素,图像会是什么样。

来自纽约大学和 Facebook 的一支团队设计了一种方法从其他图像中它看过的有意义的合理的元素来生成逼真的新图像。使用金字塔形对抗网络——其中一些试图产生逼真的图像,而其他的来评判这些图像的逼真度——他们的系统在想象新图像方面做的越来越好。虽然网上的例子清晰度相当低,但是在离线的时候我看到了十分相关的高清晰度的结构。

此外,2015 年这方面重大的事件还有,基于简短英文描述的图像进行深度想象全新影像的能力。虽然场景渲染有象征意义,一些反对的声音存在很久了,今年已经见证了纯神经网络系统使用非确切编程的方式来做这些。多伦多大学的团队将关注机制(attention mechanisms )运用于图像生成,基于描述的各个成分的意思,处理每次请求的attention不同。所以,机器人现在可以梦到电动羊了。

今年,甚至在新动画短片中的计算机想象力方面也取得了令人印象深刻的进展。美国密歇根大学的团队创建了一个深度类推系统(deep analogysystem),可以识别范例中复杂的隐含关系,并且能够将这种关系当成查询案例的可生性转变。他们在许多合成应用上用到了这个系统,但是最令人印象深刻的要属这个案例(下面视频中 10:10-11:00的时间段),基于一张从未见过目标角色的单个静止的图像和不同角度的不同角色的对比视频短片,生成了一个全新的动画角色视频短片。

这里使用图像生成是为了便于演示,他们开发的计算想象技术可以运用于各种领域和模式。比如用于声音或音乐方面。

转载地址:http://tkgdx.baihongyu.com/

你可能感兴趣的文章
MongoDB CookBook读书笔记之导入导出
查看>>
shell如何快速锁定所有账号
查看>>
HTML 5实现的手机摇一摇
查看>>
此博客不再发表对自己私事的看法
查看>>
导致Asp.Net站点重启的10个原因
查看>>
【PMP】Head First PMP 学习笔记 第一章 引言
查看>>
抓住云机遇编排工作 搞定复杂IT工作流
查看>>
MYSQL的longtext字段能放多少数据?
查看>>
MTK 平台上如何给 camera 添加一种 preview size
查看>>
云计算最大难处
查看>>
关于数据分析思路的4点心得
查看>>
Memcached安装与配置
查看>>
美团数据仓库的演进
查看>>
SAP被评为“大数据”预测分析领军企业
查看>>
联想企业网盘张跃华:让文件创造业务价值
查看>>
记录一次蚂蚁金服前端电话面试
查看>>
直播源码开发视频直播平台,不得不了解的流程
查看>>
Ubuntu上的pycrypto给出了编译器错误
查看>>
聊聊flink的RestClientConfiguration
查看>>
在CentOS上搭建git仓库服务器以及mac端进行克隆和提交到远程git仓库
查看>>