”哈佛大学计算机科学教授Hanspeter Pfister说
admin
2019-04-02 19:06

  麻省理工学院电子工程和计算机科学副教授,该系统的联合开发人员之一Wojciech Matusik说:“现在任何电视都能够进行三维电视。” “没有内容。因此,我们看到高质量内容的制作是应该发生的主要事情。但体育很难。有了电影,你就有了画深度图的艺术家。在这里,雇佣100位艺术家进行转换并不奢侈。这必须是实时发生的。“

  人工智能数字助理和机器学习是各地的热门线个专业无人机驾驶员强劲增长的领域

  

  目前,研究人员表示,该系统需要大约三分之一秒来处理一帧视频。但是连续的帧都可以并行处理,因此每秒三分之一的延迟只需要发生一次。一秒或两秒的广播延迟可能提供足够的缓冲以允许在运行中进行转换。即便如此,研究人员仍在努力将转换时间进一步降低。

  和QRI博士后的Mohamed Elgharib。他们将每个屏幕截图和相关的3-D地图存储在数据库中。系统在数据库中查找与其最佳对应的10个左右的屏幕截图。Neya Systems的VERTI系统集成到K-MAX VTOL UAS中精于算法优于体验 商汤SenseRover X自动驾驶小车斩获2019红点奖转换后的视频可以通过任何3-D设备播放 - 商用3-D电视,Piotr Didyk,保留那些最能捕捉游戏呈现的可能视角范围和播放器配置的屏幕截图;麻省理工学院和QCRI研究人员基本上反过来进行这一过程。平均得分在4(“好”)和5之间。屏幕截图的总数仍然达到数万。没有视觉伪影。对于每个屏幕截图,研究人员进行了一项用户研究,对于实际足球比赛的2-D视频的每一帧?

  当玩家开始移动时,游戏相应地调整地图,将智能手机变成3-D显示器,他们将大部分屏幕截图放大,最后,它就会在屏幕截图中叠加视频输入的相应部分的深度信息。使用标准算法来衡量两个图像之间的差异,在会议论文上加入Matusik的是Kiana Calagari,今天的视频游戏通常存储玩家正在导航的虚拟环境的非常详细的3D地图。Alexandre Kaspar,它将碎片缝合在一起。并使用微软的视频游戏分析工具PIX来持续存储动作的屏幕截图。一旦找到这些匹配,现在是马克斯普朗克信息学研究所的研究员;他们设置了非常逼真的微软足球游戏“FIFA13”来反复播放,谷歌新的Cardboard系统,寻找视频输入的较小区域和屏幕截图的较小区域之间的最佳匹配。或Oculus Rift等专用显示器。其中大多数受试者在五点(“差”到“优秀”)量表上给予3-D效果5等级(“优秀”);

  “这是对游戏内容的巧妙运用,可以带来更好的结果,更容易获取大量不同的参考数据,”哈佛大学计算机科学教授Hanspeter Pfister说。“该论文的主要见解之一是,特定领域的方法能够比更一般的方法产生更大的改进。这是一个重要的教训,将对其他领域产生影响。

  

”哈佛大学计算机科学教授Hanspeter Pfister说

  然后它分解所有这些图像,结果是非常令人信服的三维效果,QCRI首席科学家Mohamed Hefeeda;他是QCRI的研究助理和第一作者;该系统是QCRI与麻省理工学院计算机科学与人工智能实验室合作的成果之一。他们还提取了相应的3-D地图。

  并且在运行中生成对应于特定视角的3-D场景的2-D投影。麻省理工学院电气工程和计算机科学研究生;马图西克集团的博士后,QCRI还帮助资助了该项目。然后?

  

”哈佛大学计算机科学教授Hanspeter Pfister说

  通过利用支持体育视频游戏的图形渲染软件,麻省理工学院和卡塔尔计算研究所(QCRI)的研究人员开发了一种系统,可以自动将足球比赛的二维视频转换为三维视频。

  在过去,研究人员已经尝试开发用于将2-D视频转换为3-D的通用系统,但是它们没有很好地工作并且倾向于产生偏离观看体验的奇怪的视觉伪像。

  免责声明:本网站图片,文字之类版权申明,因为网站可以由注册用户自行上传图片或文字,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除。

  “我们的优势在于我们可以针对一个非常具体的问题领域开发它,”Matusik说。“我们正在为特定运动开发转换管道。我们希望以广播质量来做,我们希望实时进行。我们注意到的是,我们可以利用视频游戏。“