技术

 2018-09-18  286

视频生成在计算机视觉上已经是很困难的工作了,按照描述去生成视频是更具有挑战性的工作。To Create What You Tell: Generating Videos from Captions 简称为TGANs-C,在实验上实现了由描述的标题生成相对应的视频,这个工作很有意义,整体思想上采取GAN为主题框架实现,我们一起来读一下。

Read More
技术

 2018-09-13  212

异常检测(Anomaly Detection)是计算机视觉中的一个经典问题,生活中大部分的数据是正常数据,有很少一部分属于异常数据,在很少的异常下如何检测出异常 是一个困难的课题,甚至不知道什么是异常,只知道不属于正常的就算异常的话又如何检测异常呢?GANomaly 便是可以实现在毫无异常样本训练下对异常样本做检测,我们一起来读一下。

Read More
技术

 2018-09-07  161

当几个人异口同声的说话时,往往会造成大家都在说但是谁说的话都听不清的问题。这个时候在这样的音视频分离出一个人的声音就可以很好的解决这个 问题。The Conversation:Deep Audio-Visual Speech Enhancement正是在这种情况下提出的, 通过深度神经网络根据视频中人物的唇部动作指导提取出与之对应的音频的幅度和相位,从而提取出这个人的说话音频。实验上可以最多支持5个人分离出 独自的音频。

Read More
技术

 2018-09-05  200

Unsupervised Cross-domain Image Generation也称为Domain Transfer Network简称为DTN, 作为较早利用GAN思想实现跨模态图像的生成,对于后期的工作有很好的指导和借鉴。文章巧妙地将模态间的的特征做了处理,使得源域提取的特征在模型 作用下趋于目标域的特征,从而实现模态上的转换。

Read More
技术

 2018-08-26  204

有条件训练数据集做生成任务需要庞大的标签数据,CGAN和CVAE的思想可以较好的实现条件生成,除了本身的弊端之外。这两种思想训练的模型一旦加入 新的标签数据再来做生成的话,往往需要重新训练模型,这个的代价是很高的。Latent Constraints 在保持原无条件生成网络不变的情况下通过训练潜在变量实现有条件生成,我们一起来读一下。

Read More

subscribe via RSS

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏一下,你说多少就多少

打开微信扫一扫,即可进行扫码打赏哦