专栏|基于IR-transformer、IRGAN模型 解读搜狗语义匹配技术
机器之心专栏 搜狗搜索 NLP 本文介绍了搜狗搜索的 IR-transformer 模型和 IRGAN 强化学习训练框架。 摘要 搜索引擎作为上网冲浪的直接入口,其检索...
资源|谷歌带来GAN入门神器:浏览器上运行的可视化工具GANLab
选自GitHub 机器之心编译 机器之心编辑部 乔治亚理工学院和谷歌大脑的研究者开发了 GAN 的可视化工具 GAN Lab,无需安装也无需专门硬件,通过网页浏览器(...
南京大学团队 2040 张图片训练出 ViT,准确率 96.7%,连迁移性能都令人惊讶
ViT在计算机视觉领域取得了巨大的成功,甚至大有取代CNN之势。但是相比CNN,训练ViT需要更多的数据,通常要在大型数据集JFT-300M或至少在ImageNet上进行预训练,很少有人研究少量数据训
应用于实时视频通信的深度学习算法研究
众所周知,深度学习在实时视频通信端到端系统里有很多的应用,比如说我们用它做超分辨率,能取得比较好的效果;我们用它做图像恢复,也能取得比较好的效果。...
用上 GAN 推荐算法成精,看完视频马上刷出相关文章,微信已用上
这年头,推荐算法真是越来越智能了。举个栗子,当你热衷于东京奥运会并且刷了不少剪辑视频,App就会根据你的品味为你推荐文章、游戏或是同款周边。没错,推荐算法早已不局限于一个场景,而是在视频、文章、小程序
图像识别怎样改变AV产业?通过面部照片尝试判别胸部大小
先进的图像识别怎样改变AV产业? 说到这方面,日本人表示,你们都弱爆了! 我来举几个例子: 一、chainerによるディープラーニングでAV女優の類似画像検...
声网 Agora Lipsync 技术揭秘:通过实时语音驱动人像模拟真人说话
元宇宙的火热让人们对未来虚拟世界的形态充满了幻想,此前我们为大家揭秘了声网自研的3D空间音频技术如何在虚拟世界中完美模拟现实听觉体验,增加玩家沉浸感。今天我们暂时离开元宇宙,回到现实世界,来聊聊声网自
2022-07-13 资讯 我要分享脸书发布高效能完全非监督式语音辨识模型Wav2vec-U
Wav2vec-U是脸书Wav2vec语音辨识模型的非监督式版本,完全不需要转录资料,也不用标签资料训练,效能已经与2019年最佳监督式语音辨识模型相当
声网 Agora Lipsync 技术揭秘:通过实时语音驱动人像模拟真人说话
元宇宙的火热让人们对未来虚拟世界的形态充满了幻想,此前我们为大家揭秘了声网自研的3D空间音频技术如何在虚拟世界中完美模拟现实听觉体验,增加玩家沉浸感。今天我们暂时离开元宇宙,回到现实世界,来聊聊声网自
微软Azure影片索引器正式上线,新加入情绪侦测、语言辨识模型,自动判别讲者情绪及使用语言
现在影片索引服务变得更聪明,即使影片中未出现关键字,根据影片的演说情境、视觉提示等资料,系统也能辨别该影片的议题、内容
特斯联 AI 研发突破(2):用于视觉任务中无监督域自适应的类别对比
深度神经网络(DeepNeuralNetworks,DNNs)由于跨域不匹配(cross-domainmismatch),通常在新域表现不佳。而无监督域自适应(UDA)技术则可通过利用未标记的目标域样
2022-12-19 资讯 我要分享