嵌入式AI 双周简报 (2018-02-27)
业界新闻
- GPU最强对手谷歌上线Cloud TPU,Jeff Dean十条推文全解读 | 新智元
简评:Jeff Dean连发十条Twitter,介绍最新发布的测试版Cloud TPU,目前在美国地区开放,每小时6.5美元。谷歌表示,一个Cloud TPU,在一天之内就能在ImageNet上把ResNet-50模型训练到基准精度,成本低于200美元。 - 亚马逊开发AI芯片提升Echo性能,开设云端服务 | 36Kr
简评:亚马逊从智能音响切入探索AI的商业化之路,收获了令人惊叹的效果。现在为了保持Echo的优势,亚马逊正在开发一款本地化的AI芯片。 - 外媒称英伟达下月将发布用于挖矿虚拟货币的新型GPU「Turing」
简评:据路透社最新报道,英伟达将在下月发布新一代显卡 GPU,代号「Turing」,专门用于虚拟货币挖矿。在虚拟货币挖矿大量使用其显卡导致价格抬高的情况下,这是英伟达为保证游戏显卡供应所做的努力。 - MIT开发神经网络专用芯片:能耗降低95%,适合移动端设备 | MIT
简评:MIT 研究人员开发了一种专用芯片,可以提高神经网络计算的速度,比之前的芯片速度提升三到七倍,同时将能耗降低 93% - 96%。这使得在智能手机本地运行神经网络,甚至在家用电器上嵌入神经网络变成可能。相关论文已投中 ISSCC。 - LG V30s ThinQ 发布:AI 更新为主,配置增强为辅 | 爱范儿
简评:此次 LG 对 AI 功能的应用并非是我们常见的智能搜索、单词识别、自动开关功能这些方面,而是 AI Vision(视觉)和 AI Voice (语音)两大类。AI Vision 主要是针对相机系统进行优化。通过新增加的 AI 拍照、QLens、明亮模式三项新功能,能为用户带来更便捷、多元的相机使用体验。
论文
- 从哈希到CNN:AAAI 2018中科院自动化所提出高精度&低功耗训练方法 | 机器之心
简评:在美国新奥尔良刚刚落幕的人工智能国际会议 AAAI 2018 上,来自中科院自动化所程健研究员团队的胡庆浩等人报告了一种基于哈希的深度神经网络二值化训练方法 [1],揭示了哈希与二值权重的神经网络之间的紧密关系,表明了网络模型的参数二值化问题可以转化为哈希学习问题,从而大幅提高了二值化深度神经网络模型的性能,使其能在资源受限场景下能兼顾性能和功耗。 - 论文解读:神经网络修剪最新研究进展</br> 简评:本文解读了两篇近期关于神经网络修剪的论文,分别是 L_0 正则化方法和 Fisher 修剪方法。作者对两种方法的工作机制进行了精简的总结和解释,可以帮助我们快速领会论文的方法论思想。
- [1802.06501] Recommendations with Negative Feedback via Pairwise Deep Reinforcement Learning</br> 简评:本文提出了一种新颖的推荐系统,在与用户交互的过程中不断改进其策略。我们将用户和推荐系统之间的顺序交互建模为Markov决策过程(MDP)和增强学习。
- [1802.06130] Fast, Trainable, Multiscale Denoising</br> 简评:该文章提出了一种多尺度过滤的方法,允许在低功率设备上实时应用。
- [1802.08195] Adversarial Examples that Fool both Human and Computer Vision</br> 简评:文章中创建了第一个被设计用来欺骗人类的adversarial示例,通过利用最近的技术,将具有已知参数和架构的计算机视觉模型中的adversarial示例转移到其他具有未知参数和架构的模型,并通过修改模型来更接近初始的processi。
开源项目
- ARM发布Trillium项目:含神经网络软件库和两种AI处理器 | 机器之心
简评:现在 Arm 在人工智能领域厚积薄发,发布了 Trillium 项目,包括一款为移动设备而设计的机器学习处理器、一款目标检测处理器和一个神经网络软件库。 - Capsule官方代码解读 | 机器之心</br> 简评:Sara Sabour 开源了一份 Capsule 代码,该代码是论文 Dynamic Routing between Capsules 中所采用的实现。其实早在去年刚公布此论文,机器之心就曾详解解读过核心思想与基本代码,我们采用的代码也是各研究者尝试复现论文结果的模型。而最近 Sara 开放的代码是标准的官方实现,因此我们希望能解读部分核心代码,并探讨其与 naturomics 等人实现过程的差异。
- 上海交大卢策吾团队开源AlphaPose,姿态估计相比Mask-RCNN提高8.2% | 新智元</br> 简评:上海交通大学卢策吾团队,今日开源AlphaPose系统。该系统在姿态估计(pose estimation)的标准测试集COCO上较现有最好姿态估计开源系统Mask-RCNN相对提高8.2%,较另一个常用开源系统OpenPose(CMU)相对提高17%。同时,卢策吾团队也开源了两个基于AlphaPose的工作:(1)一个高效率的视频姿态跟踪器(pose tracker),目前姿态跟踪准确率第一。(2)一个新的应用“视觉副词识别“(Visual Adverb Recognition)。
- FAIR提出人体姿势估计新模型升级版Mask-RCNN | 新智元</br> 简评:FAIR和INRIA的合作研究提出一个在Mask-RCNN基础上改进的密集人体姿态评估模型DensePose-RCNN,适用于人体3D表面构建等,效果很赞。并且提出一个包含50K标注图像的人体姿态COCO数据集,即将开源。
- MauricioCarneiro/PairHMM: Optimization of a Haplotype PairHMM class for GPU processing | GitHub
简评:GPU / FPGA和AVX处理的Haplotype PairHMM类的优化。 - 十倍模型计算时间仅增20%:OpenAI开源梯度替换插件 | 机器之心</br> 简评: OpenAI 研究员 Tim Salimans 和 Yaroslav Bulatov 联合开发的工具包,你可以权衡计算力和内存的使用,从而使你的模型更合理地占用内存。对于前馈模型,我们能够借助该工具把大 10 多倍的模型放在我们的 GPU 上,而计算时间只增加 20%。
博文
- Momenta王晋玮:让深度学习更高效运行的两个视角 | 吃瓜社</br> 简评:文章从优化计算量和访存量两个角度出发,提出缩短计算时间,加速完成推理任务的优化方法。
- 苹果芯片帝国简史:从依赖三星到「性能怪兽」| 爱范儿</br> 简评:据外媒报道,今年苹果将可能新增至少三款搭载苹果自主设计协处理器的 Mac 电脑。报道称,新款 Mac 电脑将于今年早些时候发布,但是没有透露具体是哪些型号。当中可能包括笔记本电脑,也有可能包括台式电脑。
- 实例讲解进驻Google两位大神主推的异构计算与RISC-V | 硅农亚历山大
简评:John Hennessy和David Patterson两位计算机体系结构方面的泰山北斗双双进驻Google引起了业界的广泛关注。两位大神同时是新兴指令集RISC-V的发起者,也是异构计算领域的领军践行者。本文将结合一个简单实例讲解两位大神所主推的RISC-V如何进行异构计算,让您通过此具体实例理解异构计算为何能够提高性能和节省功耗。 - 杜克大学在读博士生温伟:云端与边缘AI系统的深度学习 | 将门创投</br> 简评:杜克大学四年级在读博士生温伟在将门技术社群,分享云端与边缘AI系统上的最新研究结果的内容回顾。
- 如何看待Tensor Comprehensions?与TVM有何异同? | 知乎
简评:文章精简的描述了两者之间的差异性。 - 像玩乐高一样拆解Faster R-CNN:详解目标检测的实现过程 | 机器之心
简评:本文详细解释了 Faster R-CNN 的网络架构和工作流,一步步带领读者理解目标检测的工作原理,作者本人也提供了 Luminoth 实现,供大家参考。
Editor: 王建章、袁帅
本作品采用知识共享署名-相同方式共享 2.0 通用许可协议进行许可。