嵌入式AI 双周简报 (2017-01-15)

业界新闻

黄仁勋打响CES第一枪：全球最强芯DRIVE Xavier武装自动驾驶 | 新智元 简评：英伟达黄仁勋在CES表示将全力投入无人驾驶市场，发布四大关键产品和平台，并公布了英伟达在AI领域的2017成绩单。
CPU漏洞补丁对机器学习和深度学习性能影响实测 | 新智元
简评：本文作者对神经网络（TensorFlow&Keras）、Scikit-learn、XGBoost等进行了使用和不使用PTI补丁时的性能比较，发现该补丁对性能的影响非常依赖于任务——有些任务不受影响，有些任务的性能下降了40％。
改变自动驾驶发展格局，百度“阿波罗计划”的前世今生 | 雷锋网
简评：百度在去年 4 月推出了 Apollo 自动驾驶开放平台，距今已经有 8 个多月的时间，这 8 个多月中，Apollo 从无到有，从国内走向国际，囊括了 90 多家合作伙伴，如今已经进化到了 2.0 版本，从一开始的循迹驾驶到现在实现简单城市道路的自动驾驶。正在进行的 2018 年 CES 大展，百度也通过 Apollo 平台对外展示了自动驾驶的“中国速度”。
揭秘超越英伟达Pascal五倍的英特尔深度学习芯片架构 | 新智元
简评：据 Nervana 元老，现任英特尔 AI 硬件负责人 Carey Kloss 介绍，Nervana Intel 目前的芯片与初代 Nervana 芯片非常相似，但由于英特尔提供了更多专业技术，新的深度学习芯片可以以每年一次的频率快速更新换代。

论文

[1712.07316] A Flexible Approach to Automated RNN Architecture Generation 简评：该论文提出了一个领域特定的语言（DSL）用于自动化架构搜索，可以产生任意深度和宽度的新型RNN。DSL足够灵活以定义标准体系结构，如门控重复单元和长期短期内存，并允许引入非标准RNN组件，如三角曲线和层规范化。使用两种不同的候选生成技术，具有排序功能的随机搜索和强化学习，我们探索由RNN DSL为语言建模和机器翻译领域所创建的新架构。由此产生的体系结构并不遵循人类的直觉，而是在其目标任务上表现良好，这表明可用的RNN体系结构的空间远大于以前的假设。
[1712.07798] Deep learning for predicting refractive error from retinal fundus images 简评：屈光不正是导致视力损害的主要原因之一，可以通过简单的干预措施（如处方眼镜）来纠正,作者使用深度学习算法来检验实验者的眼底照片，计算结果表表明深度学习可以用来从医学图像中进行新的预测。
[1712.06076] Using Deep learning methods for generation of a personalized list of shuffled songs 简评：文章中作者建议通过构建一个卷积深层信念网络，从而解决音乐播放系统中随机播放的歌曲不符合用户心情的问题，所学习的参数将用于初始化多层感知器，该多层感知器将用户的播放列表的提取特征作为输入与元数据一起输入以分类到各种类别。
[1712.04910] FFT-Based Deep Learning Deployment in Embedded Systems 简评：嵌入式平台由于其可移植性，多功能性和能源效率，正在成为深度学习部署的关键,但是DNN加重了嵌入式平台的计算和存储，作者提出了一种适用于嵌入式平台的基于快速傅立叶变换（FFT）的DNN训练和推理模型，其计算和存储的渐近复杂度降低。
[1712.05083] Extreme 3D Face Reconstruction: Looking Past Occlusions 简评：在提供在极端条件下，从平面旋转和遮挡中观察到的人脸的详细三维重建。作者根据凹凸贴图的概念，提出了一种分层的方法，该方法将全局形状的估计与它的中等细节(例如，皱纹)解耦。我们估计一个粗糙的三维表面形状，作为基础，显示在现有技术状态经常破裂的观察条件下产生详细的3D面部形状。
[1611.08050] Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields 简评：作者提出用一种方法来高效的检测图像中多个人的二维姿态，该方法使用非参数表示来学习将身体部位与图像中的个体相关联，无论图像中的人有多少，都能保持高精度和良好的实时性。
[1712.08449] True Asymptotic Natural Gradient Optimization 简评：在深度学习框架下开发一个j精简而精确的视频手势识别模型的问题。为此，作者提出了一个端到端可训练的联合3DCNN-LSTM模型，并且被证明更适合捕获动作中的动态信息。

开源项目

TensorFlow 1.5.0-rc0发布，新增CUDA 9/cuDNN 7预编译支持，集成Eager execution/TensorFlow Lite 简评：该版本主要针对CUDA9和cuDNN7进行了预编译。
Tensorlang：基于TensorFlow的可微编程语言 简评：Tensorlang定义了一组语法和语义，提供对TensorFlow运行时和工具链的完整性能和表现力的访问。
基于NVIDIA Jetson打造“富人版”深度学习摄像机 简评：用NVIDIA Jetson和Python构建一款自带深度学习相机。
TensorFlow相关论文与研究汇总 | techleer 简评：关于TensorFlow的各种论文和研究，其中主要包括异构分布式系统上的大规模机器学习、分布式机器学习高级模块、深度学习软件框架的比较研究、带有MPI的分布式、全球标准化的基于转换的神经网络、大规模机器学习等。

博文

GPU是如何优化运行机器学习算法的？ | 机器之心
简评：在这篇文章中结合代码介绍一下 GPU 加速，它是如何完成的，以及用于 GPU 任务的简单 API。
Jeff Dean撰文回顾谷歌大脑2017：从基础研究到新硬件 | 机器之心
简评：谷歌大脑负责人 Jeff Dean 近日撰文回顾了 2017 年的工作，内容包括基础研究工作，机器学习的开源软件、数据集和新硬件。
ARM攒机指南——AI篇 5大千万级设备市场技术拆解 | 新智元 简评：本文原文链接主要介绍了ARM的攒机方法文章主要精简的拆解各个设备市场的技术重点。
深度学习框架Keras解析 | 微博 简评：针对Keras做了深入的解析工作。
人脸解锁的无人运输小车 简评：国外一家公司利用人脸识别开发的快递新模式，可利用人脸识别识别收件人。
NVIDIA Volta GPU Architecture | YouTube 简评：NVIDIA Volta GPU架构通过原创短视频的形式展示了产品的特点。

Editor: 王建章、袁帅

本作品采用知识共享署名-相同方式共享 2.0 通用许可协议进行许可。

embedded_ai

https://ysh329.github.io/embedded_ai/

嵌入式AI 双周简报 (2017-01-15)

业界新闻

论文

开源项目

博文