云从高级算法工程师:加速神经网络的训练和推理 | 学术青年分享会

摘要: 如何在短时间内训练出庞大又复杂的高性能模型?如何向存储和运算能力有限的边缘设备部署模型?

12-11 06:53 首页 AI研习社


分享内容

随着深度学习在计算机视觉上的广泛成功,学术界和工业界都开始越来越关注其落地能力。如何在短时间内训练出庞大又复杂的高性能模型,如何向存储和运算能力有限的边缘设备部署模型,成为极大的挑战。本次分享会嘉宾将和大家分享云从科技的心得体会。

?挑战

?分布式训练

?模型量化/剪枝


《Accurate, Large Minibatch SGD: Training ImageNet in 1 Hour》


论文地址: https://arxiv.org/abs/1706.02677


《Large Batch Training of Convolutional Networks》


论文地址:http://arxiv.org/abs/1708.03888


《Training deep neural networks with low precision multiplications》


论文地址:https://arxiv.org/abs/1412.7024


Code: https://github.com/MatthieuCourbariaux/deep-learning-multipliers


《Learning Efficient Convolutional Networks through Network Slimming》


论文地址:https://arxiv.org/abs/1708.06519


Code: https://github.com/liuzhuang13/slimming



分享主题

加速深度学习的训练和推理



分享人简介

蹇易,现云从科技高级算法工程师。本科和硕士毕业于华中科技大学计算机学院。从事深度学习分布式框架、度量学习和模型减枝/压缩的研究和开发。


分享时间

北京时间10月24日(周二) 20:00 



参与方式

扫描海报二维码,点击底部菜单


分享会精彩往期回顾

复旦Ph.D沈志强:用于目标检测的DSOD模型(ICCV 2017)

极限元刘斌:深度学习在语音生成问题上的典型应用

搜狗文仕学:基于深度学习的语音分离

Video ++孙兆民:视频内容识别行业分析

悉尼科大王超岳:基于生成对抗网络的图像编辑方法

达观数据张健:文本分类方法和应用案例 

清华Ph.D王书浩:基于深度学习的电商交易欺诈检测系统

Twitter工程师王东:详解YOLO2与YOLO9000目标检测系统

Kaggle比赛金牌团队:图像比赛的通用套路有哪些?

宜远智能刘凯:显著降低模型训练成本的主动增量学习

如果你觉得活动不错,欢迎点赞并转发本文~

                    


首页 - AI研习社 的更多文章: