分布式机器学习系统AnyEmbedding介绍

继2016年下半年我们开发了分布式机器学习系统Sabaton并且成功应用于腾讯广告业务之后,2017年上半年我们又开发(推出)了分布式Embedding训练系统AnyEmbedding。

基于腾讯多源异构数据现状,比如广告业务中有User,App,Query等数据,如何设计算法学习这些数据的embedding表示?同时腾讯用户(qq,weixin)规模在10亿左右,如何设计高效的分布式训练系统?在我们分享的ppt中将一一呈现。

以下是我们内部分享的ppt

PS:目前介绍分布式机器学习系统的工程实现文章并不多,比如分布式机器学习系统的架构怎么做,算法实现的正确性如何验证,如何利用向量化计算加速训练,模型上线(inference)时,需要注意些什么问题等?我们在实现这两个分布式机器学习系统积累了些工程经验,未来kimmyzhang和yuanhangzou将输出分布式机器学习系统工程实践的系列文章,每个文章一个主题,敬请期待。

slides

slides带备注版

本文链接:分布式机器学习系统AnyEmbedding介绍
本站文章若无特别说明,皆为原创,转载请注明来源:火光摇曳,谢谢!^^


火光摇曳

发表评论

电子邮件地址不会被公开。 必填项已用*标注

*