所有由fandywang发布的文章

关于fandywang

知之为知之,不知为不知。

[我们是这样理解语言的-2]统计语言模型

记得最早学习语言模型是在研究生的《统计自然语言处理》课上,由哈工大关毅老师主讲,从噪声信道模型切入,到 N-Gram 语言模型的构建、平滑、评价(KL 距离/相对熵、交叉熵、困惑度),接着以音字转换系统(即拼音输入法)为应用实践,最终还引出隐马尔科夫模型和最大熵模型。

后来又接触到前腾讯副总裁,现[......]

继续阅读

Peacock: 大规模主题模型及其在腾讯业务中的应用

编者注:2014年12月14日,腾讯广点通高级研究员靳志辉在2014中国大数据技术大会上发表演讲,题为《Peacock: 大规模主题模型及其在腾讯业务中的应用》,以下为作者演讲实录。

大家好,我来自腾讯效果广告平台部,参与开发的广告平台是广点通,广点通目前是腾讯最大的效果广告平台,每天承接的流量接[......]

继续阅读

[我们是这样理解语言的-1]文本分析平台TextMiner

互联网上充斥着大规模、多样化、非结构化的自然语言描述的文本,如何较好的理解这些文本,服务于实际业务系统,如搜索引擎、在线广告、推荐系统、问答系统等, 给我们提出了挑战。例如在效果广告系统中,需要将 Query(User or Page) 和广告 Ad 投影到相同的特征语义空间做精准匹配,如果 Que[......]

继续阅读

细数广告定向

广告收入支撑着互联网的大半壁江山,由于互联网广告的存在,用户可以享受到互联网免费提供的聊天、搜索、邮件、资讯、博客/微博、视频、音乐等一站式生活服务。相比传统广告,互联网广告使得企业(广告主)花费更少的钱获取更大的营销推广效果,不至于因“我知道我的广告费浪费了一半,可问题在于不知道是哪一半”而苦恼,[......]

继续阅读