《白云书园》之数字时代(十五)

统计之都

拖着疲惫的身心,带着周一综合症,小书来到了单位。还好今天不用上街,只用把上周街调收来的数据汇总。其实小书也不是总要去站街的,只是偶尔要用到一些抽样数据来帮助其他渠道来的数据做市场调查。就像占中一样,这事要是必须天天干,鸭梨山大呀。

处理数据一直到下午,小书才有机会喘口气。真是累[……]

继续阅读

《白云书园》之数字时代(十三)

数据科学家

好不容易小白逮到第二个机会让小书认真听他讲会自己的主项,那个得意啊。这不,这不停不下来了。

“小书,你说你们统计只学了点统计抽样和回归,其实这些还是很牛B的。能用一部分数据就把问题搞清楚,何必多花力气去把所有数据都跑一遍呢?”

“你说的也是,只是我们在上学时学了很多模型玩具,没太多机会打实战,考试又主要侧重公式推导,数学证明,也不关心数据分析能力。等我毕业后在工作中才发现理想真的很丰满,现实确实很骨感啊。经常碰到一堆乱七八卦的问题和数据,还有数据格式没谱,没哪个模型好用的情况。”

“嗯,这个好像比较普遍。数学公式和统计模型本身教起来有逻辑,也好考察,比较阳春白雪。数据分析就显得有些下里巴人了。”

“是啊是啊!数据收集,数据洗涤,数据打包,数据存储,数据传输,…,这些脏活累活都是数据被整理成书上顺理成章地提到的矩阵前要干的。”

[……]

继续阅读