本期投稿: 冷静 谢益辉 何通

 * 统计往往应用于其他领域,帮助人做出决断,但是这个决断到底该由统计学家做出,还是由领域内的专家做出,却成了一个问题。早些时候COS放出的Terry Speed教授的访谈中也谈到“统计学本来就应该成就其他学科,我太爱统计了,它像把钥匙一样让我们能溜进任何学科的后院里随便玩耍”相信对于每一个深爱统计专业的同学对此问题都一定有过自己的想法—-我们应该如何为自己定位?

近日UCLA 统计系关于此进行了一次[研讨](http://citizen-statistician.org/2013/11/14/the-future-of-inference/),simply statistics 也据此发表了一篇[评论](http://simplystatistics.org/2013/11/15/whats-the-future-of-inference/)。相信读罢会对统计学科有新的理解。
  • 不是头条的头条:祝贺统计之都元老谢益辉新加盟RStudio!NEWS      作为看着师兄长大的我们(有种怪怪的感觉…我指的是看博客的历程),从他身上学到了不少,今后也要继续努力哦。
  • 人脑Vs电脑:学统计的文艺青年们,你们一定听过帕斯卡的这句话:“人是一棵会思想的芦苇,我们全部的尊严就在于思想。” 人为何会产生思想?也许想明白这个问题,可以让电脑和人一样思考。有人觉得如果假设人脑是一台电脑,那么内心的活动就是计算机程序,而思考就是程序的运行。学统计中最文艺的,文青中间最会编程的请点击这里。而且文中一并附带了可以在浏览器中运行的代码。
  • Spotify将许多自然语言处理的模型用在推荐系统上,并在一个参照数据集上对这些模型进行了测试,最终word2vec和rnn等方法完胜LDA和PLSA,不过结果表明Spotify自己研发的算法vector_exp才是最好的。
  • hlearn-cross-validates:如果一个分类器的“模型空间”能构成一个幺半群(monoid)——文章中提到贝叶斯分类器就满足要求——那么我们便能够通过这个性质在交叉验证的时候把不同数据块上训练好的模型直接合并起来,避免对同一个数据点做重复的训练。正如文章的名字所示,这样的方法能使速度提高很多。突然想起老师上课的时候常常停下比来,满怀深情地看着板书,幽幽说一句:“这是多么好的性质啊。”

发表/查看评论