首页
关于
论坛
投稿
搜索
统计计算
2019-08-07
2 / 3
统计计算
自制简单遗传算法实验
何通
/
2013-09-15
我参加完八月份的COS沙龙之后比较闲,忽然想起自己很久以前看的遗传算法的基本思想。本着时不时就应该做一些私活的心态,我就在旅行商问题上面把它实现了一下。 […] 遗传算法是一个仿生学的算法。进化论认为地球上千奇百怪的生物都是进化而来的,如今能生存在地球上的生物是更适应于这个环境的,我们也可以说它们是被“优化过”的。他们是怎么优化的呢?在一个种群中,生物的差异主要来自于两点,不同染色体……
统计计算
R 中大型数据集的回归
邱怡轩
/
2013-08-26
原文地址:http://statr.me/2011/10/large-regression/ […] 众所周知,R 是一个依赖于内存的软件,就是说一般情况下,数据集都会被整个地复制到内存之中再被处理。对于小型或者中型的数据集,这样处理当然没有什么问题。但是对于大型的数据集,例如网上抓取的金融类型时间序列数据或者一些日志数据,这样做就有很多因为内存不足导致的问题了。 这里是一个具体的例……
统计计算
LDA-math-MCMC 和 Gibbs Sampling
靳志辉
/
2013-01-17
随机模拟(或者统计模拟)方法有一个很酷的别名是蒙特卡罗方法(Monte Carlo Simulation)。这个方法的发展始于20世纪40年代,和原子弹制造的曼哈顿计划密切相关,当时的几个大牛,包括乌拉姆、冯.诺依曼、费米、费曼、Nicholas Metropolis, 在美国洛斯阿拉莫斯国家实验室研究裂变物质的中子连锁反应的时候,开始使用统计模拟的方法,并在最早的计算机上进行编程实现。 随机模拟……
统计计算
Persi Diaconis(2)
韩钧
/
2012-09-09
本篇将给出上次提出的解码问题的一个可能的解(建议大家阅读Persi Diaconis写的原文,可以很容易在谷歌中找到,文章名字见上一篇)。 假设我们已经知道该密码文件中所有字符对应的实际中的符号集(如26个英文字母以及0-9的阿拉伯数字等)。 我们将这些字符随机地对应到我们已知的符号,看看结果是否合理(即解码后是否有意义),如此遍历所有可能的对应关系,就可以了。这是一个办法,但显然不是一个好的办……
统计计算
Persi Diaconis (1)
韩钧
/
2012-08-22
作为统计之美的开篇,我一直想找一篇我非常愿意写的统计故事,尽管有很多,但都不能让我觉得可以发泄笔头之愤。最近在听贝叶斯统计课,刘军老师(哈佛大学统计系教授)提起了叫Persi Diaconis的人,他的故事和他的工作,这让我找到了写这篇文章的灵感。 你能想象,一个人在14岁离家出走,学习魔术,浪迹江湖,24岁后潜心学术,之后成为斯坦福大学的教授? Persi Diaconis(维基)确实如此,他在……
统计计算
MCMC案例学习
Charles J. Geyer
/
2012-07-24
本文是R中mcmc包的一篇帮助文档,作者为Charles J.Geyer。经过knitr编译后的pdf文档可见此处,提供中文译稿的作者: 闫超,天津财经大学统计系2011级研究生,方向:非寿险准备金评估。 高磊,天津财经大学统计系2011级研究生,方向:非寿险准备金评估。 […] 这个案例,我们不关心题目的具体意义,重点放在利用贝叶斯的观点来解决问题时,MCMC在后续的计算中所发挥的……
统计计算
那些年,我们一起追的EB
杨灿
/
2012-05-26
写了《统计学习那些事》,很多童鞋都表示喜欢,这让我越来越觉得冯导的一句话很有道理:“我的电影一向只伺候中国观众,还没想过拍给全世界人民看。这就跟献血一样,本身是好事,但如果血型不对,输进去的血也会产生排异现象。我的‘血型’就适合中国人,对不上世界观众,别到时伤了我的身子骨,还伤害了世界观众,所以我暂时不会‘献血’。”比如他的《天下无贼》,我就特别喜欢。然而天下可以无贼,却不可以没有英雄(不是张导的……
统计模型
分组最小角回归算法(group LARS)
郝智恒
/
2011-04-27
继续前两篇博文中对于最小角回归(LARS)和lasso的介绍。在这篇文章中,我打算介绍一下分组最小角回归算法(Group LARS)。本文的主要观点均来自Ming Yuan和Yi Lin二人2006合作发表在JRSSB上的论文Model selection and estimation in regression with grouped variables. 首先,我想说明一下,为何要引入分组变……
统计模型
修正的LARS算法和lasso
郝智恒
/
2011-04-25
在小弟的上一篇文章中,简单的介绍了LARS算法是怎么回事。主要参考的是Efron等人的经典文章least angle regression。在这篇文章中,还提到了一些有趣的看法,比如如何用LARS算法来求解lasso estimate和forward stagewise estimate。这种看法将我对于模型选择的认识提升了一个层次。在这个更高的层次下看回归的变量选择过程,似乎能有一些更加创新的想……
统计模型
LARS算法简介
郝智恒
/
2011-04-23
最近临时抱佛脚,为了讨论班报告Group Regression方面的文章,研究了Efron等人于2004年发表在Annals of Statistics里一篇被讨论的文章LEAST ANGLE REGRESSION。这篇文章很长,有45页。加上后面一些模型方面大牛的讨论的文章,一共有93页。对于这种超长论文,我向来敬畏。后来因为要报告的文章里很多东西都看不懂,才回过头来研读这篇基石性的文章。 所谓……
统计计算
Sweave后传:统计报告中的大规模计算与缓存
谢益辉
/
2011-01-03
学无止境。我曾以为我明白了如何在Sweave中使用缓存加快计算和图形,但后来发现我并没有真的理解,直到读了另外一些手册才明白,因此本文作为前文“Sweave:打造一个可重复的统计研究流程”之续集,向大家介绍一下如何在Sweave的计算和图形中使用缓存,以节省不必要的重复计算和作图,让那些涉及到密集型计算的用户不再对Sweave感到难堪。 如果你还没读前文,建议先从那里开始读,了解Sweave与“可……
统计计算
有边界区间上的核密度估计
邱怡轩
/
2010-04-11
核密度估计应该是大家常用的一种非参数密度估计方法,从某种程度上来说它的性质比直方图更好,可以替代直方图来展示数据的密度分布。但是相信大家会经常遇到一个问题,那就是有些数据是严格大于或等于零的,在这种情况下,零附近的密度估计往往会出现不理想的情况。下面以一个指数分布的模拟数据为例(样本量为1000),R程序代码为: set.seed(123); x=rexp(1000,1);……
««
«
1
2
3
»
»»