首页
关于
论坛
投稿
搜索
大数据
2019-08-07
1 / 1
COS访谈
COS访谈第22期:李丰老师
李丰 / 王小宁 / 张心雨
/
2016-11-21
李丰,博士,中央财经大学统计与数学学院,副院长,硕士研究生导师, 主要研究方向为大数据与复杂模型、贝叶斯推断与统计计算、计量经济与预测方法以及多元模型。现任北京大数据协会理事,中国统计教育学会高等教育分会副秘书长,曾任2014 年金融工程与风险管理国际研讨会执行秘书。李丰老师是多个国家项目的项目负责人及主要参加人,曾获得The 2014 Cramér Prize等重要奖项。著有《大数据分布式计算与……
推荐文章
统计学发展方向的选择
王汉生
/
2015-10-02
看这题目,多吓唬人。又是方向,又是选择。一看就是知道作者是一个深受商学院教育毒害的砖家!但是,想跟大家说的是,我真心想把这个题目整小点,但是困难。为什么?因为接下来跟大家瞎聊的故事,确实关乎发展方向,确实关乎取舍。或者,至少关乎我自己的研究团队(小二十号兄弟姐妹)的方向和选择! 首先给大家简单介绍一点背景知识,小小吐槽一下现在统计学正面临的挑战。先从方法论说起。统计学的方法论主要依赖数学,尤其是概……
COS访谈
COS访谈第19期:张志华教授
张志华 / 常象宇
/
2015-09-29
【COS编辑部按】 受访者:张志华 采访者:常象宇 文字整理:王莉晶 朱雪宁 张志华, 博士,上海交通大学计算机科学与工程系教授,上海交通大学数据科学研究中心兼职教授,计算机科学与技术和统计学双学科的博士生指导导师。在加入上海交通大学之前,是浙江大学计算机学院教授和浙江大学统计科学中心兼职教授。主要从事人工智能、机器学习与应用统计学领域的教学与研究。迄今在国际重要学术期刊和重要的计算机学科会议上发……
统计软件
极简 Spark 入门笔记——安装和第一个回归程序
邱怡轩
/
2015-04-22
现在的各种数据处理技术更新换代太快,新的名词和工具层出不穷,像是 Hadoop 和 Spark 这些,最近几年着实火了一把。事实上听说 Spark 也有一段时间了,但一直是只闻其名不见其实,今天就来简单记录一下初学 Spark 的若干点滴。 […] 按照 Spark 官方的说法,Spark 是一个快速的集群运算平台,以及一系列处理大型数据集的工具包。用通俗的话说,Spark 与 R ……
推荐文章
郁彬:让我们拥抱数据科学(Let us own data science)
郁彬
/
2014-09-15
郁彬教授8月22日在北京大学做了名为让我们拥抱数据科学(Let us own data science)的讲座。在演讲中郁彬从一个统计学家的角度出发,讲述了数据科学的兴起历史和目前状况,并且对统计学科、从事统计相关工作的人士如何跟上时代步伐拥抱数据科学给出了非常多的建议。经过郁彬的允许和支持,本文分享了她此次演讲的幻灯片和视频! 演讲人介绍:郁彬是加州大学伯克利分校统计系和电子工程与计算机科学系的……
推荐文章
从数据到价值——创业团队应该关注的四个阶段
王汉生
/
2014-01-03
COS编辑部按:本文作者为北京大学王汉生教授,文章面向光华MBA学生系统梳理了从数据到价值的理念。作者简介:王汉生教授现任狗熊会会长、北京大学商务智能研究中心主任、北京大学光华管理学院商务统计与经济计量系系主任。现为ISI, ASA, IMS, RSS, ICSA会员,ASA会士(2014年6月23日更新)。 […] 这是一个最好的时代,移动互联网技术为从业者提供了无比丰富的数据。从……
R语言
聊聊R和GPU
寇强
/
2013-10-07
注:本文来自寇强的博客,原文请点击此处。 寇强:现为Indiana University PhD in Informatics。 微博:@没故事的生科男。 […] 这是一直想写几句的一个话题,既然今天有时间就聊一聊。 GPGPU算是近几年兴起的一个领域,以CUDA为代表,在高性能计算方面成果相当多。作为一种相对廉价的高性能解决方案,越来越多的程序员开始加入GPGPU阵营。Andrew……
统计计算
R 中大型数据集的回归
邱怡轩
/
2013-08-26
原文地址:http://statr.me/2011/10/large-regression/ […] 众所周知,R 是一个依赖于内存的软件,就是说一般情况下,数据集都会被整个地复制到内存之中再被处理。对于小型或者中型的数据集,这样处理当然没有什么问题。但是对于大型的数据集,例如网上抓取的金融类型时间序列数据或者一些日志数据,这样做就有很多因为内存不足导致的问题了。 这里是一个具体的例……
统计软件
R利剑NoSQL系列文章 之Cassandra
张丹
/
2013-07-18
R利剑NoSQL系列文章,主要介绍通过R语言连接使用nosql数据库。涉及的NoSQL产品,包括Redis, MongoDB, HBase, Hive, Cassandra, Neo4j。希望通过我的介绍让广大的R语言爱好者,有更多的开发选择,做出更多地激动人心的应用。 关于作者: […] 转载请注明: /2013/07/r-nosql-cassandra/ 第三篇 R利……
推荐文章
大数据时代和数据分析需求,统计还沾边吗?
施涛
/
2013-05-29
本文转载自施涛的博客,原文链接请点击此处。 […] 大数据时代的悄然到来和计算能力爆炸式增长,让做统计分析的各类人士不禁要重新打量一下自己的技能包,看看是不是很快要被时代浪潮以大浪淘沙的方式清洗掉了。 到底大数据是怎么来的呢?可以用来干什么呢?我们就先拿2012美国总统大选来举个例子看看。比如说我们想预测在2012年11月6日, […] 我们可以用什么数据来做这个预测……