日期:2014-07-31 16:23
,当数据量只有500万时,该算法表现很差,但当数据量达到10亿级别时,该算法的表现最优异;相反,有一种复杂的算法,在500万数据量时表现最好,但在10亿级别数据量时效果不如简单的算法。
二、大数据下的数据如此之多,以至于我们不再热衷于追求精确度。在信息缺乏的时代,我们往往追求数据的精确度;在大数据时代,数据量如此之大,数据种类如此繁多,我们无法保证每个数据都是精确的,然而只要保证大部分的数据是精确的,就不会影响分析结果的可靠性。
三、在大数据时代,我们更加关心相关关系,而非因果关系。沃尔玛的分析系