大数据情况下的普式算法应用问题。大数据情况下我们课本里的算法也是可以用的,但是速度会非常慢,那怎么办呢?
解决方案。
一,很多互联网公司,采取暴力来扛的方法,例如hadoop,spark...分布式的计算集群,基于内存的计算,速度很快。将普通的算法移置到这个分布式集群上,但是将普通的算法移置到这个分布式集群上时需要mapreduce化,要对算法测底的改造。
二,利用统计学的抽样,将大样本转化成小样本来处理,算出一套公式,将大数据问题转化为小数据问题。
三,大数据不一定是指数据大,也包括计算数据量很大的问题。例如,求完全图问题。指数增长,降低精度,提高计算速度。