对于大数据的定义,本来就是一个大数据(joke)。特别是目前关于大数据的文章层出不穷的时期。
书中对大数据提出了4V定义:Volume,Variety,Veracity,Velocity。而真正的难题在于对数据的操作:数据的采集、存储、检索、共享、分析和数据可视化。
要理解大数据,要理解三个问题:
- 大数据是什么?
- 大数据为何如此重要?
- 如何利用大数据解决问题?
学习大数据,必须掌握5项基本技能:
- 数据挖掘;
- 数据可视化;
- 数据分析;
- 数据操作;
- 数据发现。
目前的发展是大数据的分布式处理,未来的发展将是大数据在大内存中如何快速处理!
本文探讨了大数据的四个核心特征(Volume、Variety、Veracity、Velocity),并介绍了大数据处理的关键步骤,包括数据采集、存储、检索、共享、分析及可视化。此外,文章还强调了学习大数据所需的基本技能。

935

被折叠的 条评论
为什么被折叠?



