一般认为,大数据主要具有四方面的典型特征:

  1. 规模性(Volume):大数据具有相当的规模,其数据量非常巨大;数据的量级可以分为【B / KB / MB / GB / TB / PB / EB / ZB / … 】,而数据的量级从PB开始,才称得上大数据;
  2. 多样性(Variety):大数据的数据类型呈现多样性;数据类型繁多,不仅包括结构化数据,还包括非结构化数据和半结构化数据;其中,结构化数据即音频、图片、文本、视频、网络日志、地理信息等;传统的数据处理对象基本上都是结构化数据;现实生活中非结构化的数据也是大量存在的;因此,既要分析结构化数据,又要分析非结构化数据才能满足人们对数据处理的要求;
  3. 高速性(Velocity):处理大数据的速度越来越快,处理时要求具有时效性,因为数据和信息更新速度非常快,信息价值存在的时间非常短,必须要求在极短的时间下在海量规模的大数据中摈除无用的信息来手机具有价值和能够利用的信息;所以,随着大数据时代的到来,收集和提取具有价值的数据和信息必须要求高效性和短时性;
  4. 价值型(Value):从大数据的表面数据进行分析,进而得到大数据背后重要的有价值的信息,最后可以精确的理解数据背后所隐藏的现实意义;大数据的价值密度的高低与数据总量的大小成反比;【如何通过强大的机器算法更快速的完成数据的价值“提纯”成为目前大数据背景下需要解决的难题与关键】

说点什么

avatar

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据

  Subscribe  
提醒
隐藏
变装