大数据

  • 大数据,指的是所涉及的资料量规模巨大到 无法通过目前主流的软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的咨询。
  • 大数据的三个特点—— 3Vs:  
    - Volume (大量)数据量大,从TB级别跃升到PB级别
    - Variety(多样)数据类型繁多
    • 非结构化:文本、图形、声音等
          * 半结构化:日志
          * 结构化数据: 行列规整的表单数据
          * 多结构数据: 以上三种类型混合的数据  
      - Velocity(高速)数据的时效性,数据仅在一个短暂的时间有价值

云计算

HADOOP

  • hadoop的核心是在廉价硬件组成的集群上进行海量的数据运算,来获得有价值的信息
hadoop的优点
  • 高扩展性
  • 高可靠性
  • 高效性
  • 高容错性
  • 低成本