摘要:盘点最了解大数据行业的公司,Hadoop供应商MapR绝对归属其中,这里带大家一览该公司CEO John Schroeder关于2014年大数据发展的8个预测,其中涉及到SQL-on-Hadoop、安全、数据一致性等多个方面。

2013年转瞬而逝,在过去一年中大数据可以说是有了一个飞速的发展,国内几乎所有的数据平台都在进行大数据投资,随着全球企业和个人数据的爆炸式增长,数据本身正在取代软件和硬件成为驱动信息技术行业和全球经济的下一个大“油田”。但是与传统的IT技术相比,大数据的独特在于它的出生——源于一场开源软件的革命。从IBM、Oracle等巨头到雨后春笋般的大数据创业公司,开源软件与大数据的结合迸发出惊人的产业颠覆性力量,几乎所有的厂商都开始拥抱开源大数据工具。

今天就和大家分享一下来自MAPR技术专家,Hadoop大数据部署软件供应商CEO John Schroeder关于2014年大数据发展的8个预测,John Schroeder认为在新的一年里企业主管的主要发展思路是将大数据变成为企业必须具备的基础设施,以下是有关技术发展和市场走向的8个预测:

预测一:SQL依然是大数据发展的一个矛盾点,首先SQL依然是Hadoop的业务分析师以及项目的开发人员的首选工具,开发人员可以选择hive、drillimpala等apache项目,以及选择Hadapt、Hawq和Splice Machine等公司的专有技术。但是SQL还面临着一个严峻的挑战——那就是SQL需要数据结构,而集中的结构化数据可引起延迟并且需要人工管理。SQL还限制分析类型。过分强调SQL将延迟机构全面利用其数据价值的脚步和延迟反应。

预测二:在2014年安全问题依然是制约技术发展一个难题,其中身份识别、认证是主要的数据安全问题,随着Hadoop(分布式计算)中提供的接入控制能力的猛烈攻击,机构迅速认识到线路级身份识别是必要的基础。没有充分的身份识别与认证机制,任何更高级的控制都很容易被绕过,妨碍预定的安全计划。

预测三:众所周知数据的不断发展中,总会有一些错误的数据,这些错误的数据可能导致中下游的分析出现偏差,导致跨部门或者业务部门的操作缺乏一致性等等,那么如何将错误的数据变成对企业有帮助的东西呢?2014年我们将会看到数据异常问题的解决方案。

预测四:Hadoop即将入户各大企业,2014年将看到Hadoop在各个行业中的生产部署显着增加。这将显示出Hadoop在运营中的实力。在那里,生产应用与分析结合在一起能够提供可以衡量的商业优势,如在客户化零售建议、诈骗检测和试验传感器数据进行规范的维护等场景。

预测五:更多的数据仓库将部署企业数据中心,2014年将会看到大多数公司的数据中心把数据提取处理和数据从企业数据仓库卸载到Hadoop,这样Hadoop将成为企业中心,并且能够对额外的处理或者新的应用进行更多的分析,同时还可以大幅度的降低数据中心的成本。

预测六:每个行业都会部署一个新的以数据为中心的应用,因为在2014年大数据的利用能力将会是企业间竞争的核心武器,更多的公司将使用大数据和Hadoop准确地针对个人消费者的偏爱追逐追加销售和交叉销售的机会,更好地缓解风险以及减少生产和开销成本。

预测七:数据成为每个数据中心的重中之重,在2014年,IT部门将越来越多地担负定义支持多种应用的数据基础设施的任务,把重点集中在部署、处理和保护一个机构的核心资产所需要的基础设施方面。

预测八:2014年非结构化的查询语言将会成为搜索的中坚力量,同时由于2013年有大量的用于Hadoop的SQL计划。2014年将是这种非结构化查询语言成为重点的一年。把搜索集成到Hadoop将为查找重要信息的企业用户提供一种简单和直观的方法。搜索引擎还是包括推荐引擎在内的许多发现和分析应用的核心。 

原文:2014 Technology Predictions Series: MapR Technologies on Big Data