取消
搜索历史

    暧昧不清 到底什么是大数据?

    来源:存储网 2011-11-07 21:58大数据

    从当前的情况来看,我们正逐步迈向云存储,而在这过程中,云存储和所谓的“大数据”碰撞在了一起。这并不是说云技术不再向前发展或消失了,不过越来越多的磁带、存储和数据库供应商,甚至是数据存储行业中的任何人,都将注意力转向了大数据。

    很显然,只要你销售设备,你就会钟情于“大数据”这个想法,这意味着用户将会需要更多的设备来处理这些大数据。那么,到底什么是大数据呢?

    从长远角度看,大数据这个词暧昧不清,甚至都不能被称之为一个合格的市场代名词,不过当你退后一步,从一个全局的角度出发看,“大数据”代表着你处理数字信息的所有事情,正是由于这种最初的需求,驱动着当今每一次IT变革的发生。

    IT业内的每一次破坏性变革都和处理信息数据的新的方式息息相关。所开启的新功能通常都非常重要,以至于我们愿意为其大笔的投入。我们放弃了可靠的管理型和可用性,转向分布式计算,为此放弃可靠性和速度以顺应基于因特网的运作。这种巨大的变动使得我们能够处理更多的数据,并使得处理数据变得更为容易。

    大数据将集成度和信息的使用提升到一个全新的水平。其范围广泛,包含新的对大量结构化或非结构化数据的高性能分析,全新的内容分析的层次,以及对现有存储上频繁利用和极少利用的数据更好的利用通用性的元数据。大数据还包括将许多不同的数据集中的数字信息提炼整合起来。

    但是,问题出在我们将大数据视作其它各类技术的驱动者。在EMC World活动上有一些醒目的标识,告知人们云技术处于大数据的顶部。

    而在我看来,云并非处于大数据的顶部——其更多的情况下和其它技术混合在一起。更重要的是,云技术能够成功部署的很大原因在于是否开启了大数据的各项功能。而对此,我们远未达到。

    在过去的几年里,无论各类基础架构技术——网络、存储、安全防护、服务器、应用程序——如何相互交错,业界已经在简化基础架构并使其更为高效方面取得重大进步。而下一阶段的挑战来自信息,而我们在这方面还有很长的路要走。让我们想想这件事:你的基础架构如何才能使你的程序员和业务通过使用信息来做更多的创新,并且能较以往都更加高效来使用它?

    一些供应商对此的回答含糊不清。他们通常从大型的供应商那里获取一堆技术,这看上去就像是为信息高速公路提供一个强大的引擎。我们并不是说哪些解决方案没有作用,不过每个供应商都有这么一堆技术,并且他们都要确保其技术较其他友商更具竞争力。然而对于用户而言,即使这些超大引擎看上去极其漂亮,它对于你业务是否能驾驭海量数据可能帮助不大。

    建立大型的基础架构并不足够,于是有许多技术人员指出如何进行基础架构相关的信息处理。云技术在于创建信息和基础架构之间的连接,从而使得基础架构可以配置为将信息调整用于新的用途。供应商可以通过提供底层对于应用程序和业务用户的支撑致力于此。并且假设供应商当前已经在存储市场占据优势,并且亦希望保持这块市场份额,他们最好能快速地转变,一些新兴的小型公司,如Cloudera、Eucalyptus Systems、OpenStack 联合公司和其它的一些都在宣传其创新性的技术。并且还有一个潜在而让人可怕的竞争对手,VMware。

    VMware正挥舞着它诸多独有的秘密武器,比如Cloud Foundry和SpringSource,这些技术或许有一天会成为下一代IT进化中更具扩展性和协调能力的基础架构单元。

    当前已有诸多有价值的技术来优化大数据集,提供更高性价比的大数据集存储,并提供工具和技术来使得物理体系架构满足大数据所需的扩展性。不过当将大量的数据集合放到“大数据”意味着将这些二进制字符转变为对业务极具价值的东西。

    这并不是说支持大数据的的工具没有价值,比如性能优化,虚拟化和自动化;不过为提供“大数据”,这些工具必须整合形成一个整体,而不是简单的将这些工具相互叠加。

    当大数据开始的时候,你不得不考虑供应商如何才能更好地整合基础架构,使其高效涵盖诸多不同的IT基础架构域;还要考虑该体系架构如何才能改变你企业创造和实用信息的方式。

    (文章为作者独立观点,不代表存储网立场,版权疑问请联系客服。)
    关于我们| 隐私条例| 版权申明| 联系我们

    2018-2022 Copyright © Stor.com.cn