当前位置:首页 > 问答 > 正文

数据越来越多,虚拟化好像变得特别需要了,大家都在找解决办法

“数据越来越多,虚拟化好像变得特别需要了,大家都在找解决办法”,这句话其实点出了当前很多企业,尤其是互联网公司和那些依赖大量数据进行分析的机构,正在面临的一个非常现实和头疼的问题,这感觉就像以前家里只有几件家具,随便放放都挺整齐,但现在突然搬进来一仓库的东西,原来的小房子不仅塞不下,找起东西来也像大海捞针,整个空间的使用效率变得极低,数据爆炸式增长带来的就是这种“数据仓库”的混乱和低效,而“虚拟化”就被很多人看作是整理这个仓库、让空间利用率变得更高的一个关键工具。

这个现象的背后,首先是数据的来源变得五花八门,以前可能主要就是公司内部系统产生的业务数据,比如销售记录、库存信息,但现在完全不同了,根据中国信息通信研究院发布的《大数据白皮书》中的分析,数据来源极大地丰富了,手机上每一个APP的使用行为、每一次点击、停留时长,都被记录下来;遍布城市的摄像头、传感器时时刻刻在产生海量的视频和环境数据;工厂里的机器设备也会自动上报自己的运行状态和参数,这些数据不仅数量庞大,而且产生的速度非常快,是连续不断的流式数据,这就好比以前是几个水龙头在滴水,现在变成了无数条高压水枪在同时喷水,原来的小水池瞬间就被灌满甚至溢出了,企业原有的那些用来存储和处理数据的服务器和硬盘,很快就显得不够用了,如果按照老办法,数据多了就去买更多的服务器和硬盘,那成本会高得吓人,机房空间也有限,而且这些新买的设备在数据量不那么大的时候,又会大部分时间闲着,造成巨大的浪费,TechTarget中国的一篇报道也提到,企业IT基础设施的成本控制和资源利用率低下,是推动他们寻求变革的主要压力之一。

正是在这种“不搞不行”的压力下,“虚拟化”的思路开始受到广泛的关注和应用,这里的虚拟化(主要指服务器虚拟化),其核心思想有点像“一机多用”,过去,一台物理服务器通常只运行一个特定的应用和服务,比如一台专门跑数据库,另一台专门做网站服务器,这就好比一家公司给每个员工都配了一整栋办公楼,大部分房间都空着,非常浪费,而虚拟化技术,就像是在一栋物理大楼里,用技术手段隔出很多个独立、互不干扰的虚拟办公室(即虚拟机),每个办公室都可以租给不同的“租户”(不同的应用或服务)使用,这些虚拟办公室有自己的“门牌号”(IP地址)、自己的“办公桌椅”(操作系统、内存、CPU资源),它们感觉上就像自己独占了一整栋楼,但实际上大家是共享底层那台物理服务器的硬件资源的。

数据越来越多,虚拟化好像变得特别需要了,大家都在找解决办法

这样做的好处是立竿见影的,它极大地提高了硬件资源的利用率,原来可能十台服务器只能干十件事,现在可能两三台服务器通过虚拟化,就能承担原来十台服务器的任务,因为把那些闲置的计算能力都充分调动起来了,这直接降低了企业购买新硬件的成本和后续的电费、维护费,管理和运维也变得灵活多了,如果需要部署一个新的应用,不再需要去采购、上架、调试一台新的物理服务器,只需要在虚拟化平台上点几下鼠标,几分钟就能“划分”出一个新的虚拟机来,大大加快了业务上线的速度,当某个应用需要更多资源时,也可以动态地给它分配更多的虚拟CPU和内存,弹性非常好,这种灵活性对于应对业务快速变化和数据量波动至关重要,Gartner的分析师就曾多次指出,基础设施的敏捷性和弹性是现代企业数字化转型的关键能力之一。

事情并没有那么简单,数据越来越多,光是把服务器虚拟化了还不够,因为数据最终是要存储下来的,这就引出了与服务器虚拟化相伴而生的存储虚拟化和网络虚拟化需求,存储虚拟化可以理解为把很多台物理存储设备(比如一堆硬盘)的容量池化,变成一个大的、统一的“虚拟存储池”,然后按需分配给上面的各个虚拟机使用,这样就不需要为每个应用单独配置存储空间,管理起来更方便,也能更好地利用存储容量,网络虚拟化则是为了让这些虚拟机之间的通信更加灵活和安全,可以看出来,虚拟化其实是一套“组合拳”,目的是让整个IT基础设施——计算、存储、网络——都变得像水和电一样,能够被灵活、按需地调配和使用。

数据越来越多,虚拟化好像变得特别需要了,大家都在找解决办法

正因为有这些明显的好处,大家都在找解决办法”这句话非常贴切,无论是像VMware、Citrix这样的传统虚拟化软件提供商,还是各大云服务商(如阿里云、腾讯云)提供的弹性计算服务(其底层核心技术就是虚拟化),都成为了市场上的热门选择,很多企业都在积极评估和部署虚拟化方案,或者将业务迁移到云端,这几乎成了一种趋势,IBM的行业报告中也曾强调,混合云环境(结合了本地虚拟化环境和公有云)正成为企业的主流选择,以应对数据增长的复杂需求。

这条路也并非一帆风顺,虚拟化在带来高效率和高灵活性的同时,也增加了管理的复杂性,你需要一个统一的管理平台来监控成百上千个虚拟机的运行状态,确保它们的安全和性能,当所有应用都集中运行在少数几台高性能物理服务器上时,这些服务器本身就成为了“单点故障”的风险点,一旦出问题,影响面会非常大,高可用性、容灾备份等配套方案也必须跟上,这就像你把所有鸡蛋都放在几个篮子里,虽然拎起来方便了,但就必须把篮子做得特别结实,并且时刻有人看管。

“数据越来越多”是挑战,是驱动变化的根本原因;而“虚拟化”是当前阶段被广泛探索和实践的一种重要“解决办法”,它通过将物理资源抽象、池化和灵活分配,有效地提升了资源利用率,降低了成本,并赋予了企业应对数据洪流和业务变化的敏捷性,虽然它也带来了新的管理挑战,但其价值已经得到了普遍的认可,可以说,在数据洪流的时代,学会如何更聪明、更高效地使用和管理IT资源,虚拟化是许多企业迈出的关键一步,大家都在找的,其实就是这种能够化繁为简、以柔克刚的智慧之道。