1. 基于虚拟机的虚拟化和基于容器的虚拟化
非正式的说,虚拟化是通过软件手段对计算机硬件资源镜像整合管理和再分配的一种技术。最常用的就是基于虚拟机(Hypervisor-based)的虚拟化,经过40年的发展,基于虚拟机的虚拟化技术已经比较成熟,它通过一个软件层的封装,提供和物理硬件相同的输入输出表现,实现了操作系统和计算机硬件的解耦,将OS和计算机间从1对1变成了多对多(实际上是1对多)的关系。该软件层称为虚拟机管理器(VMM/Hypervisor),它可以直接运行在裸机上(Xen、VMware EXSi),也可以运行在操作系统上(KVM、VMware workstation)。
然而这样的方案有一个缺陷,在虚拟机上运行了一个完整的操作系统(GuestOS),在其下执行的还有虚拟化层和宿主机操作系统,一定比直接在物理机上运行相同的服务性能差。而且有GuestOS的存在,虚拟机镜像往往有几个G到几十个G,占用的存储空间大,便携性差,迁移时通信代价大,不便于集群管理。另外每次想要使用更多硬件资源,需要启动一台新的虚拟机,要等待GuesOS启动,可能需要几十秒到几分钟不等。这些问题都是GuestOS带来的,虚拟化层的技术再怎么进步也无法解决这几个问题。实际使用场景中,我们使用虚拟化技术其实是为了按需分配资源来完成服务的部署和使用,同时对服务所依赖的环境进行隔离,不被其它服务感知或干扰。为此启动一个GuestOS并不是必需的,为什么不考虑让多个虚拟机公用一个操作系统内核,只隔离开服务运行环境同时控制服务使用的系统资源呢?基于容器的虚拟化就是这样一种技术。容器是没有GuestOS的轻量级“虚拟机”,多个容器共享一个OS内核,容器中包含需要部署的应用和它依赖的系统环境,容器大小通常只有几十到几百MB。由于共享操作系统内核,所以容器依赖于底层的操作系统,各个操作系统大都有自己的容器技术和容器工具。Docker是一个Linux容器管理工具,随着Docker的兴起,Linux容器技术也是当下最时兴的容器虚拟化技术。Linux容器工具有很多,OpenVZ、LXC、Docker、Rocket、Lmctfy等等,大都是基于Linux内核提供的两个机制:Cgroups(实现资源按需分配)和Namespace(实现任务隔离)。由于使用的技术完全不同,容器和虚拟机也有很多不同的地方:最直观的区别就是容器比虚拟机明显更轻量级,对宿主机操作系统而言,容器就跟一个进程差不多。因此容器有着更快的启动速度(秒级甚至更快),更高密度的存储和使用(镜像小)、更方便的集群管理等优点。同时由于没有GuestOS存在,在容器中运行应用和直接在宿主机上几乎没有性能损失,比虚拟机明显性能上有优势。还有一点是虚拟机技术已经发展了很多年,虚拟机和虚拟化层间的接口、虚拟机镜像格式等都已经标准化了,相应的管理工具、分布式集群管理工具都有比较完善的解决方案,而容器最近几年才兴起,配套技术和标准还在完善中。此外虚拟机由于有GuestOS存在,可以和宿主机运行不同OS,而容器只能支持和宿主机内核相同的操作系统。而且虚拟机由于有VMM的存在,虚拟机之间、虚拟机和宿主机之间隔离性很好,而容器之间公用宿主机的内核,共享系统调用和一些底层的库,隔离性相对较差。2.云计算和虚拟化
云计算是最近几年才兴起的概念,但是这样的需求其实早都有了,现阶段广为接受的是美国国家标准与技术研究院(NIST)定义:
云计算是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问, 进入可配置的计算资源共享池(资源包括网络,服务器,存储,应用软件,服务),这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互。云计算最基本的特性是:“按使用量付费”、“资源共享池”和多租户隔离。就如前面提到的,虚拟化技术就是解决了资源共享、按需分配和任务隔离的功能,于是云计算和虚拟化技术的结合是很自然的。于是问题来了,是选取基于虚拟机的虚拟化呢,还是基于容器的虚拟化。早期由于容器技术的不完善,云计算只有虚拟机这一种选择。随着现在容器技术兴起,基于容器的虚拟化性能更高,交付速度快,方便管理,而且资源利用率高,看起来是比虚拟机更好的方案。但是它现有的两个比较大的缺点(隔离性不够强、操作系统依赖性)让他无法完全替代VM,对于 SaaS用户和部分PaaS用户而言这两个缺点可能不那么明显。现阶段Container和云计算主要结合的场景也是在SaaS和PaaS中(事实上大多数SaaS和PaaS服务提供商都使用了容器技术)。但是对于 IaaS的用户来说,他们租用的是基础设施,上面承载着他们自己运行的系统和服务,隔离性不强意味着安全性和可信性不高,在这种情况下大客户们(一些公司会把自己的服务托管在云上,租用公有云,省下来机房、服务器和运维的成本,他们也是公有云最主要的客户)肯定是不放心的。同时操作系统依赖性也是限制Container在 IaaS层应用的一个主要问题,也是绝大多数解决方案都是将container运行在VM上的原因,这样Container性能好的优势实际上在云上根本发挥不出来,优点只有启动快了。3. OpenStack和Kubernetes
不是一个大型分布式集群虚拟化平台就能称之为云计算平台的的,OpenStack作为时下最成功的开源云计算管理平台(现阶段主要致力于IaaS平台),能提供的管理功能比Kubernetes 强太多了,Kubernetes只是提供一个容器的分布式集群管理工具,OpenStack里光是Nova+Heat两个组件就比Kubernetes的功能更多(事实上在Magnum正式立项之前,OpenStack先后推出过Nova-docker-driver和Heat-docker-driver用来提供容器服务)。
如前面云计算定义所说的:”云平台需要提供可用的、便捷的、按需的网络接入“,"资源能快速被提供“,”只投入很少的管理工作“。于是一个云平台需要具备多租户访问控制、网络虚拟化、存储虚拟化、计算虚拟化、虚拟化集群管理和编排、用户友好的接入方式、故障监控功能等等,Openstack经过几年十几个版本的更迭,已经拥有了Keystone、Nova、Neutron、Cinder、Glance、Swift、Heat、Ceilometer等等组件,比较完整的提供了一个云平台应有的各个模块。而Kubernetes只是提供了容器的虚拟化集群管理和编排功能,而且就这个功能也不够完善。此外OpenStack也在不断整合新的东西进来,正在开发中的Magnum是容器管理和编排的组件,Magnum中使用了Kubernetes作为容器的集群管理和编排,此外结合其它组件的功能才能提供比较完整的一个基于容器的云平台解决方案。