我已经知道:(1)超算是由许多节点组成(跟云数据中心一样)。(2)每个超算节点中并没有很多cpu,比如天河二号每节点一个cpu,每节点一个操作系统,只是两个节点共用一个主板。(跟云数据中心差别不大,没有明显的性能提升作用)(3)各个超算节点也是通过网络连接(跟云数据中心一样)从以上几点,超算在原理上的并没有性能优势。
(4)各个超算节点之间可以采用RDMA,infiniband等高速网络技术互联(这是针对特殊业务的一个性能提升点,但最新的云数据中心也在引入这些技术,说明这些技术并非超算才能用)(5)云数据中心一般采用虚拟化技术给用户提供虚拟机有较大性能损失。(但如果是自己用的集群,完全可以直接使用裸机,最新的公有云也开始提供裸机业务了)以上(4)(5)是常见的云数据中心服务性能低于超算的点,可这些在云数据中心也完全可以做到。云数据中心采用相应技术或使用方式之后,超算在原理上的并没有性能优势。
那超算在原理上,到底快在哪里呢?
还得考虑一下成本因素。
天河超算 1 核心 1 小时才 1 毛钱,量大甚至可以更便宜。
这价格你在公有云上根本租不下来,大客户也不行。
那我同样的预算,在天河上是不是就可以租更多算力了?
因为公有云本身不是专门为了 HPC 服务的,它更具有通用性和普适性,所以价格上没啥优势。
但就像你说的,公有云确实也在这方面上发展。那发展到最后,不就相当于云下有个超算服务了吗?难道说你在意的是这个超算叫天河还是叫阿里?
2.1m questions
2.1m answers
60 comments
57.0k users