沃卡惠移动端logo

沃卡惠  行业资讯

资讯详情

中小企业能从超级计算革命中学到什么

2022-12-12 11:34:094636

这意味着所有级别的计算可以从这些开创性的机器中学到一些东西,但中小型企业(SME)可以从中吸取具体的经验教训。

中小企业能从超级计算革命中学到什么

收获利益

在过去几年中,影响各种规模企业的一个因素是向更大的远程和混合工作的转变。这里的一个有利因素是公共、私有和混合云基础架构的可用性和复杂性的增长。这可以提供软件服务的连续性支柱,使员工无论是在家还是在办公室工作,都能享受相同的工作环境体验。

通过选择合适的硬件平台,云计算的底层基础设施可以享受与超级计算机相同的一些好处。特别是,密度更高的服务器CPU平台可以为相同级别的服务带来更低的环境影响和更低的成本,或者用同样的钱提供更多的计算能力。如果您的远程工作负载需要GPU加速,这也是一些云提供商的一个选项,选择合适的平台还有更多好处。

具有亿亿次级能力或接近亿次级能力的最新超级计算机利用了第三代AMD EPYC处理器提供的更高密度,每插槽可提供高达64个内核(因此每台服务器可提供高达128个内核和256个线程)和高达4TB的RAM。虽然这有利于超级计算工作负载所需的原始计算,但它也可以增强云环境中虚拟机和容器的交付。云基础设施数据中心中的单个机架式服务器能够提供的CPU内核越多,它能够支持的实例就越多,并且它还将支持具有更多内核的更大虚拟机。

AMD的平台价格使服务器能够比竞争对手提供更多高性能内核,并且更高的密度带来更低的能源运行成本,因此云提供商能够以比竞争对手平台更低的订阅费用提供服务。正如最新的超级计算机可以通过选择AMD EPYC处理器以更低的功耗提供更高的计算性能一样,云提供商提供AMD EPYC CPU驱动的实例,其性能与其他平台类似,但成本更低,使其成为非常有效的选择。

对于需要GPU加速的工作负载,第三代AMD EPYC处理器提供128通道的PCI Express 4.0,使服务器硬件能够全速支持多达8个GPU。然后,虚拟机可以为远程虚拟桌面提供工作站级图形加速。这开启了在云中创建内容的可能性,使在旅途中的设计师能够轻装上阵,通过互联网使用相对低功率的客户端系统(甚至是笔记本电脑)访问安全、强大的工作站环境。

处理器能力

AMD还刚刚发布了第四代EPYC处理器,将每个插槽的最大内核数量从64个增加到96个,进一步提高了密度,内存增加了50%,最大6TB。这将是第一个支持DDR5的AMD EPYC平台,有12个通道的4,800MHz ECC RAM可用。这将极大地提高带宽,从而在运行数据库服务等内存密集型工作负载时获得更好的性能。新处理器将从AMD现有的云合作伙伴处获得,包括AWS、阿里云、谷歌云、微软Azure、甲骨文云和腾讯云。

在AMD的路线图中,128核CPU将于2023年晚些时候推出。这将使双插槽系统能够提供256个内核(512个线程),是使用当前第三代AMD EPYC CPU的两倍。对于云提供商来说,这将使密度发生又一次变化,能够以比其他平台更具竞争力的价格提供高性能实例。未来的超级计算机将同样受益于更高的密度,从集群中提供更强的计算能力。

然而,除了日常生产力之外,部署人工智能/机器学习支持的工作负载的能力是模仿超级计算最新趋势可以为中小企业带来红利的另一个领域。在能够实现亿亿次性能水平的超级计算机中,GPU能力受到了相当大的重视,例如Frontier的大部分FLOPS都来自加速器(具体来说是AMD Instinct MI250),而不是主机CPU。科学工作负载正在通过西门子CodeBench Lite等环境进行移植,以利用这种GPU能力,这有助于支持必要的软件调用,而不需要非常低级的开发技能。

虽然GPU加速将这些科学工作负载带到了一个新的性能水平,并支持使用更大的数据集,但对GPU能力的关注也有助于加速AI/ML的主流使用趋势。过去,对昂贵的硬件加速的需求使得人工智能/人工智能局限在能够从其应用中获得最大利益的专业领域。但最新的超级计算机为这种工作负载提供了丰富的性能,这鼓励了更广泛的应用。GPU和高密度平台(如AMD EPYC处理器驱动的服务器)的更高经济性使云提供商能够提供为AI/ML工作负载量身定制的实例。这是一个将要扩展的领域。借助云的现收现付模式,即使是中小企业也将能够考虑AI/ML来增强跨数据集的分析洞察力。

过去几十年的计算革命一直是一个以更少的钱获得更多性能的故事。这是臭名昭著的摩尔定律的基本含义。但在过去几年中,速度最快的超级计算机将类似核心平台的放大和优化版本应用于更日常的系统,这一事实创造了更多的连续能力。现在,最高层的软件和方法创新可以更容易地渗透到中小企业。特别是通过云服务提供商,中小企业可以从运行在超级计算机级硬件上的强大虚拟机中获得实惠的运营成本,并开始利用AI/ML的蓬勃发展。