ICC讯 近期,德国公司Q.ANT正式发布了其第二代光子处理器——NPU 2。这款新型原生处理单元旨在为人工智能和高性能计算工作负载带来能效和性能的显著提升。该系统利用光直接执行非线性数学运算,与数字处理器相比,能够以更快的速度和更低的功耗运行复杂的人工智能、机器人和科学计算应用。
Q.ANT首席执行官Michael Förtsch博士表示:“Q.ANT为业界提供了一类全新的处理器,使其能够实现超越数字处理器渐进式改进的性能提升——这为数字电路无法实现的卓越算法打开了大门。多年来,人工智能的发展速度一直快于我们的供电能力——能源成为了新的前沿领域。通过我们的NPU,我们改变了这一等式。我们的NPU 2证明了性能和可持续性并非对立力量,它们是一体的。这不是演进,而是一个新的开始。”
重新思考计算,应对能源限制的世界
人工智能的加速发展已经触及硅材料的物理极限。每一代新的GPU都消耗更多的电力和水资源,产生更多的热量,冷却系统的能耗可占数据中心总能耗的高达40%。光子处理从根本上改变了这一等式。光传输速度更快,几乎不产生热量,并且可以在一个光学步骤中执行复杂函数,而这在CMOS芯片中需要数千个晶体管才能完成。通过用光的原生模拟计算取代晶体管逻辑,Q.ANT的架构在运行复杂的AI和HPC工作负载时,能实现能耗降低高达30倍,性能提升高达50倍。
在SC 2025大会上进行现场演示
Q.ANT于2025年11月17日至21日在美国圣路易斯举行的超级计算大会(Supercomputing 2025)上首次展示其第二代原生处理单元(NPU 2)。在LRZ展位(编号535),Q.ANT运行一个基于图像的AI学习现场演示,该演示由其光子处理器上的Q.ANT光子算法库提供支持。Q.PAL为开发者提供了高效的非线性算法和函数,用于处理复杂工作负载,并由Q.ANT持续增强和优化,以面向应用进行光子处理。该演示将展示,与传统的基于CPU的系统相比,Q.ANT的光子处理器如何以更少的参数和更少的运算量实现更精确的结果,从而展示在现有服务器架构内实现的光子加速实际效果。
参观者可以测试NPU如何在几秒钟内使用非线性神经网络学习图像。这标志着一个重大进步:在短短一年内,Q.ANT已从简单的数字识别发展到图像分类和图像学习。Q.ANT首席执行官Michael Förtsch博士对此评论道:“光子计算的发展速度远快于CMOS技术。数字计算花了十年时间达到的成就,我们仅用光子技术一年就实现了。我们的第二代原生处理单元展示了这一转变发生的速度有多快,也说明了为何高效的光基计算将驱动下一波AI和HPC浪潮。”
第二代NPU的新特性
第二代NPU带来了多项重要提升。其增强的非线性处理核心引入了经过优化的增强型模拟单元,专为非线性网络模型设计,能显著减少参数数量和训练深度,同时提高图像学习、分类和物理模拟的准确性。
在系统集成方面,NPU 2以开箱即用的19英寸可机架安装服务器形式交付。这款名为原生处理服务器的设备包含多个第二代NPU,并通过PCIe以及C/C++/Python API与现有的CPU和GPU无缝集成,使得光子加速能够立即在HPC和数据中心环境中部署。
光子处理器:使计算机视觉更经济,AI模型更智能
在制造、物流和检测等实际应用场景中,光子处理器可以更高效地执行非线性神经网络。这使得视觉AI能够以更少的参数识别缺陷、跟踪物体和优化库存,从而显著降低能源成本,并使计算机视觉系统在经济上变得可行,甚至对于那些以前被认为计算量过大而无法运行的任务也是如此。
此外,光子处理器将加速下一代AI架构的发展,例如结合了统计推理与物理建模的混合模型。这将推动诸如药物发现、材料设计和自适应优化等领域的发展,这些领域同时需要处理非线性复杂性和实现极高的能效。
上市信息
搭载最新一代NPU 2处理器的Q.ANT服务器现已接受订购,客户发货时间为2026年上半年。每个系统均以开箱即用、适用于数据中心的标准服务器形式交付,可无缝集成到现有的HPC基础设施中。