ICC讯——光子芯片初创公司Q.ANT近日完成了A轮融资,使其总融资额达到8000万美元。同时,公司宣布与于利希超算中心(Jülich Supercomputing Centre)建立为期四年的合作伙伴关系,共同探索其技术的潜在应用。这家德国公司还发布了第二代芯片Q.ANT NPU 2以及更新的软件栈,支持在芯片上进行训练。
Q.ANT首席执行官Michael Förtsch向《EE Times》表示,公司并未专注于大语言模型推理加速,而是更关注下一代技术发展。他指出,尽管大量工作和资金已投入大语言模型的执行,但投资回报仍未显现。因此,Q.ANT将聚焦于图像、音频和视频网络等更复杂的神经网络架构,这些领域目前仍难以实现规模化。
技术路径:聚焦非线性计算与实时视频
Förtsch阐述了公司的愿景:通过第三代系统实现基于AI的实时视频流处理,以每秒100帧的速率对4K图像进行实时推理。他认为,这正是CMOS技术目前不足的领域,不仅在性能和计算密度上,在能耗方面也存在短板。
Q.ANT的芯片基于薄膜铌酸锂技术,具体采用600纳米厚的绝缘体上铌酸锂层。TFLN的非线性光学特性能够自然加速非线性数学运算,为数据中心节省能源。公司位于德国斯图加特微电子研究所的90纳米TFLN光子计算芯片生产线已于今年初投产。Förtsch表示,该生产线产出的第一代芯片及其服务器已在云端提供演示。
在本月的SC 2025会议上,Q.ANT演示了其第一代NPU运行Kolmogorov-Arnold网络与在CPU上运行的多层感知器(更接近主流AI)在学习图像和重建方面的对比。KAN的参数数量约为MLP的一半。在相同训练周期和类似时间范围内,运行频率为200 MHz的NPU比运行频率为2.4 GHz的CPU产生了更接近原始数据的图像。Förtsch强调,这一结果在多种图片测试中保持一致,因为公司能够利用非线性方程系统,以更少的参数描述模型,使最终结果更接近真实情况。
第二代芯片:性能提升与软件优化
Q.ANT的第二代芯片性能显著提升,从第一代的1 MOPS增至8 GOPS。但Förtsch谨慎指出,这些操作比乘累加运算更复杂,不能与标准深度学习加速器的性能数据直接比较。芯片时钟频率从200 MHz提高到2 GHz,NPU运行功耗约为150 W。
该芯片拥有八个独立通道(并行操作)。Förtsch表示,公司已测试更多通道的芯片,但光学部分受限于系统的数字部件,如存储器、ADC和DAC。选择八通道设计是基于生产线上足够的良品率和稳定的工艺考虑。
软件方面的工作使得单个CPU主机能够驱动八个Q.ANT PCIe卡(每卡一个加速器芯片)。公司的模型库包含内部开发的新算法和网络架构,以最大化利用Q.ANT硬件优势。Förtsch解释说,这是一套更智能的算法集,能够用更少数据获得相同甚至更好的结果。算法设计匹配处理器能力,重点关注正弦、余弦、卷积、傅里叶变换等在该处理器上表现强劲的基本函数,并根据NPU最强原语进行算法映射。
对于现有应用,Q.ANT的技术使傅里叶变换等函数可以直接作为原语推送到硬件执行,无需转换为更简单的数学形式。Förtsch认为,当前AI数学本质优美,但在处理器上的执行方式仍显粗暴,不够优雅。
合作与客户进展
Q.ANT与于利希研究中心旗下的于利希超算中心的新合作将探索光子计算的应用可能性及其与经典计算的集成。作为协议的一部分,JSC将购买一台Q.ANT服务器。
现有客户莱布尼茨超算中心已安装三台Q.ANT服务器,混合搭载第一代和第二代硬件。作为领先客户,LSC率先获得了支持Q.ANT芯片非线性数学运算的软件更新,目前正在对第二代芯片进行性能表征。配备公司第二代处理器的Q.ANT服务器预计将于2026年上半年发货。
原文:https://www.eetimes.com/q-ant-raises-series-a-debuts-second-gen-tfln-photonic-chip/