记者7日从清华大学获悉,该校电子系方璐教授课题组与自动化系戴琼海教授课题组在智能光芯片领域取得重大进展。他们首创全前向智能光计算训练架构,研制出“太极-Ⅱ”光芯片,实现了大规模神经网络的原位光训练,为人工智能(AI)大模型探索了光训练的新路径。相关成果在线发表于最新一期国际学术期刊《自然》。
AI大模型的迅猛发展和广泛应用,使算力成为关键的战略资源。智能光计算凭借高算力、低能耗的优势,在后摩尔时代展现出巨大潜力。训练和推理,是AI大模型核心能力的两大基石。此前,智能光芯片“太极”的问世,为大规模复杂任务的“推理”带来了曙光,但未能释放光计算的“训练之能”。现有光神经网络的训练严重依赖GPU离线建模,并要求高度匹配的前向-反向传播模型。这对光计算系统的精准对齐提出苛刻要求,致使梯度计算难、训练规模小,禁锢了光计算的优势。
“与现有训练范式不同,我们摒弃了反向传播,另辟蹊径,构建了光神经网络的对称传播模型,仅用光学系统的前向传播即可实现高效高精度光训练。”方璐告诉科技日报记者。
据介绍,“太极-Ⅱ”的面世,填补了智能光计算在大规模神经网络训练这一核心领域的空白。除了加速AI模型训练外,其还在高性能智能成像、高效解析拓扑光子系统等方面表现出卓越性能,为人工智能大模型、通用人工智能、复杂智能系统的高效精准训练开辟了新路径。
商业观察网-《商业观察》杂志社官网版权与免责声明:
① 凡本网注明“来源:商业观察网或《商业观察》杂志”的所有作品,版权均属于商业观察网,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:商业观察网”。违反上述声明者,本网将追究其相关法律责任。
② 凡本网注明“来源:XXX(非商业观察网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
③ 如因作品内容、版权和其它问题需要同本网联系的,请在30日内进行。
相关文章