•  栏目 研究性论文

基于神经网络的计算机翻译优化研究

作者

  • 新加坡国立大学统计学院 , 新加坡

摘要

本研究聚焦神经机器翻译(NMT)系统在边缘设备部署时的高能耗难题,从软件层面提出一种集成动态架构剪枝的优化方案。通过在Transformer编码器中引入熵驱动的动态退出机制,结合混合精度参数分组策略,有效降低了系统能耗。在WMT2024中英数据集上,单句推理能耗降至3.1焦耳(减少34.8%),同时BLEU分数稳定在40.5±0.3(p < 0.05),为低资源场景下的实时翻译提供了软件层面的可行解决方案。

参考

Brown, P. F., Cocke, J., Della Pietra, et al. A statistical approach to machine translation[J]. Computational Linguistics,1990,16(2):79-85.

Duan, R., & Duan, X. Neural machine translation based on adaptive training and discarding mechanism[J].Computer Engineering,2023,49(10):24.

张笑燕,逄磊,杜晓峰,等。基于单语优先级采样自训练神经机器翻译的研究[J].通信学报,2024,45(4):65-72.

黄勃,李文超,刘进,等.探索ChatGPT模型能力:工业应用的前景和挑战[J].武汉大学学报(理学版),2024,70(03):267-280.

黄孟钦.基于双语词典的远距离语对无监督神经机器翻译方法[J].现代电子技术,2024,47(07):161-164.

刘欢,刘俊鹏,黄锴宇,等.面向低资源俄汉机器翻译的领域适应方法[J].厦门大学学报(自然科学版),2022,61(04):654-659.

作者简介

  • 新加坡国立大学统计学院 , 新加坡