4月13日,日本大阪·关西世博会开幕,主题为“构想焕发生机的未来社会”。中国AI大模型首秀世博舞台,科大讯飞依托国产自主可控讯飞星火大模型,打造了支持中、日、英三语实时交互的人工智能大模型展项“AI孙悟空”,融合多语种、高噪场景语音识别、多情感超拟人语音合成及多模态交互等技术能力,为游客提供幽默问答和智慧导览,成为中国馆唯一大模型展项。
▲现场日语对话展示。企业供图
“悟空,你好!”打招呼间,身穿西瓜裙、手拿金箍棒的“AI孙悟空”腾云驾雾现身于水墨云海中,以动画《大闹天宫》高还原声线说道:“俺老孙来也!”
当日本观众抛出:“即将去中国旅游,你有什么美食推荐”问题时,“AI孙悟空”挠头笑道:“北京烤鸭薄如蝉翼,四川火锅辣似老君炉,江南小笼包汤汁烫舌,山西刀削面耍得比俺金箍棒还溜!记得去地道的老字号品尝品尝!”
该展项由上影元联合共创,由科大讯飞对上海美术电影制片厂在上世纪60年代创作的经典动画《大闹天宫》中的孙悟空形象进行技术化赋能与重构,通过形象建模、语音合成、唇形预测、图像处理等AI核心技术,让领先的技术与经典动画形象结合。
此外,讯飞智作也为大阪世博会中国馆导览耳机提供了语音技术支持。该导览耳机集成领先的多语种语音合成技术,可为参观者提供多种男声、女声音色选择,及中文、英语、日语三语种实时切换的沉浸式讲解服务。
“能以‘中国芯’走向‘世界窗’,成为中国馆唯一大模型展项,科大讯飞靠的是自主可控的AI硬实力。”科大讯飞东北亚研究院院长孙庆华介绍。去年10月,讯飞星火4.0 Turbo发布,根据测试,七项核心能力在中文领域全面超过GPT-4 Turbo,代码能力和数学能力超越GPT-4o。今年1月,业界首个基于全国产算力平台训练的深度推理大模型讯飞星火X1发布。3月,讯飞星火X1实现再升级,数学能力全面对标DeepSeek R1和OpenAI o1,在中文数学各项任务中均实现领先,近期还将再次升级。
支撑“AI孙悟空”的星火多语种大模型,目前已实现支持除中文、英语外的8个语种,包含日语、阿拉伯语、俄语、西班牙语、法语、葡萄牙语、德语及韩语,最新版本在M-MMLU、XStoryCloze、MGSM、FLORES等十多项国际权威多语种相关开源榜单测试中,能力平均值超越最新的GPT-4o和DeepSeek V3、R1,目前已在汽车、家电、办公、翻译等领域应用。
4月17日,科大讯飞将在大阪世博会中国馆举办讯飞双屏翻译机2.0新品发布会,展示讯飞双屏翻译机2.0的创新功能与应用场景,解决用户在嘈杂环境下实时翻译问题。