您的位置:创新中国网 > 新闻

“译”语知洲争做多模态语料垂类模型首创先锋

发布时间:2024年06月24日 16:30 来源:中国日报网 编辑:赵奢   阅读量:5345   会员投稿
导读:“译”语知洲争做多模态语料垂类模型首创先锋国务院发布的《关于推动外贸保稳提质的意见》中明确要求跨境电商企业应用足用好新技术,推动跨境电商加快发展提质增效。随着全球化进程的加快和web3.0时代的到来,跨境商贸活动日益频繁,对高质量小语种翻译...

“译”语知洲争做多模态语料垂类模型首创先锋

国务院发布的《关于推动外贸保稳提质的意见》中明确要求跨境电商企业应用足用好新技术,推动跨境电商加快发展提质增效。随着全球化进程的加快和web3.0时代的到来,跨境商贸活动日益频繁,对高质量小语种翻译需求也随之增加。然而,市场上缺乏精确性和针对性的语言资源服务,限制了商贸活动的高效开展。另一方面,2024年全国两会上提出开展“人工智能+”行动引爆新质生产力革命。如何利用尖端技术,填补商贸领域高质量小语种数据的重大需求,成为企业推动全球运营并进行数字化转型的关键。

“译”语知洲争做多模态语料垂类模型首创先锋

在此背景下,北京外国语大学的仇浩杰和胡然带领团队首创性地提出了全球首个跨境商贸智能语料库调用模型的想法,通过整合公开及专有数据,设计并搭建将文本语料与图片、音频、视频一一映射的多模态语料库,提供异常高级别的语言精确性,填补了商贸领域高质量小语种数据和服务的空白。

“译”语知洲团队运用独特的数据获取和高精度的处理方式,对不同语种的实施差异化的数据管理,利用人机协同模式进行数据分析与标注,保证语料库的高价值及数据的可靠性和应用的高效性。另外,团队还应用先进的人工智能算法设计和语言学脑机接口技术开发了一种基于句法和语法学原理的树状图算法,使智能语言模型更符合人类认知习惯,为用户提供高质高量的语言服务体验。多模态语料库的开发极大丰富了语料库的应用,使其能处理分析跨媒体的语言信息,为与数字人等新一代数字技术的融合提供坚实的数据基础和技术支撑。

“译”语知洲争做多模态语料垂类模型首创先锋

项目负责人仇浩杰来自北京外国语大学亚洲学院。越南语的专业背景使他在心中种下搭建非通用语语料库并将其落地应用的种子。拥有扎实语言功底和对语言学、人工智能技术有浓厚兴趣的他了解到商贸领域高质量小语种数据服务的市场痛点后,决心深耕多模态语料库的搭建,最终将这个项目带到了公众面前。项目的另一位核心人员胡然则充分利用其国际经济与贸易的专业知识,为项目的产品设计、市场拓展和商业化提供了重要支持。从语言学习者到全国乃至全世界首个跨境商贸智能语料库调用模型的开创者,变的是身份,不变的是他们深耕热爱并为社会做贡献的决心。

“译”语知洲争做多模态语料垂类模型首创先锋

在项目过程中,仇浩杰与胡然等项目伙伴进行了多次线下会议与讨论,在一次一次的打磨中将项目的细节不断优化,在一次一次的讨论中不断完善项目,力求完美。同时他深入学习语言训练材料的清洗、筛选、标注以及算法设计的相关知识,申请国家实用新型专利3项,软件著作权3项,增添项目科技硬实力。项目组积极与各大企业合作,广泛征求意见和建议,确保产品能够真正满足市场需求。

“译”语知洲争做多模态语料垂类模型首创先锋

商贸领域对高质量小语种数据的需求大,市场痛点多,急需注入新的活力以解决实际问题。在数字技术和计算语言学的垂类融合突破下,“译”语知洲项目深耕人工智能+新文科沃土,以青年之力从语言、贸易和技术三个方面,积极响应国家“十四五”规划号召,为全球通讯提供了关键资产,推动了相关产业的发展,极大地解决了非通用语种领域的就业挑战,做商贸领域的通讯新星。

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

相关内容

专题报道