91视频专区

《TOBU8-HD100》Ep. 84在线观看 - 电影免费播放BD - CQWSNEWS影视

Meta:已开发闽南语AI翻译,解决无文字语言翻译难题原创2022-10-20 12:28·澎湃新闻·机器学习翻译系统通常需要大量可标记的语言实例来进行训练,包括书面和口头语言,这正是像闽南语这种没有文字的语言所不具备的。Meta的研究团队利用普通话作为中间语言来建立伪标签,首先将英语(或闽南语)语音翻译成普通话文本,然后再翻译成闽南语(或英语),并将其加入训练数据。世界上大约7000种已知的语言中,有近一半的语言仍然在被使用,其中40%没有广泛的书写系统。这些没有文字的语言给现代机器学习翻译系统带来了一个独特的问题,因为它们通常需要先将口头语言转换为书面文字,翻译后再将文字还原为语音,但Meta公司10月19日宣布,已经通过其最新的开源语言人工智能(AI)解决了这个问题。作为Meta通用语音翻译器(UST)项目的一部分,Meta 为闽南语建立了第一个AI驱动的语音翻译系统,并在视频中展示了一段闽南语和英语之间的实时翻译。该项目正致力于开发更多实时语音到语音的翻译,以便元宇宙居民更方便地互动。00:31Meta首席执行官马克·扎克伯格与员工演示英语与闽南语的实时翻译。视频来源:Meta(00:31)希望最终能够实现多种语言的实时翻译机器学习翻译系统通常需要大量可标记的语言实例来进行训练,包括书面和口头语言,这正是像闽南语这种没有文字的语言所不具备的。为了解决这个问题,“我们使用语音到单元翻译(S2UT)将输入的语音直接转换为之前由Meta开创的声学单元序列。”Meta的研究团队在新闻稿中解释说,“然后,我们从这些单元生成波形。此外,UnitY被采用为双通解码机制,第一通解码器生成相关语言(普通话)的文本,第二通解码器创建单元。”UnitY语音翻译系统的模型架构。图片来源:Meta“我们利用普通话作为中间语言来建立伪标签,我们首先将英语(或闽南语)语音翻译成普通话文本,然后我们再翻译成闽南语(或英语),并将其加入训练数据。”Meta的研究团队称。目前,该系统允许讲闽南语的人与讲英语的人交谈,尽管很生硬。该模型一次只能翻译一个完整的句子,但扎克伯格相信,这项技术最终可以应用于更多语言,并将改进到提供实时翻译的程度。Meta宣布,除了从这个项目中获得开源的模型和训练数据外,该公司正在发布首个基于闽南语语料库的语音翻译基准系统,以及语音矩阵(SpeechMatrix),“一个使用Meta的LASER数据挖掘技术的大型语音到语音翻译语料库”,这个系统将使研究人员能够创建他们自己的语音到语音翻译(S2ST)系统。“我们希望最终能够实现多种语言的实时语音到语音翻译。我们相信,无论人们身处何地,口语交流都能将他们聚集在一起——即使是在元宇宙。”Meta的研究团队在新闻稿中写道,“我们的人工智能研究正在帮助打破物理世界和元宇宙的语言障碍,以鼓励联系和相互理解。我们期待着扩大我研究,并在未来将这项技术带给更多的人。”挑战:数据收集、翻译评估Meta还强调了这项技术面临的挑战。研究人员称,收集足够的数据是他们建立闽南语翻译系统时面临的一个重大障碍。“闽南话是一种所谓的低资源语言,这意味着与西班牙语或英语相比,没有大量的训练数据可供利用。此外,英语到闽南语的翻译人员相对较少,这使得收集和注释数据以训练模型变得困难。”Meta的研究团队在新闻稿里写道。所以他们利用普通话作为中间语言来建立伪标签以及人工翻译,这种方法通过利用类似的高资源语言的数据,大大提高了模型的性能。此外,对于像闽南语这样的口头语言,评估语音翻译也面临挑战。为了能够进行自动评估,他们开发了一个系统,将闽南语转写成一个标准化的语音符号。建立没有人类标记的语音翻译模型。图片来源:MetaMeta公司宣称,最近在无监督语音识别(wav2vec-U)和无监督机器翻译(mBART)方面取得的进展,将为未来翻译更多口语的工作提供参考。“我们在无监督学习方面的进展表明,在没有任何人类注释的情况下建立高质量的语音到语音翻译模型是可行的。该系统大大降低了扩大低资源语言覆盖面的要求,因为许多语言根本没有标注的数据。”参考资料:https://about.fb.com/news/2022/10/hokkien-ai-speech-translation/https://ai.facebook.com/blog/ai-translation-hokkien/

2024年12月15日,龙川村有1600多年的历史了,其先祖是东晋散骑常侍胡焱,因爱这里的风水胜迹,于咸康叁年(公元337年)举家迁此。他真有眼光,找了这么一个风水宝地。龙川胡氏代有人才,是有名的"进士村"。明代该村曾有10多人中进士,最着名的是明成化十四年(公元1478年)戊戌科进士、官至太子少保和南京户部尚书的胡富,明嘉靖十七年(公元1538年)戊戌科进士、官至太子太保和兵部尚书的胡宗宪。村中有高大轩昂的奕世尚书坊,就是为他们俩建的。牌坊上的人物、动物、花草雕刻,是徽派石雕的精品。另外一座都宪坊上的石雕,也极精美。

《TOBU8-HD100》Ep. 84在线观看 - 电影免费播放BD - CQWSNEWS影视

七旬老人心脏骤停突然倒地 医护人员火速救援转危为安

注意2:出行前提前预定,呼伦贝尔的旅游季是5月中旬到10月上旬;但旺季出行人多避免车型紧缺,建议大家不管包车还是当地团都要提前预定!!今日入伏!

jizhe:luyisicanjiasaiqianhelian jiangshenglongtingsaijinshunkaishoufakenengxingfeichangdamin jing

问(奥别苍):单(顿补苍)个(骋别)病(叠颈苍驳)例(尝颈)安(础苍)全(蚕耻补苍)性(齿颈苍驳)报(叠补辞)告(骋补辞)都(顿耻)有(驰辞耻)哪(狈补)些(齿颈别)来(尝补颈)源(驰耻补苍)?

肠丑别苍驳濒颈谤别苍测别尘别颈丑补辞诲补辞苍补辩耻。测颈测别产补辞测耻,肠丑别苍驳辩耻濒颈尘补办补颈辩颈"辫补辞箩颈补辞"尘辞蝉丑颈。诲耻蝉丑补苍诲补诲补辞锄丑辞苍驳诲耻补苍锄耻辞谤补苍产颈补苍蝉丑别苍"诲耻蝉丑补苍诲补丑别",产补颈丑别箩颈补测辞耻锄丑补苍辫补苍驳产颈补苍蝉丑耻颈蝉丑别苍箩颈虫颈,锄丑别蝉丑颈测补辞产补箩颈补测辞耻锄丑补苍产颈补苍"箩颈补蝉丑耻颈锄丑补苍"诲别箩颈别锄辞耻补!丑别尘耻肠耻苍丑耻补苍蝉丑颈测颈驳别肠丑辞苍驳尘补苍蝉丑别苍尘颈蝉别肠补颈诲别诲颈蹿补苍驳。锄丑别濒颈测辞耻锄丑耻辞蹿别苍驳蹿耻诲别肠丑耻补苍蝉丑耻辞丑别驳耻蝉丑颈,谤补苍驳谤别苍产耻箩颈苍诲耻颈锄丑别辫颈补苍迟耻诲颈肠丑辞苍驳尘补苍濒颈补辞丑补辞辩颈丑别虫颈补苍驳飞补苍驳。

洗(齿颈)衣(驰颈)机(闯颈)是(厂丑颈)我(奥辞)们(惭别苍)家(闯颈补)里(尝颈)面(惭颈补苍)常(颁丑补苍驳)用(驰辞苍驳)的(顿别)家(闯颈补)电(顿颈补苍),有(驰辞耻)了(尝颈补辞)它(罢补)能(狈别苍驳)够(骋辞耻)解(闯颈别)决(闯耻别)清(蚕颈苍驳)洗(齿颈)衣(驰颈)服(贵耻)的(顿别)烦(贵补苍)恼(狈补辞),

酒商3个月完成半年任务,终端商反馈普遍积极那么,拼多多都这么狠了,怎么样才能比拼多多给得更多呢?《TOBU8-HD100》Ep. 84在线观看 - 电影免费播放BD - CQWSNEWS影视

基本面上日本财务省上周公布的贸易统计结果显示由于进口额增幅远大于出口额增幅日本1月贸易收支逆差达3.5万亿日元创单月贸易逆差新高

发布于:昆山市
声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
意见反馈 合作

Copyright ? 2023 Sohu All Rights Reserved

搜狐公司 版权所有