首页 跨境资讯 亚马逊开发最大的训练数据集文本语音模型

亚马逊开发最大的训练数据集文本语音模型

亚马逊人工智能研究团队一直以来都在研究文本转语音模型,该模型拥有最多的参数,且使用最大的训练数据集,像ChatGPT这样的“大型语言模型”凭借其智能回答问题和生成高级文本的能力而备受关注。然而,人工智能也在逐步融入其他主流应用领域。在这个新项目中,研究人员尝试通过增加参数数量和扩充训练数据集来提升文本转语音应用的能力。

据IT之家了解,这个名为“可扩展流式文本转语音模型”(BASE TTS)的新模型拥有 9.8 亿个参数,并使用 10 万小时的录音(来自公共网站)进行训练,其中大部分为英语语音。研究人员还向模型提供了其他语言的单词和短语示例,使其能够正确发音一些常见的表达,例如“au contraire” 和 “adios, amigo”。

亚马逊团队还测试了使用较小数据集的模型,希望能从中发现人工智能领域所说的“涌现能力”。这种能力是指人工智能应用,无论是大型语言模型还是文本转语音模型,突然突破到更高智能水平的现象。他们发现,对于文本转语音应用而言,这种飞跃发生在参数量达到 1.5 亿的中型数据集上。

研究人员还指出,这种飞跃涉及一系列语言属性,例如使用复合名词、表达情感、使用外语词、应用语音学和标点符号以及正确强调句子中的关键词等能力。

研究团队表示,出于对潜在滥用风险的担忧,BASE TTS 将不会向公众开放,他们计划将其作为学习应用,并期望将学到的知识应用于改善文本转语音应用的整体音质。

免责声明:文章内容不代表本站立场,本站不对其内容的真实性、完整性、准确性给予任何担保、暗示和承诺,仅供读者参考,文章版权归原作者所有。如本文内容影响到您的合法权益(内容、图片等),请及时联系本站,我们会及时删除处理。
为您推荐
跨境资讯
2月4日跨境快讯:Shopee启用巴西第16个配送中心 TikTok Shop泰国站将强制部分卖家启用双重验证
2月4日最新的跨境资讯,eBay发布2026年2月英德市场汽配高潜力清单、Shopee新加坡站收紧延迟发货率考核、Tik...
raksmart新春钜惠
RAKsmart新春钜惠来袭 32G美国服务器$49.9/月起 裸机云/物理机限时7折起 VPS年付6折 抽奖最高赢$200
本月即将迎来2026春节,RAKsmart此次推出了新春钜惠活动,活动期间针对物理服务器、裸机云服务器、VPS云服务器做...
跨境资讯
2月3日跨境快讯:亚马逊欧盟包装新规倒计时6个月 Lazada马来西亚跨境站2月5日起调整佣金费率
2月3日最新的跨境资讯,亚马逊欧盟包装新规倒计时6个月、特朗普威胁对加拿大全面加征100%关税、Lazada马来西亚跨境...
极目数据会员新春特惠 全场8折促销+加赠30天 助您开年大卖
假期从不是业务的“暂停键”,而是布局新一年、抢占市场先机的“黄金期”!值此2026年春节来临、假期将至之际,极目数据特别...
西柚找词新春活动
西柚找词马年新春活动 购买任意套餐加赠14天会员时长
马年来临,为了让大家安心迎马年,时间不浪费,即日起西柚找词推出了「马年新春购活动」。活动期间购买西柚找词任意套餐,可额外...
返回顶部
科灯导航