每日经济新闻 10-25
发力语音交互,月之暗面纳入前微软强将 AI玩家中谁将组成大模型“最强战队”?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

前沿技术的比拼中,人才极为重要。

10 月 24 日,《每日经济新闻》记者从 " 月之暗面 " 公司方面证实,业界顶尖的语音技术专家——微软亚洲研究院前首席研究经理谭旭已正式加入月之暗面,将和团队一起为 Kimi 用户研发更加先进和好用的智能助手。

图片来源:视频截图

《每日经济新闻》记者也注意到,Kimi 近日开启了语音通话功能的灰度测试。与之对应的是,月之暗面多次对外表态坚定追逐多模态,例如在今年 5 月的第五届上海创新创业青年 50 人论坛上,月之暗面创始人杨植麟表示,多模态是公司当前持续的重点投入方向。

在技术飞速更新迭代的大模型领域里,人才密度往往是公司模型、产品能否跟上脚步、进而领先竞争对手的关键因素。

" 最重要的本质还是人。" 英诺天使基金合伙人王晟曾在接受《每日经济新闻》记者采访时曾表示,投资 AI 早期项目时,考察重点在于团队," 在(创业)方向基本一致时,投资人觉得最重要的就是团队因素 "。

招聘市场上的波动则更为直观地反映出大模型人才争夺战的激烈程度。脉脉人才智库的数据显示,随着 ChatGPT 声名大噪,2023 年 3 月,大模型岗位招聘指数(该数据越大,说明招聘岗位量越高)达到 2023 年以来的峰值,为 87.15。

与此同时,头部科技公司、互联网大厂和明星独角兽之间的人才流动没有一刻不在持续着。对于这群最先踏入新时代的 AI 玩家来说,谁都想集结一支 " 最强战队 ",去实现更多未知的可能性。

发力语音交互,月之暗面麾下再添一员大将

两篇关于 "Transformer-XL" 与 "XLNet" 重要论文的第一作者、中国 35 岁以下 NLP(自然语言处理)领域引用量最高的研究者——类似的诸多头衔让杨植麟的第二次创业在一开始就颇受业内关注。

2023 年 6 月,月之暗面刚成立不久,就完成了超 2 亿美元(约合人民币 14.2 亿元)的天使轮融资,投后估值约为 3 亿美元(约合人民币 21.4 亿元)。最新的一笔融资在今年 8 月,月之暗面获超 3 亿美元融资,此轮融资也将月之暗面的估值推到了 33 亿美元(约合人民币 235.0 亿元)的高位。

图片来源:网页截图

人才随着资金弹药一起涌来。10 月 24 日,《每日经济新闻》记者从月之暗面方面了解到,微软亚洲研究院前首席研究经理谭旭已正式加入月之暗面,据介绍,他 " 主要是帮助 Kimi 打造更自然、更流畅的语音交互体验 "。

公开资料显示,谭旭研究领域为深度学习、语言 / 语音 / 音乐处理以及 AI 内容生成,在 AI 学术会议发表论文 100 余篇,出版学术专著《神经语音合成》。

他开发的机器翻译系统在中英翻译上达到人类水平,并在 WMT 机器翻译比赛中获得多项冠军。同时,谭旭的研究成果也在 Azure、Bing 等微软重要产品中得以应用。

同时,《每日经济新闻》记者注意到,Kimi 在语音功能上也有了新的进展,现已开启语音通话功能的灰度测试。对此,月之暗面方面向记者表示,除了常规的对话之外,目前该功能还提供英语陪练和模拟面试两个专门的对话场景。

实测 Kimi、豆包和通义千问的语音功能后,《每日经济新闻》记者发现,目前 Kimi 的语调、语音内容自然且口语化,但它是三者中唯一需要使用者手动打断对话的产品,其余两款产品均可实现智能打断。

" 智能打断和方言、口音辨别都是在语音模型里比较难训练的能力。" 一位大模型技术人员向《每日经济新闻》记者表示,除了单独训练一个辅助实现打断功能的模型,有端到端能力的模型可以压缩响应时间,实现实时语音打断。

在今年 5 月的 OpenAI 春季发布会上,新发布的 GPT-4o 展示了其更为流畅、自然和智能的语音交互功能。在带来更新体验的背后,是 GPT-4o 通过端到端训练了一个全新的模型,能够同时处理文本、视觉和音频输入输出。

大模型人才争夺战进行时,谁能组成 " 最强战队 "?

这是一个极度渴望人才的行业,人等同于战斗力。于是,头部科技公司、互联网大厂和明星独角兽之间的人才流动在大模型业内屡见不鲜。

这一点从多个创业公司创始人的履历中便可窥见一二。例如,"AI 六小龙 " 之一的 MiniMax 公司的创始人闫俊杰,曾担任商汤科技副总裁,阶跃星辰创始人姜大昕曾是微软全球副总裁、微软亚洲互联网工程研究院的首席科学家。

此外,类似谷歌 "TensorFlow" 平台前核心创始成员潘欣去年加入 " 零一万物 " 公司担任首席架构师、阿里通义千问大模型技术负责人周畅离职,这样的成熟技术人才的就职变动也是业内 " 寻常事 "。

《每日经济新闻》记者从字节跳动内部人士处确认,原零一万物核心成员黄文灏在今年 8 月加入 "Seed" 团队,汇报对象为大模型团队负责人朱文佳。

对此,零一万物回应《每日经济新闻》记者表示,黄文灝离职是因有其他追求。" 近期,有多位负责模型训练、多模态和产品的,(具备)国际顶尖大厂履历的高阶负责人加入零一万物,已经履职数月,为零一万物的模型和产品的持续迭代升级和商业化探索注入新动能。" 零一万物方面介绍。

招聘市场上的数据也印证了各大企业对大模型人才的争夺日趋激烈。脉脉人才智库的数据显示,ChatGPT 的走红迅速引发了国内市场的 " 抢人大战 ",2023 年 3 月,大模型岗位招聘指数达到 2023 年以来的峰值。其中,技术人才最为炙手可热。2024 年 1 月~7 月,大模型领域热招岗位的前 10 位中有 9 个为技术岗位,算法工程师是新发岗位量最多的。

各大团队都以高薪向高学历技术人才伸出橄榄枝。脉脉人才智库的数据显示,在大模型领域的人才招聘中,要求硕士及博士学位的岗位占比达 29.66%,显著高于新经济行业平均水平的 11.28%;据 2024 年 1 月— 7 月的数据,大模型领域算法相关岗位平均月薪超 6.75 万元,位居高薪岗位第一。

今年 7 月,字节跳动面向 2024 年 9 月至 2025 年 8 月毕业的博士群体开启了 " 筋斗云人才计划 ",这是继 "Top Seed 人才计划 " 后另一 AI 人才专项招聘计划;腾讯、百度等互联网巨头也开启了大模型技术人才专项招聘计划。

根据脉脉人才智库的调研,在 2024 年 1 月— 7 月,大模型新发岗位量最高的 10 家企业中,字节跳动位列第一。字节跳动招聘官方公众号在 10 月 22 日发布报告称,2025 届校招中,报录比最高的前两个岗位分别是大模型技术专家和 AI 算法工程师(如下图)。

图片来源:微信文章截图

一位业内人士向《每日经济新闻》记者透露,目前月之暗面的规模还不足 200 人," 感觉大家还是在抢人才(的阶段)"。古语有 " 兵在精不在多 ",相信在大模型领域里,无论是月之暗面这样的创业公司还是字节这样的互联网巨头,现在都对拥有更多的精兵强将野心勃勃。

每日经济新闻

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

ai 语音交互 微软 融资 kimi
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论