清华大模型人才遭哄抢!盘点5大学术重镇10大产业玩家
扫一扫
分享文章到微信
扫一扫
关注99科技网微信公众号
量子位 | 公众号 QbitAI
做类ChatGPT产品,组中国版OpenaAI恐怕是先当下最最人尽皆知的创投野心。 有人官宣标榜放话,也有VC开始把视角投向产学研转换的大模型项目——或许能更有基础一些,其中, 清华大学 显然处于身负众望的头一梯队。 量子位独家获悉,背靠清华的大模型研究团队,计算机系教授 唐杰 牵头的创业公司 智谱AI ,身价水涨船高,在几近哄抢的状态中接近完成一轮新融资,估值已超 30亿元 。 唐杰的学生同样有市无价。其麾下知名弟子 杨植麟 的NLP创业公司 循环智能 ,也被寄予厚望,一切往大模型方向走,国内最头部的VC,孵化式提供支持。
唐杰师徒,清华NLP力量冰山一角唐杰,清华计算机系教授。他刚刚入选2023 AAAI Fellow,也是ACM/IEEE Fellow。研究方向包括人工智能、数据挖掘、社交网络、机器学习和知识图谱等,曾获ACM SIGKDD Test-of-Time Award (十年最佳论文) 。
△ 唐杰这次传闻中被多家VC哄抢的智谱AI,在2019年由他和同为清华教授的 李涓子 创立,由清华大学计算机系知识工程实验室的技术成果转化而来。 经唐杰手的大模型,都是这几年里大家的“老朋友”:超大规模预训练大模型 “悟道” (悟道2.0参数规模达到1.75万亿) ;2021年与阿里达摩院联合发布的中文多模态预训练大模型 M6 ;已经开源的中英文预训练语言大模型*GLM-130B。 相同参数规模下,M6训练能耗仅是GPT-3的1%;ChatgGPT需要8张A100才能跑起来,而GLM-130B仅用4张3090就能驱动。在大模型赛道上的既有产品和性能实绩,让唐杰团队被VC追逐、哄抢不足为奇。 VC手中的金橄榄枝,还抛给了唐杰的得意门生杨植麟。 杨植麟是谁?以年级第一的成绩从清华本科毕业后,他在NLP研究全球排名第一的卡内基梅隆大学语言技术研究所 (LTI) 就读,师从苹果AI研究负责人Ruslan Salakhutdinov和谷歌首席科学家William Cohen,4年即拿下博士学位。
△ 杨植麟博士期间,杨植麟和图灵奖得主Yoshua Bengio合作发布数据集HotpotQA,又先后以一作身份发表成果 Transformer-XL 和 XLNet ——这两篇分别是ACL 2019和NeurIPS 2019最高引论文之一。现在,他的谷歌学术引用次数突破16000次。 这位90后创业者不仅学术履历优秀,在产业界的表现也可圈可点。 2016年,杨植麟创立循环智能,公司主要业务是运用NLP、语音、多模态、大模型等人工智能技术打造“销售科技”方案。与此同时,智谱AI和清华研究团队的多个AI项目由他主导,华为的 “盘古” 大模型也是杨植麟团队和华为云联合推出的。 ChatGPT引爆狂潮,唐杨师徒二人成了VC眼中的香饽饽,但清华大模型NLP方向上的人才富矿不止他二人。 孙茂松、刘知远团队 算其中一股中坚力量,两人都来自清华自然语言处理与社会人文计算实验室 (THUNLP) 。THUNLP成立于上世纪70年代的实验室,牵头人是国内NLP研究领域的泰斗黄昌宁,孙茂松是黄的学生,刘知远则是孙的学生。
99科技网:http://www.99it.com.cn
