关注我们
QRcode 邮件联系 新浪微博
首页 > 财商 » 正文

字节大语言模型研发技术专家杨红霞离职创业

 小新新
5月24日消息,据36氪,从多个独立信源处获悉,字节跳动大语言模型研发技术专家杨红霞已于近日从字节跳动离职,并开始筹备AI创业项目。截至发稿前,字节跳动并未回应上述消息。公开资料显示,杨红霞毕业于南开大学、杜克大学统计科学系,师从著名统计学家David Dunson。她在人工智能领域国际会议、顶级期刊有近百篇顶级论文。

format-jpg

图源:36氪

2023年,阿里M6大模型的前带头人杨红霞加入字节AI Lab(人工智能实验室),参与语言生成大模型的研发。此前,杨红霞曾是阿里达摩院超大规模多模态预训练模型M6的技术负责人。2022年9月,杨红霞因个人家庭原因离开了达摩院。

据了解,杨红霞曾带领M6大模型从百亿级进化到千亿、再到万亿的参数量,并且主导认知智能技术的发展和场景落地。2021年3月,M6大模型首次发布,到2021年底阿里云发布M6最新进展时,其参数已至10万亿,成为当时全球最大的AI预训练模型。

加入字节后,杨红霞进入字节AML(Applied Machine Learning,机器学习系统)团队,汇报给字节跳动AML和豆包大模型Foundation团队负责人项亮,在美国西雅图带队大语言模型的研发。

format-jpg

图源:AI TIME 论道公众号

值得一提的是,近日,字节跳动在2024春季火山引擎Force原动力大会上宣布,字节豆包大模型正式开启对外服务。豆包大模型目前包含豆包通用模型Pro、豆包通用模型liti、豆包·角色扮演模型、豆包·语音合成模型、豆包·声音复刻模型、豆包·语音识别模型、豆包·文生图模型、豆包·Function Call模型。

字节产品和战略副总裁朱骏同时宣布,豆包APP总下载量已达1亿次,将正式开启付费商业化模式,提供更多高级功能和服务。

价格方面,火山引擎总裁谭待表示,豆包APP的价格相比同行便宜99.3%,在企业市场的定价0.0008元/千Tokens,仅需0.8厘就能处理1500多个汉字。大模型的“token”是指在自然语言处理任务中,模型所使用的输入数据的最小单元,这些token可以是单词、子词或字符等。

format-jpg

图源:新浪科技

本文标签:
一季度营收翻倍增长,拼多多成为最大赢家
视频号小店广告链路全新上线