☰

字節大模型關鍵8人首次曝光！中科大北航清華校友，還透露下一步

字節大模型團隊，終於曝光！

這不是，字節剛剛啓動大模型校招計劃，招攬人才嘛——

計劃取名Top Seed，薪資TOP級別、算力數據管夠，但僅面向應屆博士生；前沿課題覆蓋大模型、圖像&視頻生成、機器學習算法和系統以及音頻生成和理解等方向。

另外還有一幫頂尖的技術導師團帶隊……等等，這不就是字節豆包大模型的背後團隊嗎？

來自中科大、北航、西安交大等高校校友領銜的“關鍵8人”，這就公開亮相了！該說不說，字節搶人的決心看出來了。

我們也淺淺扒拉了一下。

字節大模型關鍵8人曝光

馮佳時：豆包大模型視覺基礎團隊負責人

馮佳時，2019年加入字節，專注於計算機視覺、機器學習領域的相關研究及其在多媒體中的應用。

△圖源：字節跳動官方

2023年12月，新加坡國立大學的Show Lab聯合字節跳動發佈了一款視頻模型MagicAnimate，就是那個僅需1張圖就能讓人物跳舞的模型。

這個一經發布便火爆開源社區的項目，字節跳動有5名研究人員參與，其中就有馮佳時。

他於2007年本科畢業於中國科學技術大學，碩士畢業於中國科學院自動化研究所，博士畢業於新加坡國立大學。

而且他曾任新加坡國立大學電子與計算機工程系助理教授，是機器學習與視覺實驗室負責人。

此外，他發表了400多篇關於深度學習、物體識別、生成模型、機器學習理論方面的論文。曾獲得ACM MM 2012最佳技術演示獎、TASK-CV ICCV 2015最佳論文獎、ACM MM 2018最佳學生論文獎。

他還曾擔任CVPR、 NeurIPS、ICML、ICLR的領域主席以及ICMR 2017的程序主席。

在加入字節後，他負責着智能內容創作部門基礎研究團隊。

項亮：AML和豆包大模型Foundation負責人

項亮，2016年加入字節，其所在的AML團隊，爲火山引擎的智能推薦技術服務提供了全力支持。

他於2006年畢業於中國科學技術大學電子工程與信息科學系，並榮獲該校本科生最高榮譽獎——郭沫若獎學金。

隨後保送至中國科學院自動化所，並在楊青研究員的指導下攻讀工學博士學位。

2009年，他在讀博期間參與了網飛發起的百萬美金挑戰賽，研究電影推薦系統算法。

參賽者包括來自186個國家的計算機科學家、專家、學者等組成的數萬支隊伍。

而項亮所在的團隊（The Ensemble）在公開測試排名中名列第一，並最終獲得團體第二名。（比賽的最終結果由公開測試和隱藏測試兩部分組成）

同年，他還發起創建了Resys China推薦系統社區。

畢業後，他曾任職於Hulu和宜信公司，從事視頻推薦系統的研究和開發工作。

他還曾任瓜子二手車首席科學家。

值得一提的是，他也是《推薦系統實踐》一書的作者，該書廣爲人知，是推薦系統領域的入門書籍。

王明軒：豆包大語言模型模型研究團隊負責人

王明軒，關注模型的超級對齊、可解釋性、合成數據等關鍵方向研究。

他本科畢業於北京航空航天大學，博士畢業於中國科學院計算技術研究所。

他在2018年加入騰訊擔任高級研究員，並於2019年加入字節跳動。

在字節跳動，他擔任機器翻譯業務負責人和算法科學家，主導研發了火山翻譯系統，服務全球過億用戶。

他還在機器翻譯領域發表了超過50篇頂級會議論文，包括ACL、EMNLP等。

值得一提的是，他曾多次帶領團隊在WMT機器翻譯評測中拿到冠軍。

田值：豆包大模型視覺生成模型技術專家

田值去年才加入字節。2016年，四川大學的大四學生田值，以一作身份在頂會ECCV上發表了一篇文章。在那個時候，很少有本科生能夠在這種級別的頂會上發表論文。

在中科院深圳先進技術研究院(SIAT)交流實習兩年後，田值進入澳大利亞阿德萊德大學攻讀博士學位，師從沈春華教授。他的主要研究方向是實例識別，包括目標檢測和實例分割。

2019-2020這兩年，田值在上述三大頂會上發表十多篇論文，其中5篇爲一作。其中一些文章已經成爲業內流行的算法，比如目標檢測算法FCOS和文字檢測算法CTPN。

王雨軒：豆包大模型語音部門負責人

王雨軒，2018年從Google加入字節跳動。

△圖源：字節跳動官方

他本科畢業於北京航空航天大學，後攻讀北京大學研究生，並擁有美國俄亥俄州立大學博士學位。

在谷歌工作期間，他曾和其他人提出了一種新的端到端語音合成系統Tacotron。

該模型可接收字符的輸入，輸出相應的原始頻譜圖，然後將其提供給Griffin-Lim重建算法直接生成語音。

在相關論文中，他們闡述了該系統相較於DeepMind的WaveNet在架構方面的優勢。

而且通過公開資料，字節在去年申請的一項專利中也有他的身影。

該專利主要涉及一種聲源分離方法、神經網絡的模型訓練方法、聲源分離裝置、神經網絡的模型訓練裝置和存儲介質。

陳卓：豆包大模型音頻生成研究團隊負責人

陳卓2010年本科畢業於西安交大電子工程專業，隨後前往哥倫比亞大學攻讀碩士和博士學位。

博士期間，他就對機器學習算法及其語音增強和分離、自然語音識別等應用感興趣。谷歌學術被引數9000+，曾發表100多篇研究論文和專利。

在去年加入字節之前，曾在微軟工作了6年7個月。2022年，在由中國計算機學會等主辦的語音技術研討會上，陳卓發表了《實時多人語音會話的語音識別》的公開演講。

在這次大會上，他介紹了利用大規模自監督學習和端到端系統來解決實時多人會話識別問題的進展。

嚴林：豆包大語言模型Alignment團隊負責人

嚴林，碩士畢業於中科院計算所。他所在團隊關注指令微調、獎勵模型、RLHF、RLAIF、自學習模型等關鍵方向研究。

同時，在大模型泛化、可解釋性和真實性等關鍵方向做前沿研究。

△圖源：字節跳動官方

此前豆包曝光其背後公司的法定代表人也是嚴林，當時就職於字節跳動搜索團隊。

去年2月36氪曾透露，字節從語言和圖像兩方面發力大模型佈局，語言大模型團隊由字節跳動搜索部門牽頭，圖片大模型團隊由產品研發與工程架構部下屬的智能創作團隊牽頭。

李成剛：豆包大語言模型預訓練方向負責人

李成剛，清華大學機械工程本碩學位。

他先後擔任今日頭條網頁搜索和TikTok視頻搜索技術負責人，從0到1研發出了字節跳動的搜索系統，在ranking架構和算法、多語言和多模態相關性領域有較大的創新和突破，在中文搜索體驗上做到了領先水平。

目前擔任字節跳動頭條大語言模型預訓練方向負責人，研究領域包括數據的清洗、合成、配比，關聯學習與課程學習，訓練算法與scaling capability等。

面向博士生的Top Seed計劃

而這些關鍵團隊成員曝光，核心目的只有三件事：

招人，招人，還是招人。

字節正式開通了面向應屆畢業生的招聘通道：

取名Top Seed，面向今年8月到明年8月畢業的博士生。

要求主要兩個方面。

一是態度上要熱愛與積極：懷有科技改變世界的遠大抱負、敢於創新；有志於投身機器學習、人工智能、大模型、計算機視覺、音視頻生成等技術領域；

二要相關領域表現出色，比如學術研究、工程實踐、開源社區等。

而一旦成功入圍Top Seed計劃，除了有以上的導師團隊，前沿課題主要覆蓋這些：

大模型：探索大模型訓練方法；

圖像&視頻的理解和生成：視頻生成模型、世界模型的構建和能力提升；

機器學習算法和系統：大規模分佈式訓練系統的性能優化；

音頻生成和理解：探索統一的音頻生成基座大模型。

好了豆包接下來多模態方向、音頻生成方向也沒跑了。

而且特別強調：他們算力數據十分充足，薪資和回報TOP級別。

辦公地點除了北上杭深外，還有新加坡、聖何塞等地方。

字節這一波吸引人才，十分到位了。

字節大模型關鍵8人首次曝光！中科大北航清華校友，還透露下一步

相關資訊