DeepSeek,全稱杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,是一家成立于2023年的創(chuàng)新型科技公司,由知名私募巨頭幻方量化孕育而生,專注于開發(fā)先進(jìn)的大語言模型(LLM)和相關(guān)技術(shù)。憑借強(qiáng)大的深度學(xué)習(xí)能力和廣泛的應(yīng)用場景,DeepSeek在全球科技領(lǐng)域引發(fā)廣泛關(guān)注。
隨著國產(chǎn)開源大模型DeepSeek的強(qiáng)勢出圈,其背后的核心團(tuán)隊(duì)也引起了廣泛專注。資料顯示,DeepSeek的創(chuàng)始人為梁文鋒,公司核心團(tuán)隊(duì)的最大特點(diǎn)是年輕,核心技術(shù)崗位基本上以應(yīng)屆和畢業(yè)一兩年的人為主,許多成員的工作時間都不長,不少還是在讀博士。除此之外,DeepSeek團(tuán)隊(duì)成員也多來自中國本土市場,工程師和研發(fā)人員幾乎都來自清華大學(xué)、北京大學(xué)、中山大學(xué)、北京郵電大學(xué)等國內(nèi)頂尖高校,鮮有“海歸”。
*DeepSeek主創(chuàng)團(tuán)隊(duì)名單是小編根據(jù)公開資料整理而得。名單僅供參考和幫助,歡迎在末尾交流探討。
梁文鋒,畢業(yè)于浙江大學(xué),擁有信息與電子工程學(xué)系學(xué)士和碩士學(xué)位,杭州幻方科技有限公司、DeepSeek創(chuàng)始人。在他的帶領(lǐng)下,DeepSeek對人才極其看重,不看經(jīng)驗(yàn),只看能力。
高華佐,畢業(yè)于北京大學(xué)物理系,為MLA架構(gòu)做出了關(guān)鍵創(chuàng)新。
曾旺丁,畢業(yè)于北京郵電大學(xué),研究生導(dǎo)師是北郵人工智能與網(wǎng)絡(luò)搜索教研中心主任張洪剛,其為MLA架構(gòu)做出了關(guān)鍵創(chuàng)新。
邵智宏,清華大學(xué)交互式人工智能(CoAI)課題組博士生,師從黃民烈教授。曾在微軟研究院工作過,是DeepSeekMath核心作者之一,此外還參與了DeepSeek-Prover、DeepSeek-Coder-v2、DeepSeek-R1等項(xiàng)目。
朱琪豪,北京大學(xué)計(jì)算機(jī)學(xué)院軟件研究所2024屆博士畢業(yè)生,受熊英飛副教授和張路教授指導(dǎo),研究方向?yàn)樯疃却a學(xué)習(xí)。朱琪豪是DeepSeekMath核心作者之一,此外還基于他的博士論文工作,主導(dǎo)開發(fā)了DeepSeek-Coder-V1。
Peiyi Wang,北京大學(xué)博士生,受北京大學(xué)計(jì)算語言學(xué)教育部重點(diǎn)實(shí)驗(yàn)室穗志方教授指導(dǎo),是DeepSeekMath核心作者之一。
代達(dá)勱,2024年博士畢業(yè)于北京大學(xué)計(jì)算機(jī)學(xué)院計(jì)算語言所,師從穗志方教授,他從V1就加入到DeepSeek,一直到V3。
趙成鋼,畢業(yè)于清華大學(xué),大二時成為清華學(xué)生超算團(tuán)隊(duì)正式成員,三次獲得世界大學(xué)生超算競賽冠軍,曾在英偉達(dá)實(shí)習(xí),在DeepSeek中擔(dān)任訓(xùn)練/推理基礎(chǔ)架構(gòu)工程師。
吳俁,2019年博士畢業(yè)于北京航空航天大學(xué),博士期間接受北航李舟軍教授和MSRA前副院長周明博士的聯(lián)合培養(yǎng),曾在微軟MSRA參與過小冰和必應(yīng)百科項(xiàng)目,是DeepSeek后訓(xùn)練團(tuán)隊(duì)的負(fù)責(zé)人。
郭達(dá)雅,2023年博士畢業(yè)于中山大學(xué),由中山大學(xué)印鑒教授與MSRA周明博士聯(lián)合培養(yǎng),2024年7月加入DeepSeek,主要參與了一系列數(shù)學(xué)和代碼大模型的工作。