18歲天才少年,登上Nature封面!

新智元報道
編輯:KingHZ 好困
【新智元導(dǎo)讀】DeepSeek-R1榮登Nature封面,成為史上首個經(jīng)嚴(yán)格同行評議的大模型。年僅18歲的天才少年涂津豪作為作者之一,以實習(xí)生身份參與其中,他的故事從高中生到Nature作者,堪稱勵志傳奇。
DeepSeek登上Nature封面,DeepSeek-R1成為史上第一個經(jīng)過嚴(yán)格同行評議的大模型。
梁文鋒作為唯一通訊作者發(fā)了Nature,自然是名聲鵲起,一夜刷屏。
不過,在一眾作者中,Jinhao Tu的現(xiàn)在的通信地址竟是所中學(xué),他是誰?到底什么來頭?
有媒體發(fā)現(xiàn)Jinhao Tu就是涂津豪——
DeepSeek的實習(xí)生、建平中學(xué)國際部的畢業(yè)生、威斯康星大學(xué)麥迪遜分校2029屆本科生、2024阿里數(shù)賽AI賽道全球第一名獲得者。
2025年1月 - 2025年2月,在DeepSeek實習(xí)了兩月,恰好趕上了DeepSeek團(tuán)隊在研究推理模型R1。
于是,年僅18的涂津豪成為這次Nature封面文章的作者之一。
之后,他還在騰訊做過實習(xí)生,主要研究推理模型的高級自主能力(agentic ability)。
去年,還是高中生涂津豪已出圈:獲得了2024阿里數(shù)賽AI賽道全球第一名,還通過神級提示詞工程把Claude 3.5改造成推理模式。
神級提示:Claude 3.5變「OpenAI o1」
簡單來說,這個提示詞能讓Claude 3.5 像o1那樣思考,但思維過程更細(xì)膩、更有人情味。
它甚至模仿o1的思考方式,你還可以根據(jù)需要展開或折疊其思考過程。
有了這個提示詞,Claude 3.5變得異常強(qiáng)大。它的智力、準(zhǔn)確度和擬人化程度都得到了巨大提升。
這讓人震驚:17歲的少年,真是望塵莫及。
Claude本身已經(jīng)很強(qiáng)了,而涂津豪想為它注入一種類似o1的人類化思考模式。
涂津豪:思考模型是好模型
他的靈感起源于人類的「意識流」。
于是,他寫出了第一版思維鏈提示詞。
然后,他把提示詞輸入Claude,讓模型給出建議。
就這樣重復(fù)了80多次,不斷優(yōu)化、不斷打磨——最終版Thinking Claude來了。
把這個提示詞發(fā)送給Claude后,你就可以問它任何問題了。
雖說,能看到Thinking Claude的思考過程,本身很酷。
但他也意識到,不是人人都想在屏幕上看到這些冗余的細(xì)節(jié)。
他想完全復(fù)刻o1,因此又加上了「展開/折疊」的功能。
憑借Claude的強(qiáng)大性能,結(jié)合Thinking Claude思維模式的加持,再配上強(qiáng)大的Artifacts功能,稱它為「完全體o1」也絕不為過。
在GitHub上,他開源了相關(guān)項目,斬獲15k多星。
開源鏈接:https://github.com/richards199999/Thinking-Claude
關(guān)于AGI的思考
在個人博客上,他發(fā)表了關(guān)于安全和AGI的一些思考。
他真心相信,像對齊、訓(xùn)練后的安全這樣的措施是人類生命的守護(hù)者。
它們可以為模型容量、為內(nèi)部的「魔王」設(shè)置一個護(hù)欄;就像把模型鎖在籠子里,人類可以從外面研究它,而不讓它傷害我們。
而關(guān)于AGI,他認(rèn)為相當(dāng)抽象。「通用」的邊界究竟在哪里?就連Anthropic提出的ASL分類標(biāo)準(zhǔn)都顯得模糊。
他認(rèn)為實現(xiàn)AGI并不意味著需要打造一個在所有領(lǐng)域都超越人類的系統(tǒng),而是需要創(chuàng)造出在大多數(shù)領(lǐng)域超過普通人類水平的AI。
但在此之前,必須確保AI系統(tǒng)能夠真正理解:
謎語
笑話
網(wǎng)絡(luò)梗圖
成語典故
特定文化背景的內(nèi)容
這些看似不重要的能力,恰恰能反映模型最基礎(chǔ)且關(guān)鍵的語言理解水平。
現(xiàn)有的語言模型本質(zhì)上是下一個詞預(yù)測系統(tǒng),除非真正理解文字背后的模式,否則無法準(zhǔn)確處理上述內(nèi)容。
如果模型在詞預(yù)測方面表現(xiàn)出色,或真正領(lǐng)悟了文字背后的奧秘,那么它很可能具備全面的強(qiáng)大能力。
95后羅福莉
現(xiàn)在是獨立研究者
論文中還有一位作者——羅福莉,也曾在去年12月引發(fā)過全網(wǎng)的熱議。
當(dāng)時,有傳聞稱「小米開出了高達(dá)千萬級的薪酬,挖她去AI大模型團(tuán)隊」。
不過,從論文上看,她目前的身份是一位「獨立研究者」。
雖然去向成迷,但羅福莉在學(xué)術(shù)領(lǐng)域的表現(xiàn),卻是實打?qū)嵉亓裂邸?/p>
根據(jù)公開資料,她此前在北京師范大學(xué)獲得計算機(jī)學(xué)士學(xué)位,并在北京大學(xué)計算語言學(xué)研究所獲得計算語言學(xué)碩士學(xué)位。
她在AI國際頂會ACL上,曾一次性發(fā)表了8篇論文(其中2篇為第一作者),提出的詞義消歧方法和文本風(fēng)格轉(zhuǎn)換框架在業(yè)界引發(fā)轟動。
隨后的職業(yè)生涯,同樣一路高歌猛進(jìn):
2019年加入阿里達(dá)摩院后,主導(dǎo)了多語言預(yù)訓(xùn)練模型VECO的開發(fā)
2022年加入DeepSeek,并參與了DeepSeek-Coder、DeepSeek-V2、DeepSeek-Coder-V2、DeepSeek-V3、DeepSeek-R1等幾乎所有重要項目的研發(fā)
從谷歌學(xué)術(shù)主頁可以看到,她所參與論文的被引數(shù)已高達(dá)10140次。
參考資料:
https://medium.com/mr-plan-publication/a-17-year-old-high-school-student-made-a-super-prompt-for-claude-945c842f5df3
https://blog.richardstu.com/my-thoughts-on-ai-security-and-agi