18歲天才高中生,利用AI竟發(fā)現(xiàn)了150萬個隱藏天體,震驚全球。這篇獨著論文已登上天文學(xué)頂刊,或?qū)⒅μ剿饔钪嫫鹪粗i。為此,他斬獲了25萬美元科學(xué)競賽大獎,直通斯坦福。
在NASA的2000億條數(shù)據(jù)中隱藏著150萬個未知天體,而揭開它們神秘面紗的,竟是一位美國高中生!
他就是Matteo Paz,來自加州南帕薩迪納高中的天才少年。
基于加州理工學(xué)院的研究,Matteo挖掘了美國國家航空航天局(NASA)某項任務(wù)「沉睡的數(shù)據(jù)」,并以獨著身份在天文學(xué)頂級期刊發(fā)文。
憑借這項成果,他直接拿下了Regeneron科學(xué)人才搜索競賽競賽的25萬美元獎金。
2025年3月11日,Matteo Paz與加州理工學(xué)院院長Thomas F. Rosenbaum在Regeneron科學(xué)人才探索獎頒獎典禮上的合影。
目前,這項研究已于去年11月發(fā)表在《The Astronomical Journal》上,并在文中作了詳細闡述。
不過,該論文中并未提及的是,唯一作者只有18歲。
150萬潛在天體,
18歲拿下25萬美元獎金
近日,來自美國加州的18歲高中生Matteo Paz,憑借將機器學(xué)習(xí)與天文學(xué)巧妙融合的卓越研究,在2025年Regeneron科學(xué)人才搜索競賽(Regeneron Science Talent Search,簡稱Regeneron STS)中力壓群雄,斬獲一等獎,并將25萬美元獎金收入囊中。
2025年Regeneron科學(xué)人才搜索競賽獲獎?wù)撸虚g為Matteo Paz
Regeneron科學(xué)人才搜索競賽始于1942年,被譽為美國「歷史最悠久、最具聲望的高中生科學(xué)與數(shù)學(xué)賽事」,最初名為西屋科學(xué)天才搜索(Westinghouse Science Talent Search),旨在表彰并賦能那些有潛力的年輕科學(xué)家。
他利用AI,處理了來自NASA的2000億條數(shù)據(jù),揭示了150萬個先前未知的潛在天體。
在2013年12月,NEOWISE發(fā)現(xiàn)的第一顆近地小行星的運行軌跡,紅色點表示移動路徑。
接受采訪時,Matteo Paz坦言:「能參與競賽已是榮幸,從闖入前十到最終奪冠,驚喜接踵而至,至今仍覺得像在做夢。」
Matteo Paz站在后排,對自己獲得第一名的成績感到震驚。
在贏得25萬美元獎金后,Paz的下一個征途是大學(xué)。
他表示,自己已被斯坦福大學(xué)錄取。
就在參加頒獎典禮的幾周前,Paz在帕薩迪納的家中醒來,透過窗戶看到外面烈焰翻騰。
伊頓山火(Eaton Fire)蔓延得極快,以至于他未收到任何官方警報。
伊頓山火(Eaton Fire)于2025年1月7日傍晚爆發(fā),在天氣影響下,火勢迅速蔓延,共造成至少18人死亡,摧毀了9,000多座建筑,成為加州歷史上死亡人數(shù)第五高、破壞程度第二嚴(yán)重的野火
在疏散和數(shù)日的火情之后,他的家最終幸免于難。
這讓他有了新的視角。
現(xiàn)在,他正在思考是否有可能將一臺紅外望遠鏡送入地球軌道——這次是為了監(jiān)測地球本身的新發(fā)火災(zāi)。
不過,眼下他更希望利用他在NEOWISE數(shù)據(jù)中的研究成果,探索宇宙從大爆炸以來的神秘膨脹速度,幫助科學(xué)家解開宇宙學(xué)中最大謎題之一。
「這項工作要么能幫助解決當(dāng)前研究中一個極具爭議的問題,要么將揭示一些關(guān)于宇宙起源的真正基礎(chǔ)性的東西。」
「追星」路上,偶得名師
早在小學(xué)時期,Paz對天文學(xué)的熱愛便已萌芽。
那時,母親常帶他參加加州理工學(xué)院的公眾觀星講座(Stargazing Lecture Series),璀璨星空就此在他心中種下探索的種子。
2022年夏天,他走進加州理工學(xué)院,在Andrew Howard教授領(lǐng)銜的行星探測器學(xué)院(Caltech Planet Finder Academy),系統(tǒng)學(xué)習(xí)天文學(xué)與相關(guān)計算機科學(xué)知識,開啟了更深入的學(xué)術(shù)探索之旅。
天文學(xué)教授:Andrew Howard
2023年,他參與了加州理工學(xué)院為期六周的暑期研究計劃(Summer Research Connection,SRC)。
該項目由教學(xué)、學(xué)習(xí)和推廣中心運營,旨在為當(dāng)?shù)馗咧猩ヅ湫@實驗室導(dǎo)師,支持學(xué)生開展科研實踐。
加州理工學(xué)院2023年Kirkpatrick小組SRC項目匯報
天文學(xué)家和IPAC高級科學(xué)家Davy Kirkpatrick擔(dān)任Paz的導(dǎo)師。
在過去的五年里,除了本科生、公民科學(xué)家和來訪的研究員之外,Kirkpatrick還指導(dǎo)過高中生。
天文學(xué)家:Davy Kirkpatrick
Paz很幸運地遇到了導(dǎo)師Davy,Davy給予了他充分的自由和支持。他回憶道:
我記得在我們第一次交談時,我提到自己的目標(biāo)是發(fā)表論文,這個目標(biāo)遠遠超出了六周項目的周期。他非但沒有勸阻,反而欣然回應(yīng):「好的,那我們來談?wù)劙伞?。
在研究過程中,他為我提供了充分的自主探索空間,而正是這種自由,使我在科研道路上得以迅速成長。
Kirkpatrick成長于田納西州的農(nóng)業(yè)社區(qū),在九年級化學(xué)與物理老師Marilyn Morrison的助力下,圓了天文學(xué)家之夢。
Morrison老師向他和母親點明其天賦,并悉心指導(dǎo)升學(xué)所需課程,為大學(xué)深造鋪路。
如今,Kirkpatrick希望將老師當(dāng)年的指引傳遞下去,他表示:「一旦發(fā)現(xiàn)別人的潛力,我一定會全力幫助他充分發(fā)揮出來。」
2025年Regeneron科學(xué)天才搜索一等獎得主Matteo Paz手持獎杯
但Kirkpatrick希望從NEOWISE(近地天體廣域紅外探測器)項目中獲取更多有價值的信息。
巡天功臣,澤被后代
NEOWISE是NASA已退役的紅外望遠鏡。
在服役的十多年間,它不間斷地掃描整片天空,專注搜尋地球附近的小行星及其他天體。
NEOWISE在2024年底重返大氣層并安全燒毀
雖然NASA的NEOWISE望遠鏡以觀測小行星為主要任務(wù),但在運行期間,它還敏銳捕捉到遙遠宇宙物體的熱量變化。
這些天體有的會發(fā)出強烈閃光或脈動,有的在相互遮掩時會出現(xiàn)亮度衰減,反映出宇宙天體運動過程中的多樣性和復(fù)雜性。
天文學(xué)家將這些亮度變化的現(xiàn)象統(tǒng)稱為變星,其中一些類型如類星體、超新星和互相遮掩的雙星系統(tǒng),因其變化不易捕捉而尤為復(fù)雜。
模擬的雙星系統(tǒng)亮度變化
然而,這些關(guān)于變星的數(shù)據(jù)尚未得到充分利用。
當(dāng)時,團隊已積累超十年的探測數(shù)據(jù),總數(shù)據(jù)量接近2000億行。
2024年,NEOWISE團隊公布了項目的最終數(shù)據(jù)和未發(fā)現(xiàn)圖像
Kirkpatrick的設(shè)想是:
在夏天先選取一小塊天空進行分析,看看能否從中找到一些變星。
然后,我們再向天文界展示這些成果,告訴他們「這是我們親自發(fā)現(xiàn)的新事物,想象一下整個數(shù)據(jù)集蘊含的巨大潛力吧!」
AI下場,大顯身手
面對NEOWISE近2000億行的海量數(shù)據(jù),Paz并未選擇手動篩選,而是憑借在校積累的知識另辟蹊徑。
在一門融合了編程、理論計算機科學(xué)和數(shù)學(xué)的選修課上,他對AI產(chǎn)生了濃厚的興趣。
他深知,AI在大規(guī)模有序數(shù)據(jù)集上訓(xùn)練效果最好,而導(dǎo)師Kirkpatrick提供的數(shù)據(jù)恰好滿足這一條件。
幸運的是,他完成了AP微積分(Advanced Placement Calculus)BC課程,具備了開發(fā)機器學(xué)習(xí)模型所需的數(shù)學(xué)能力。
2014―2018年天文學(xué)中應(yīng)用深度學(xué)習(xí)的論文研究主題和各主題數(shù)量趨勢
在那六周里,他開始構(gòu)建AI模型,該模型初見成效。
研究期間,Paz常向Kirkpatrick請教天文學(xué)與天體物理學(xué)知識。
談及這段經(jīng)歷,他總是難掩喜悅:
每次和Davy見面,我們只有10%的時間在討論工作,剩下90%的時間都在閑聊。能有這樣一個人可以一起暢談科學(xué),真是太棒了!
Kirkpatrick還將Paz介紹給了加州理工學(xué)院的天文學(xué)家Shoubaneh Hemmati、Daniel Masters、Ashish Mahabal和Matthew Graham。
他們在天文學(xué)中的機器學(xué)習(xí)應(yīng)用,以及不同時間尺度下變星的研究方面,為Paz提供了寶貴的專業(yè)知識。
Paz與Kirkpatrick意識到,NEOWISE的觀測方式存在局限性,難以有效檢測和分類那些快速閃爍或緩慢變化的天體。
夏天結(jié)束后,還有很多工作要做。
第二年也就是2024年,Paz和Kirkpatrick再次合作。
現(xiàn)在,Paz已經(jīng)改進了AI模型,用于處理來自NEOWISE觀測的全部原始數(shù)據(jù),并分析了結(jié)果。
現(xiàn)在,Paz已經(jīng)改進了AI模型,用于處理來自NEOWISE觀測的全部原始數(shù)據(jù),并分析了結(jié)果。
Matteo Paz于2023年的研討會上展示了他的初步研究成果
他補充說,加州理工學(xué)院的研究人員已經(jīng)開始使用帕茲編制的潛在變星體目錄——VarWISE,用于研究雙星系統(tǒng)。
在2025年,Paz和Kirkpatrick計劃發(fā)布包含NEOWISE數(shù)據(jù)中亮度變化顯著的天體的完整目錄。
AI+天文學(xué):全新方法
Matteo Paz設(shè)計了一套處理流程,從NEOWISE數(shù)據(jù)中提取變星候選體。
以前的方法在檢測周期性信號方面非常有效,但它們在處理WISE如此大規(guī)模數(shù)據(jù)(高達數(shù)十千億行)時速度極慢,幾乎無法在實際中使用。
而Paz采用的全新機器學(xué)習(xí)模型,卻能在現(xiàn)實可行的時間范圍內(nèi)解決這一問題!
它的目標(biāo)就是,分析天空中任意天體的光變曲線,并將其分類為靜態(tài)源、新星/明亮瞬變源、雙星系統(tǒng)或脈動光源。
具體來說,Paz采用卷積操作和變換技術(shù)來提取高細節(jié)特征,讓模型能夠有效檢測到周期性和非周期性的亮度變化。
對于每條約含2000個數(shù)據(jù)點的光變曲線,在一張22GB顯存的GPU上,VARnet處理速度大于53微秒/天體。
但訓(xùn)練VARnet需要大量訓(xùn)練數(shù)據(jù)。為此,Paz專門為每類目標(biāo)光源開發(fā)了一個精準(zhǔn)的合成光變曲線生成器,以便為這一復(fù)雜模型提供無限量的訓(xùn)練樣本。
生成一條完整的合成光變曲線樣本的步驟如下:
1. 構(gòu)造一個基礎(chǔ)亮度函數(shù)f(t)
2. 按照WISE的觀測節(jié)奏(采樣間隔)對該函數(shù)進行采樣
3. 加入高斯噪聲 ,其中噪聲方差為亮度函數(shù)的某種函數(shù)形式
偽代碼詳見算法2。
這一方法論(見圖1)實現(xiàn)了極快的運行速度,并在測試集上表現(xiàn)出高精度和強性能,最終生成了高質(zhì)量的異常目標(biāo)列表。
原文圖1:異常檢測流程示意圖
整個流程如下:
(1)收集并預(yù)處理數(shù)據(jù)
采用基于密度的方法,對單次曝光源目錄中的天體顯現(xiàn)(apparitions)進行空間聚類,以及一系列數(shù)據(jù)變換,提高數(shù)據(jù)質(zhì)量。
VARnet使用一維小波分解來最大限度地降低異常數(shù)據(jù)對分析結(jié)果的影響,并對離散傅里葉變換(DFT)進行了創(chuàng)新性的改進,從而快速檢測周期性并提取時間序列特征。
VARnet將這些特征分析整合,利用機器學(xué)習(xí)實現(xiàn)對天體類型的預(yù)測,主要依賴卷積神經(jīng)網(wǎng)絡(luò)。
VARnet模型的完整結(jié)構(gòu)
VARnet模型的完整結(jié)構(gòu)如上圖所示。
整個模型統(tǒng)一采用ReLU激活函數(shù),開始包含三個卷積層,用于處理信號,并將其壓縮為三通道,送入傅里葉特征提取模塊。在模型實際運行中,最終的輸出向量會經(jīng)過softmax操作,使預(yù)測結(jié)果可以被解釋為概率形式,并按置信度進行排序
他還驗證了,VARnet對已知及新發(fā)現(xiàn)的變星源均具有高度的敏感性與準(zhǔn)確性。
果然,VARnet產(chǎn)生了一些有趣的探測結(jié)果!
首先,它以極高的置信度,恢復(fù)了許多已知物體。
而且,VARnet還發(fā)現(xiàn)了全新的天體。
位于J2000赤經(jīng)/赤緯1.53483°,−59.08751°的天體,就被VARnet標(biāo)記為變星候選體。經(jīng)檢索發(fā)現(xiàn),該天體在現(xiàn)有文獻或任何星表中均無相關(guān)記錄。
甚至,模型還發(fā)現(xiàn)了一顆超新星!
2023年6月,該天體曾出現(xiàn)快速變亮的現(xiàn)象;而在WISE的下一次觀測中,其亮度又恢復(fù)至平均水平(見下圖)。
在對瞬變事件目錄進行檢索后,可以發(fā)現(xiàn),該事件與AT 2023lkp的觀測記錄相符。
考慮到該事件的持續(xù)時間及其起源于該星系的事實,Paz等人判斷:這很可能是一顆超新星。