新的IBM 基礎模型技術用 NASA衛(wèi)星捕捉的海量地球科學數據生成地理空間智能洞察
北京2023年3月3日 /美通社/ -- IBM(紐約證券交易所代碼:IBM)和美國宇航局(NASA)馬歇爾太空飛行中心最近宣布展開合作,利用IBM的人工智能(AI)技術,從NASA海量的地球與地理空間科學數據中發(fā)掘新洞察。這項合作是首次把AI基礎模型技術應用于NASA的地球觀測衛(wèi)星數據。
基礎模型 是在一組廣泛的未經標記的數據上進行訓練的 AI 模型類型,可用于不同任務,并且可以舉一反三,將某一情況的信息應用于另一種情況。過去五年,這類模型快速推進了AI自然語言處理(NLP)領域的技術發(fā)展,現在,IBM正在探索和開創(chuàng)除NPL領域之外更多的基礎模型應用場景。
地球觀測工作使科學家研究和監(jiān)測地球成為可能,同時這項工作也正以前所未有的速度和數量在收集數據,迫切需要借助新的創(chuàng)新方法從這些龐大的數據源中提取知識。此次IBM與NASA攜手合作的目標,就是要為研究人員提供一種更為簡單的方法來分析這些大型數據集,并從中獲取見解。IBM的基礎模型技術有望加快這些數據的發(fā)現與分析,從而快速推進人類對地球的科學理解以及對氣候相關問題的響應。
IBM和NASA計劃開發(fā)幾項新的技術來從地球觀測工作中提取見解。其中一個項目將在NASA的Harmonized Landsat Sentinel-2(HLS)數據集上訓練IBM的地理空間智能基礎模型,HLS數據集記錄了地球軌道衛(wèi)星所捕獲的土地覆蓋和土地利用變化的數據,通過分析這些PB量級的衛(wèi)星數據,來確定自然災害、周期性作物產量和野生動物棲息地等現象的地理足跡變化,這一基礎模型技術將幫助研究人員對地球的環(huán)境系統(tǒng)進行重要的分析。
這項合作的另一個輸出成果,預計將會是一個易于搜索的地球科學文獻語料庫。IBM 開發(fā)了一個 NLP 模型,經過近 300,000 篇地球科學期刊文章的訓練,該模型可以組織相關文獻并且可以更為輕松地發(fā)現新知識。 這一訓練完備的模型,包含了迄今為止在紅帽O(jiān)penShift軟件上訓練的最大的AI工作負載,使用IBM的開源多語言問答系統(tǒng)PrimeQA。除了為研究人員提供資源外,還可以把地球科學的新語言模型注入NASA的科學數據治理以及管理的流程當中。
NASA馬歇爾太空飛行中心的高級研究科學家Rahul Ramachandran表示:"這些基礎模型的美妙之處在于它們可以應用于許多下游應用。而建立這些基礎模型,小團隊是無法做到的,只有通過來自不同組織的團隊引進不同的視角、資源和技能,攜手合作才能做到。"
IBM首席研究員Raghu Ganti說:"基礎模型的成功已經在自然語言處理(NPL)的應用中得到證明,現在是時候把它擴展到對商業(yè)和社會極為重要的新的領域和模式上來了。將基礎模型應用于地球科學數據中的地理空間、事件序列、時間序列和其它非語言因素當中,可以使更廣泛的研究人員、企業(yè)和民眾即刻獲得極有價值的見解和信息。最終,它或許可以幫助更多有志之士致力于解決我們最為緊迫的氣候問題。"
該協(xié)議中其它潛在的IBM-NASA聯(lián)合項目,還包括使用大氣觀測數據集MERRA-2構建天氣和氣候預測的基礎模型。這項合作是NASA開源科學計劃的一部分,該計劃致力于在未來十年內建立一個包容、透明和協(xié)作的開放科學社區(qū)。
有關此協(xié)作的更多信息,請訪問 IBM 研究院博客。
有關 IBM 未來方向和意圖的聲明如有更改或撤銷,恕不另行通知,僅代表目標和目的。
關于 IBM
IBM 是全球領先的混合云、人工智能及企業(yè)服務提供商,幫助超過 175 個國家和地區(qū)的客戶,從其擁有的數據中獲取商業(yè)洞察,簡化業(yè)務流程,降低成本,并獲得行業(yè)競爭優(yōu)勢。金融服務、電信和醫(yī)療健康等關鍵基礎設施領域的超過 4000 家政府和企業(yè)實體依靠 IBM 混合云平臺和紅帽 OpenShift 快速、高效、安全地實現數字化轉型。IBM 在人工智能、量子計算、行業(yè)云解決方案和企業(yè)服務方面的突破性創(chuàng)新為我們的客戶提供了開放和靈活的選擇。對企業(yè)誠信、透明治理、社會責任、包容文化和服務精神的長期承諾是 IBM 業(yè)務發(fā)展的基石。了解更多信息,請訪問:https://www.ibm.com/cn-zh
媒體聯(lián)絡人: