精品无码一区二区三区在线,亚洲女优不卡啊啊,国产精品福利网红五月天,无语写真在线

English
?

數據密集型科學發現及其哲學問題

2016-06-20 09:24 來源:《自然辯證法研究》  我有話說
2016-06-20 09:24:47來源:《自然辯證法研究》作者:責任編輯:李萍

  再次,科研數據與知識產品發生了變化,出現了全數據模式和數據規律。

  由于數據獲取與處理的成本昂貴,傳統的科學數據都是通過實驗獲取的所謂“精準”數據,或者通過精心設計的抽樣調查獲取的具有代表性的樣本數據。[9]30但是,隨著大數據技術的發展,數據的采集、存儲、傳輸和處理等過程都實現了智能化,成本大大降低,效率卻有極大的提高。因此,大數據時代的科研數據不再精細設計、精挑細選,而是海量的混雜數據,所有數據都是粗糙的、原始的,而且數據的種類也不再僅僅限于數字化的數據,而是還包括了文本、視頻、音頻、圖片以及傳感器的各種數據等等,這就是所謂的大數據時代的“全數據模式”[9]37,所有數據都被包攬無遺。

  最為關鍵的是,我們從數據中尋找的目標發生了重大變化,我們不再追求數據之間的因果關系,而是相關關系。[9]67傳統的方法是預先有理論預設,然后通過數據建立具有因果關系的數學模型。大數據挖掘方法主要是試圖“讓數據說話”,不再先做理論預設,只是試圖通過海量數據處理來發現科學數據的相關性特征,從而得出科學問題的數據規律。因此,知識產品不再全部是因果規律,更多的是反映相關性的數據規律。[10]“今天,科學發現并不能僅僅通過定義好的、嚴格的假設檢驗過程來完成。龐大的數據量,復雜且難以發現的相關關系,學科間密切且不斷變化的合作方式,以及新的、接近實時的成果出版方式,都在為科學方法增添科學發現的新模式和新規則。”[2]114

  最后,科學發現的分工、流程發生了變化,科研工作以數據為中心而展開。

  在科學研究中,科學工作者是主體。傳統的科學研究機構往往是一個小社會,因為他們要從最原始的實驗室建設、使用和管理開始,涉及各種人、財、物的工作,每個部門都要涉及知識生產過程中的所有環節和工作。在大數據時代,數據密集型科研范式的特點是“以數據為中心來思考、設計和實施科學研究,科學發現依賴于海量數據采集、存儲、管理和分析處理的能力”[7]13。數據密集型科學發現主要由三個基本活動組成:采集、管理和分析數據。在傳統的科學研究中,科學數據一般都是靠自己或自己的團隊采集、存儲,而在大數據時代,科學數據往往是由智能終端自動產生或者網上無意中留下的。“新的研究模式是通過儀器收集數據或通過模擬方法產生數據,然后用軟件進行處理,再將形成的信息和知識存儲于計算機中。科學家只是在這個工作流程中相當靠后的步驟才開始審視他們的數據。”[2]xi因此,在大數據時代,部分科學工作已經被社會化或自動化,許多民眾在不知不覺中參與了科學數據的生產工作。以往的科研程序往往很復雜,涉及眾多的工作,而數據密集型科研則比較簡單,科研工作變成了比較單純的數據挖掘。[11]在天文學的早期,第谷·布拉赫的助手約翰內斯·開普勒曾幸運地直接從布拉赫對天體運動的系統觀察記錄中去挖掘數據,發現了行星運動定律。如今在大數據時代,我們每個人都有可能成為開普勒這樣的幸運者。只要我們掌握專業知識,具備數據挖掘能力,就有可能在對自動采集、存儲的數據進行挖掘和分析的基礎上建立起新的理論。“我們不再受制于數據,而是受限于抓住事物內在本質的洞察力。”[2]113

[責任編輯:李萍]

[值班總編推薦] 高溫津貼關乎底層權利伸張

[值班總編推薦] 還會有多少古城繼續被淹?

[值班總編推薦] 冤冤相報何時了

?

手機光明網

光明網版權所有

光明日報社概況 | 關于光明網 | 報網動態 | 聯系我們 | 法律聲明 | 光明網郵箱 | 網站地圖

光明網版權所有