習近平總書記在談到如何繁榮發展中國特色哲學社會科學時,要求我們善於“運用互聯網和大數據技術,加強哲學社會科學圖書文獻、網絡、數據庫等基礎設施和信息化建設”,這為信息化時代的人文社會科學研究的方式變革與理論創新指出了正確的方向。大數據正在成為當前中國社會快速信息化的最重要表征之一。我們應當深刻認識大數據及其對人文社會科學研究所提供的機會與挑戰,自覺促進人文社會科學研究的變革與創新。
充分認識大數據及其多維意義
何為大數據?我國《促進大數據發展行動綱要》指出:“大數據是以容量大、類型多、存取速度快、應用價值高為主要特征的數據集合。”維克托·邁爾-舍恩伯格和肯尼斯·克耶編寫的《大數據時代》中提出“大數據”的4V特點:Volume(體量浩大)、Velocity(生成快速)、Variety(模態繁多)、Value(價值巨大而密度較低迪士尼美語 有沒有效)。
在我們看來,大數據的產生是人類探尋世界發展規律和規劃自我發展道路上的一種積極產物。大數據及其意義似可從以下幾個層面來加以解讀:
在直接的意義上,大數據是相對於“小數據”或者傳統數據而言的,指人類首次有可能從自然、社會和人的活動中獲得數量巨大、類型多樣、存取高速、富於價值意義的數據並將其集合起來,形成巨大的數據庫,把世界和事物的存在方式轉變為周全詳盡的海量數據存在方式,借助於它們來實現對外部世界和自我進行更為全面、細致、深入和準確地把握。
在較廣的意義上,大數據意味著與大數據采集、存貯、處理、傳輸和應用相關的整個信息技術、設施體系和運行方式等,構建起一個個數據化的世界。人們有可能在不直接接觸現實世界的前提下通過接觸數據世界而實現對現實世界的認識與把握;通過感知和運行數據世界來重構和影響現實世界,形成真實世界與虛擬世界的互動,展示出自然、社會和人類的數字化進程,表明現代信息科技和網絡世界發展到了全新階段和更高水平。
在更廣的意義上,大數據意味著高度信息化時代的人們自覺或者不自覺地從事著數據化的生產、生活、交往、思考與實踐,構建起一整套緊密依托於現代信息網絡和數據化系統的生產方式、生活方式、交往方式、思維方式和治理方式等,大數據不僅改變著人類的社會生活,也在全面引領著人類生存方式的革命性變革與時代性提升。
在最廣的意義上,大數據意味著一種依托於大科技、大信息和大數據而構建的全新的自然圖景、社會圖景和人類圖景,以大數據的方式來看待自然、社會和人類自身,正在轉變為一種自然觀、社會觀、人類觀、價值觀和方法論,標誌著人類認識世界和認識自我、改造世界和改造自我進入到更加全面清晰準確的水平和更加自覺有效的階段。
探索大數據提供的特殊機遇與挑戰
從總體上看,與人文社會現象的多樣性和復雜性相對應,人文社會科學也是一個龐大的學科群,內部存在著迥然相異的學科,不同的學科與大數據的關系和關聯度也有很大不同。例如,從總體上看,傳統的社會科學學科,諸如經濟學、管理學、社會學、政治學、法學、教育學等學科對數據的依賴性較強,大數據所展示的意義會更充分,而文學、歷史、藝術、哲學等更加關註人們的精神生活、價值理念、心靈世界等,對外在數據的依賴性較低,大數據所展示的意義相對較弱,在大數據時代所受到的影響也相對較小。即就大數據本身而言,也應當看到,大數據並不是一切,並沒有根本取代小數據和傳統數據;大數據技術尚在發展之中,並不能簡單取代傳統數據技術;大數據研究也存在很多問題,我們沒有必要也不應該簡單地用大數據研究來遮蔽傳統的人文社會科學研究迪士尼美語 有沒有效。
但無法回避的是,方興未艾的大數據已經給人文社會科學研究提出了很多問題和挑戰,也提供了許多創新的機會。
首先,從“假設出發”還是從“數據出發”開始我們的研究?“大膽假設,小心求證”,一直是我們從事人文社會科學研究的基本模式。大數據時代,海量數據甚至“全數據”的存在成為我們很多學科和領域研究的前提,它們表征著許多難以辨析的事實,要求我們做出必要的解讀和說明。
其次,以“個別樣本”還是以“海量數據”為對象來開展研究?由於采集數據困難,過去人文社會科學的很多研究不得不依賴於抽樣調查,采集到的永遠是個別樣本信息,為此而不得不加大抽樣的比例,但最大比例的樣本也不可能窮盡對象,因此所有的結論都帶有推論的性質。大數據時代,人們有可能通過就一定事物采集全樣本,提供全數據,為人文社會科學研究提供更加堅實可靠的對象性基礎和前提。
再次,是“感性接觸”還是“行為統計”更為可靠?人文社會科學的很多研究以研究者與被研究者的直接接觸作為真實可靠的基礎,例如直接對話、直面訪談、電話采訪等,這有其感性直觀和可靠的一面。但人們的思想內在於心靈,充滿著理性與非理性的博弈,具有獨立性、分散性、個體性和變動性特點,其表達往往受到交往者之間的互動感覺和場景的直接影響,尤其是涉及一些敏感話題會產生某種特殊遮蔽甚至智慧博弈,感性接觸並不一定都真實可靠。大數據通過行為統計,對於數據細粒度的分割,全方位長時間累積搜集,尤其是在對人們在大量的“鼠標選擇”“網絡投票”中展示出的價值取向、美醜好惡、評價標準等,展示出個體真實的心靈世界,勾勒出社會總體心理狀態,描繪時代精神的大體走向,有可能為人文學科的理性研究提供更加真實可靠的對象和基礎。
又次,以“實體規律”還是以“統計規律”為研究目的?過去,人文社會科學研究主要依托對社會現象的局部觀察和實體性探索,大數據將社會變量變成可統計、可度量、可計算的對象,通過追蹤社會中作為最小組成單位的“人”以及對全局性社會形態的包容性跟蹤累積,在一個相對低廉的研究成本中展現社會和社會組織的高精度社會實景,實現以整體和全體數據為基礎的研究,更好地探析社會發展的本質特征、內在規律、演化趨勢和未來走向。例如,關於國家治理體系現代化的研究,可以嘗試借助於大數據來建立評估體系並進行國際比較,從而得出科學結論。
人文社會科學研究應自覺融入大數據時代
大數據時代已經來臨。美國政府於1993年啟動信息高速公路建設,2012年3月又宣布投入2萬億美元用於“大數據研究和發展計劃”,著力於保持在大數據戰略方面的世界優先地位。我國國務院在2015年8月發布了《促進大數據發展行動綱要》,將大數據納入國家戰略。目前的問題是,人文社會科學工作者如何自覺地進入大數據時代,推進人文社會科學研究的變革與創新。
要自覺學習和有效運用復雜性思維。大數據的世界是個極為復雜的世界,需要復雜性的思維方式。近代經典科學傾向於簡單性,產生出線性因果的觀察視角和還原論的研究思路。然而在現實世界中卻存在著許多與不確定性、突變性、非平衡性、非線性、模糊性等密切相關的復雜現象,由此而產生出耗散結構理論等現代復雜性科學。人文世界是個更加復雜的情感世界和價值世界,存在著極為復雜的人際互動和情感交織,充滿著不確定性甚至風險,需要學習借鑒復雜性科學的思路和方法。
要自覺學習和運用大數據技術。對大數據技術的應用大概可以分為三種層次和水平:能夠熟練運用現代信息技術和數據裝備處理人文社會科學的復雜信息;能夠科學合理解讀現代人文社會科學信息所蘊含的意義;能夠運用大數據技術引領人文社會科學研究和人文社會現實的良性健康發展,引領社會文明的數字化發展方向。通過大數據技術的應用把人文社會科學研究的相對客觀部分提升為可以與自然科學和工程技術相媲美的“硬科學”,這將極大提升中國人文社會科學對當代世界的解釋力和影響力。
要自覺更新和發展自我。我們要勇於掌握技術又善於超越技術,盡最大努力去學習掌握和運用大科學技術,走在時代的潮頭,同時又要防止為技術所裹挾,避免成為簡單的技術主義者,努力保持人文社會科學工作者的思想高度、理論品格和價值定位,勇於反思和批判。大數據時代離不開任何專業卻也不會拘泥於任何專業,要自覺地站在當代學科既深度分化又高度綜合的背景下開展研究,既立足專業又超越專業。大數據時代最大的特點就是人、對象世界、數據世界與數據技術的多維互動,這也需要我們勇於實現自我超越。只有自覺地置身於自然—社會—人—數據的復雜巨系統中,人才能真正成為世界的主人,成為大數據的主人,成為人文社會科學研究的主人迪士尼美語 有沒有效。