□從我國刑事證據審查機制看,目前所建立的是以法定證據類型為橫向坐標,以“資料―證明―定案依據”為縱向審核流程的基礎架構。大數據證據作為一種新興的證據類型,理應適用現行刑事證據審查的體系框架。因而,可以按照刑事證據審查兩道門檻分為“證明材料―證據”和“證據―定案根據”兩個階段對大數據證據進行審查。
□由“材料”到“證據”的審查是對證據準入資格的審查。證據準入資格審查應符合兩大要求:材料轉化為證據要具備合法性,證據材料要具備證明能力。其中,具備證明能力是實質性要件,合法性要求更多是形式上的要件。證據準入資格的審查可以借助證據能力的審查標準開展。
在信息技術高速發展的時代背景下,大數據證據越來越多地出現在訴訟中。然而,目前我國立法和司法解釋中尚未對大數據證據的證據屬性、審查運用等作出明確規定,理論上關于大數據證據的證據屬性與審查標準的討論尚未形成一致意見,司法實踐中對于大數據證據的裁量標準也缺乏統一尺度。因此,亟須構建大數據證據審查體系,通過對大數據證據的合理審查促進訴訟質效提升。
要建立大數據證據的審查體系,首先必須厘清大數據證據的內涵和屬性。我國學界對于大數據證據的定義有爭論而無定論,目前已形成了鑒定意見說、電子證據說、獨立證據說三種觀點。一般來說,大數據證據的形成過程為:搜集匯總基礎海量數據并逐步進行數據信息清洗―建構算法分析模型―形成分析研究結論即大數據分析報告。從結構上看,大數據證據呈現出海量電子數據、大數據技術、書面分析報告“三位一體”的結構;從內容上看,大數據證據具有“算法黑箱”“***壁壘”“弱關聯性”等特征;從空間上看,大數據證據具有海量電子數據與實物載體“虛實結合”的特征。這些特性決定了大數據證據具備遠超于電子數據載體所能承受的數據體量和證據形式,且大數據技術“機器”決策也不同于鑒定“人”的決策。因此,有必要確立大數據證據獨立的證據地位,并基于大數據證據的特征構建相應審查體系。
從我國刑事證據審查機制看,目前所建立的是以法定證據類型為橫向坐標,以“資料―證明―定案依據”為縱向審核流程的基礎架構。大數據證據作為一種新興的證據類型,理應適用現行刑事證據審查的體系框架。因而,可以按照刑事證據審查兩道門檻分為“證明材料―證據”和“證據―定案根據”兩個階段對大數據證據進行審查。
第一階段:“證明材料―證據”階段的審查
由“材料”到“證據”的審查是對證據準入資格的審查。根據刑事訴訟法第50條規定:“可以用于證明案件事實的材料,都是證據。”可見,“材料說”已經得到立法的采納。“材料說”對部分還未來得及被法律納入法定證據種類的案件證據材料放寬了限制,從而為大數據證據的適用提供了依據。但該條規定也對證據準入資格提出了要求,即必須具備能夠證明案件事實的能力。由此,證據準入資格審查應符合兩大要求:材料轉化為證據要具備合法性,以及證據材料要具備證明能力。其中,具備證明能力是實質性要件,合法性要求更多是形式上的要件。證據準入資格的審查可以借助證據能力的審查標準開展。證據能力的審查一般分為:合法性審查、相關性審查、可靠性審查。大數據證據的合法性屬于法律建構上的問題,尚無明文規定,因此,目前對大數據證據的證據能力審查應主要從相關性檢驗和科學可靠性檢驗展開。
基于大數據在結構上的特性,審查大數據證據的相關性可從三個方面進行:其一,技術選擇的相關性。大數據技術選擇須首先滿足證據有助于發現案件事實因果關系的基礎性要求,但不宜要求過高,只需滿足大數據證據能夠證明待證事實的可能性即可;其二,數據的相關性要求。海量基礎數據之間應具有關聯性;基礎電子數據與案件事實之間應具有相關性,這也是大數據與案件具有相關性的內在要求;其三,結論的相關性要求。最終得出的結論即大數據分析報告要與待證要件事實之間具有相關性,且能夠發揮證明效果。
作為一種以數據科學為依托的證據,大數據證據的科學可靠性檢驗同樣可從三個不同層面進行:第一,技術的可靠性。簡單來講,就是用以算法模型為核心的數據處理***將非結構化的海量數據結構化,并從中尋找數據與數據之間以及數據與案件事實之間的關聯。違反有關技術的操作不僅可能影響海量電子數據資料的真實合法性,更可能影響大數據及分析報告的可靠性。對大數據證據的技術可靠性證成主要包括:選擇該算法模型的原因、算法模型設計是否有效合理、分析報告是否有效三個方面。第二,數據的可靠性。大數據證據的可靠性要求大數據形成過程中產生的信息與原始數據要保持一致,包括數據收集、數據清洗和數據標注三個階段的準確與真實,且沒有被更改、刪減,在完整性的基礎之上還需要滿足數據與數據之間、數據與客觀事實之間不矛盾的要求。第三,結論的可靠性。大數據分析報告作為大數據證據最終的產物是基于目標海量基礎數據分析得到的,需要滿足大數據分析報告與原始基礎數據、待證事實之間具有唯一的對應關系。除此之外,還要求對于不能被司法人員直觀認知的報告,要通過專門機構或者人員進行輔助分析,從而判斷該報告與其他證據是否相互印證,是否具有可解釋性。
第二階段:“證據―定案根據”階段的審查
“證據―定案根據”階段的審查是對定案根據資格的審查,更多涉及司法人員的自由心證。由于證明力的審查是大數據證據成為定案依據的必要條件而不是充分條件,這一階段的審查與證明力的審查并不全然相同。
大數據證據必須查證屬實。根據刑事訴訟法第42條第3款規定:“證據必須經過查證屬實,才能作為定案的根據。”該規定一方面要求大數據分析的結論確實為真,并能夠達到證明標準:另一方面也強調了證據轉化為定案根據的程序性要件,即大數據證據需要經過“當庭出示、辨認、質證等法庭調查程序”查明屬實后,才能作為定案的根據。
大數據證據的證明力要求。證明力從本質上來說主要體現在證據相關性的大小。證明力的審查與前述證據能力審查環節中相關性審查無本質差異,區別僅在于一個審查“有無”,一個更看重“程度”。但是,證明力的審查仍應在前述相關性要求的基礎上注意以下三個方面:首先,證據之間具有相關性,也就是大數據證據之間以及與其他證據的證明之間必須存在一定的交集;其次,大數據證據與其他證據共同指向同一待證事實,“孤證不能定罪”;最后,能夠合理排除證據之間的矛盾。這三個階段的要求層層遞進,從正反兩面提出整體性要求。
排除合理懷疑的審查要求。大數據證據作為定案根據還需要達到能夠排除合理懷疑的程度,這主要涉及司法人員的自由心證,從而實現證明標準的主客觀結合。雖然我國刑事訴訟定罪證明標準是綜合全案證據排除合理懷疑,而不是根據單個證據就可以排除合理懷疑,但是二者并不完全對立,如果一個大數據證據存在不可排除的合理懷疑,那么它與其他諸多證據組合成的整體可能會存在證明風險。
構建大數據證據的審查體系,還應注重配套制度的完善,特別是完善大數據證據的“鑒真”制度。鑒真是對證據來源和提取過程的要求,即由***人員對科學技術作出鑒別意見,揭示證據的真實性和相關性,具體包括以下兩個方面:其一,對大數據證據的外部載體進行鑒真。海量電子數據經過數據提取、清洗等過程和算法的作用后呈現的物質載體就是大數據證據的外部載體。對外部載體進行鑒真需要對證據保管鏈條的完整性進行證明,以確保大數據在上述整個過程中始終保持同一性。其二,對大數據證據的內部載體進行鑒真。對內部載體進行鑒真,應當對生成大數據證據的數據或代碼的完整性進行審查,避免數據或代碼被調換、編輯。
完善大數據證據的質證機制。大數據證據基于復雜的算法技術和數據采集等存在證據偏在問題,導致辯方在與控方對抗中處于弱勢地位。因此,完善大數據證據的質證機制就尤為重要。由于大數據證據的證明機制以及算法黑箱的特點,應注重大數據證據源代碼的開示,讓主導證據生成的源代碼在質證過程中發揮重要作用,同時可以適用專家輔助人制度,以應對因***性程度較高導致的訴訟不平衡問題。
(作者單位:西南政法大學法學院)