一、運(yùn)行環(huán)境要求
操作系統(tǒng)要求:linux
語(yǔ)言要求:java或lua或python
二、技術(shù)要求
1、識(shí)別規(guī)則及算法需要有兩條路徑:
(1)通過(guò)常規(guī)的規(guī)則進(jìn)行識(shí)別,規(guī)則可以進(jìn)行自定義,形成規(guī)則庫(kù),譬如身份證號(hào)碼具有規(guī)則識(shí)別特征的,可以標(biāo)定為敏感數(shù)據(jù),或者已經(jīng)為數(shù)據(jù)項(xiàng)添加了標(biāo)簽(標(biāo)簽可以人工添加,可以對(duì)此標(biāo)簽進(jìn)行是否敏感數(shù)據(jù)及敏感性級(jí)別設(shè)置),如標(biāo)簽代表了為敏感信息,即可識(shí)別為敏感數(shù)據(jù);
(2)通過(guò)機(jī)器學(xué)習(xí)方法進(jìn)行敏感數(shù)據(jù)識(shí)別,提供基于相似度、非監(jiān)督學(xué)習(xí)和監(jiān)督學(xué)習(xí)的三類智能算法,提供訓(xùn)練數(shù)據(jù)庫(kù)(支持訓(xùn)練數(shù)據(jù)庫(kù)的數(shù)據(jù)增加導(dǎo)入),提供人工標(biāo)記接口,提供訓(xùn)練任務(wù)調(diào)度接口,提供算法及參數(shù)修改能力。
2、敏感數(shù)據(jù)識(shí)別首先進(jìn)行常規(guī)規(guī)則識(shí)別匹配,無(wú)法識(shí)別的再進(jìn)行機(jī)器學(xué)習(xí)智能識(shí)別,除各自提供相應(yīng)的接口外,還需提供統(tǒng)一的接口;
3、識(shí)別的結(jié)果除提供是否是敏感數(shù)據(jù)外,還需提供敏感數(shù)據(jù)的類型、敏感級(jí)別、判別依據(jù)等數(shù)據(jù);
4、對(duì)于識(shí)別的結(jié)果,敏感的可以手工更改為非敏感,或者非敏感的可以手工更改為敏感數(shù)據(jù),更改后可以反饋給識(shí)別系統(tǒng),作為下一次敏感數(shù)據(jù)識(shí)別規(guī)則或機(jī)器學(xué)習(xí)的訓(xùn)練學(xué)習(xí)輸入內(nèi)容。