近日,字節跳動安全團隊對外宣布開源敏感數據保護方案GoDLP,該方案能夠應用多種隱私合規標準,對原始數據進行分級打標、判斷敏感級別和實施相應的脫敏處理。
據悉,GoDLP 提供了一系列針對敏感數據的識別和處置方案, 其中包括敏感數據識別算法,數據脫敏處理方式,業務自定義的配置選項和海量數據處理能力。
作為字節跳動在數據脫敏保護方向成功的實踐案例,字節安全團隊決定用開源的方式向大家分享其研究成果,與行業一同成長。字節跳動安全團隊相關負責人表示,GoDLP會長期維護更新,歡迎行業人士一起溝通交流。
字節跳動開源的GoDLP是怎么樣?
GoDLP 能夠廣泛支持結構化(JSON數據、KV數據、golang map)和非結構化數據(多語言字符串)。
● 可實現敏感數據自動發現
GoDLP內置多種敏感數據識別規則,可覆蓋市面80%以上識別規則,最大程度識別敏感數據
● 靈活的敏感數據脫敏處理
GoDLP支持多種脫敏算法,用戶可自行根據需求進行脫敏處理
● 業務自定義配置選項
除默認的敏感信息識別和處理規則外,業務可根據實際情況,配置自定義的YAML規則,GoDLP能夠根據傳入的配置選項,完成相應的數據處理任務。
GoDLP的性能表現
下方數據是在開啟全部敏感數據類型情況下的結果
● 針對1K的文件,用時需4.1毫秒,占用128.6k的內存
● 1M的文件,用時為4.1s,內存占用118.6MB
(測試環境:8核虛擬機,Linux,amd64,Intel(R)Xeon(R)Platinum8260CPU@2.40GHz;代碼版本:v2.0.0)
GoDLP在字節的實踐
GoDLP已在字節跳動進行了豐富的實踐,已接入的業務線涵蓋抖音、電商、飛書、火山引擎、云安全、財經、教育、游戲等諸多業務線。目前,字節跳動安全團隊已放出GitHub上開源地址(https://github.com/bytedance/godlp)。