網易首頁 > 網易號 > 正文 申請入駐

把日志丟給AI之前,先過一遍脫敏過濾器

0
分享至

開發者調試應用時,隨手復制粘貼日志給AI分析,這個習慣可能正在泄露用戶隱私。一位獨立開發者用8年前的MacBook Air做測試,發現Android日志里藏著遠比堆棧跟蹤更多的東西。

日志里到底漏了什么


真實生產環境的日志片段:

D/Network: Connecting to 192.168.1.105:8080
I/Auth: User token: eyJhbGciOiJIUzI1NiJ9...
D/User: Loading profile for user@example.com
I/Device: Serial: R58M123ABCD

IP地址、郵箱、設備序列號、認證令牌(Auth Token)——這些全在普通調試日志里。開發者可能意識不到,自己隨手發給Gemini或ChatGPT的logcat輸出,其實是一份完整的用戶畫像。

更麻煩的是免費層API的服務條款。Gemini的免費 tier 明確說明:提交數據可能用于模型訓練。你的用戶郵箱和內部IP地址,可能成為訓練語料的一部分。

一個Rust寫的過濾器

這位開發者在工具HiyokoLogcat里內置了四層正則過濾,每條日志出設備前先過一遍:

IP地址 → 替換為[IP]
郵箱格式 → 替換為[EMAIL]
Base64類長字符串(20位以上)→ 替換為[TOKEN]
電話號碼格式 → 替換為[PHONE]

代碼實現用了regex和once_cell做惰性初始化,避免每次編譯正則的開銷。8年前的MacBook Air跑起來沒壓力,說明性能損耗可以忽略。

過濾后的效果:

D/Network: Connecting to [IP]:8080
I/Auth: User token: [TOKEN]
D/User: Loading profile for [EMAIL]

堆棧跟蹤和錯誤上下文完整保留,診斷價值沒丟。敏感數據被攔截在設備端,根本到不了AI的輸入框。

寧可錯殺,不能漏放

Token正則有個副作用:它會誤傷。Base64編碼的字符串在日志里太常見了——圖片預覽、校驗和、隨機ID都會被 mask 掉。

開發者的判斷是:誤傷可接受。被 mask 的校驗和不影響AI診斷錯誤,但漏掉一個認證令牌就是安全事故。

這個取舍很務實。安全過濾器的黃金法則從來不是"精準識別",而是"默認拒絕,人工放行"。

透明比技術更重要

即使做了脫敏,HiyokoLogcat還是在設置頁放了明確提示:

「免費Gemini API可能將提交數據用于模型訓練。日志在發送前會自動脫敏常見個人信息,但在處理敏感應用前請自行檢查日志內容!

這句話的價值不亞于正則表達式本身。開發者工具的用戶也是開發者,他們理解決策背后的權衡,但前提是被告知。

生產環境日志進AI診斷工具,這個場景的信任鏈很長:終端用戶→應用開發者→調試工具開發者→AI服務商。每一環都可能成為泄露點,而脫敏過濾器只是其中一環。

為什么這件事值得較真

日志脫敏不是新話題,但LLM(大語言模型)的普及讓風險被放大了。以前的調試流程是開發者本地grep,現在是隨手粘貼給云端AI。數據流轉路徑變了,安全習慣沒跟上。

HiyokoLogcat的做法提供了一個最小可行方案:客戶端正則+用戶告知+開源可審計。不需要企業級DLP(數據防泄漏)系統,一個獨立開發者用200行Rust代碼就能堵住最明顯的口子。

這個案例的真正價值在于示范效應。它證明隱私保護可以和工具輕量化共存,而不是安全團隊的專屬領地。當更多開發者工具把脫敏做成默認行為而非可選項,行業基準才會上移。

工具已開源在GitHub,作者X賬號@hiyoyok。如果你也在做類似工具,會把這個過濾器做成強制開啟還是用戶可選?

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
婆婆兩套房全給小叔,丈夫鼓掌,隔天我倆拿出調令:媽,五年后見

婆婆兩套房全給小叔,丈夫鼓掌,隔天我倆拿出調令:媽,五年后見

曉艾故事匯
2026-05-03 16:45:36
1951年,劉青山的一張全家福,生活奢靡、口味刁鉆,次年被槍決

1951年,劉青山的一張全家福,生活奢靡、口味刁鉆,次年被槍決

我不是沃神
2026-04-28 13:00:03
中國年輕人不是躺平了,而是太辛苦了

中國年輕人不是躺平了,而是太辛苦了

呦呦鹿鳴
2026-05-04 13:28:35
大結局要來,美國伊朗,開火了!

大結局要來,美國伊朗,開火了!

喀秋莎大世界
2026-05-05 22:34:51
【U17亞洲杯】孔璽諾造險 中國隊0比1印尼遭開門黑

【U17亞洲杯】孔璽諾造險 中國隊0比1印尼遭開門黑

體壇周報
2026-05-06 02:51:19
五一假期,一個美國獨立開發者做的DeepSeek版Claude Code火了!

五一假期,一個美國獨立開發者做的DeepSeek版Claude Code火了!

我不叫阿哏
2026-05-05 20:44:58
“打了一針脈不跳了”,央視曝光后,已有55人落網

“打了一針脈不跳了”,央視曝光后,已有55人落網

浙江之聲
2026-05-04 22:58:05
頂級AI撞上低級烏龍:連寫幾十頁推導,結果發現題干錯了?

頂級AI撞上低級烏龍:連寫幾十頁推導,結果發現題干錯了?

新智元
2026-05-04 12:08:00
改了 8 元保號套餐后,移動竟每月白送我幾十G流量

改了 8 元保號套餐后,移動竟每月白送我幾十G流量

Thurman在昆明
2026-04-28 18:33:16
譚校長還能睡粉!楊超越的好運用完了!

譚校長還能睡粉!楊超越的好運用完了!

八卦瘋叔
2026-05-05 11:04:00
劉曉慶只比鄧婕大5歲,二人狀態大不同,科技臉和原裝臉一眼就懂

劉曉慶只比鄧婕大5歲,二人狀態大不同,科技臉和原裝臉一眼就懂

蓓小西
2026-03-28 09:17:09
你以為麻豆傳媒是賣片的,其實它是賣人的

你以為麻豆傳媒是賣片的,其實它是賣人的

創始人筆記
2026-04-23 21:44:50
花幾百萬,換17歲男孩的血?

花幾百萬,換17歲男孩的血?

中國新聞周刊
2026-05-04 12:36:50
970萬維修資金,被套走500多萬——當業委會變成了"提款機"

970萬維修資金,被套走500多萬——當業委會變成了"提款機"

物業管理的那些事
2026-05-04 17:09:11
李嘉誠又賣了!長和將注銷英國電訊業務VodafoneThree 49%股權,套現約455億港元,股價逆勢上漲#李嘉誠#長江和記實業有限公司

李嘉誠又賣了!長和將注銷英國電訊業務VodafoneThree 49%股權,套現約455億港元,股價逆勢上漲#李嘉誠#長江和記實業有限公司

每日經濟新聞
2026-05-05 23:51:37
別再被抗戰劇騙了!一名日軍攝影師,拍下真正的“鬼子進村”照片

別再被抗戰劇騙了!一名日軍攝影師,拍下真正的“鬼子進村”照片

歷史甄有趣
2026-05-04 08:10:22
71歲上海老太賣房自駕旅游,不給親人留一分錢,9年不回家

71歲上海老太賣房自駕旅游,不給親人留一分錢,9年不回家

木言觀
2026-05-04 11:59:43
我把6套房產全給了3個兒子,被趕出家門,女兒收留我竟說:家小

我把6套房產全給了3個兒子,被趕出家門,女兒收留我竟說:家小

星宇共鳴
2026-01-12 10:36:01
奔馳暴跌王誕生!一降就是40萬,62萬跌至20多萬,銷量直接爆了!

奔馳暴跌王誕生!一降就是40萬,62萬跌至20多萬,銷量直接爆了!

劉哥談體育
2026-05-04 23:04:49
張雪機車再次奪冠,贊助商真的是贏麻了!

張雪機車再次奪冠,贊助商真的是贏麻了!

總在茶余后
2026-05-06 01:25:30
2026-05-06 03:08:49
碼上閑敘
碼上閑敘
有態度網友ytd
3325文章數 40關注度
往期回顧 全部

科技要聞

傳蘋果考慮讓英特爾、三星代工設備處理器

頭條要聞

媒體:中國史無前例下"阻斷禁令" 美媒迅速捕捉到信號

頭條要聞

媒體:中國史無前例下"阻斷禁令" 美媒迅速捕捉到信號

體育要聞

全世界都等著看他笑話,他帶國米拿下冠軍

娛樂要聞

內娛真情誼!楊紫為謝娜演唱會送花籃

財經要聞

瀏陽煙花往事

汽車要聞

同比大漲190% 方程豹4月銷量29138臺

態度原創

健康
游戲
藝術
教育
公開課

干細胞治燒燙傷面臨這些“瓶頸”

全新類魂3A美女角色盔甲太性感!外媒銳評像劣質手游

藝術要聞

AI應用“豆包”要收費,第一批“韭菜”是誰?

教育要聞

告別焦慮!南師附中官方:11位特長生上岸者首度分享:試題難在哪?如何準備?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版