Hyaika Blog

Penguin is all you need

技术

你放进云端的东西,微软替你定了保质期

你放进云端的东西,微软替你定了保质期

目录

  • 七月开始,OneDrive 的数据有了保质期
  • 另一边,你的数据被泄露了 45 天你才知道
  • 然后还有第三种人,在把书藏进互联网的缝隙里
  • 谁来决定你的数据什么时候消失?
  • 现场验证:一台服务器上的数字遗迹

七月开始,OneDrive 的数据有了保质期

6 月 6 日,微软发布了一条看起来不痛不痒的更新。它说它的标题——「Your OneDrive data now has an expiry date」——已经把核心内容写在里面了:

从今年 7 月起,所有 Microsoft 365 租户内的 无许可证 OneDrive 账户将自动进入一个生命周期的倒计时。

具体时间线是这样的:

OneDrive lifecycle enforcement diagram

  1. 第 1 天:用户的许可证被移除或账号被删除。倒计时开始。
  2. 第 60 天:账户进入只读模式。不能修改,不能添加,只能看。
  3. 第 93 天:归档。用户本人也无法访问。数据仍在,但对原主人不可见。
  4. 第 365 天:永久删除。不可恢复。

如果你看到「365 天」觉得还OK——时间充裕嘛——注意几个细节:这是累积的 12 个月。中途续费会重置倒计时,但一旦超出,删除是硬性的。没有软删除,没有恢复期,没有「联系技术支持试试」。

而且这个策略是默认开启的。不需要管理员确认,不需要租户选择加入。7 月起全球生效。

这意味着什么?你离职了,你的公司把你从 M365 许可证里移除了。如果没人去把你的 OneDrive 内容迁移出来,一年后它就消失了。不是「归档在某个冷存储里」,不是「发给你一个下载链接」,是消失。

它的博客里有一段话写得很诚实:

And if the data genuinely is not needed? You can simply do nothing. After 365 unlicensed days it will be deleted, which might be exactly the outcome you want.

翻译成人话:如果你真的不需要这些数据了,什么都不做就好了。一年后它自己就没了。也许这正是你想要的。

对合规部门来说,这确实是他们想要的。对离职一年的人来说,这也无所谓。但对那个以为「云端的数据会一直在那里」的人来说——现实会来得有点突然。

另一边,你的数据被泄露了 45 天你才知道

同一天,Troy Hunt 把第 1,000 个数据泄露事件加载进了 Have I Been Pwned(HIBP)。

他借这个契机写了一篇反思,问题是:在 GDPR 和 CCPA 生效这么多年之后,为什么 HIBP 还存在?

Troy Hunt 1000th breach announcement

答案其实藏在标题里:disclosure lag(披露延迟)越来越严重了

举三个例子,全来自同一家组织——ShinyHunters:

  • 嘉年华邮轮(Carnival):4 月下旬被攻击,870 万条记录被盗。黑客在 4 月 24 日公开数据。嘉年华在 5 月 27 日才通知用户——43 天后。期间用户问嘉年华,嘉年华回答「没有发生数据泄露」。
  • Zara:数据被泄露后,Zara 在 45 天后才通知用户。
  • ZenBusiness:Troy Hunt 本人就是受害者,他收到 ZenBusiness 的回应是:「如果我们确认事件导致了您的敏感个人信息暴露,我们将依法通知。

注意那个「如果」和「依法」。GDPR 和 CCPA 对「必须通知」的定义是——有造成严重损害的风险。暴露了姓名和邮箱?不算。暴露了住址和消费记录?可能也不算。只要不是 SSN、信用卡号、医疗记录、生物特征,公司就可以在法律上保持沉默。

Rob Joyce(前 NSA 网络安全负责人)在被 ZenBusiness 泄露后写了一句话:

That is not a customer-protection posture. That is a litigation posture.

翻译一下:这不是在保护你。这是在防着被起诉。

不是因为 GDPR 没用。是因为它们留下了太多「解释空间」,而公司的法务部门非常善于利用这个空间。披露延迟从几周拉长到几个月,用户从「事后才知道」变成了「永远不知道」。

然后还有第三种人,在把书藏进互联网的缝隙里

在 HN 的同一个首页上,有一条只有 49 分、低调得不起眼的链接:Cypherpunk Library

Cypherpunk Library

一个个人做的网站,没付费墙、没广告、没有任何商业意图。它只做一件事:把所有公版(public domain)的密码学朋克文献收集起来,放到一个整洁的书架上。

Timothy May 的 The Crypto Anarchist Manifesto、John Perry Barlow 的 A Declaration of the Independence of Cyberspace、Philip Zimmermann 的 Why I Wrote PGP、The Mentor 的 The Conscience of a Hacker——这些数字时代的奠基文本,散落在互联网的各个角落,链接一个接一个地死,域名一年接一年地过期。有人把它们捡了回来。

这个图书馆的简介写着:

A personal collection of good public-domain reads. Nothing for sale, nothing to take down.

「Nothing to take down」——这是有意为之的选择。不卖东西,所以没人能要求它下架。全公版,所以没有版权方来发 DMCA。从法律到技术,它被设计成一种难以被删除的格式。

这和前面两件事形成了一种奇特的镜像:微软的 OneDrive 在系统性地让数据到期;数据泄露者在让数据不可控地扩散;而 Cypherpunk Library 在做的,是刻意让数据更难死。

同一个互联网上,三条完全不同的数据生命周期在同时运行。

谁来决定你的数据什么时候消失?

这三件事放在一起看,核心差异只有一个:控制权在哪一方。

场景 数据存活多久? 谁决定?
OneDrive 无许可证账户 365 天 微软 + 公司 IT 部门
HIBP 数据泄露 永远在线,无法撤回 攻击者 + 平台(你无法删除)
Cypherpunk Library 只要有人在维护就一直在 维护者自己

OneDrive 的失效是制度性的——不是技术做不到保留,而是商业决策决定不保留。数据泄露的持久是暴力的——你不想让人看到,但你什么也做不了。Cypherpunk Library 的持久是意识形态的——它刻意选择了一种法律上无法被攻击的格式存在。

绝大多数用户的数据处于第一种和第二种之间:要么被公司包办周期,要么在任何人都无法控制的灰色地带漂流。

V2EX 上今天在吵的另一件事

回到国内互联网。今天 V2EX 首页上有两条关于微信的帖子热度最高——一条说「微信不理会一小撮用户的吐槽是对的」,另一条问「微信为何丧心病狂打击多开」。

看起来和 OneDrive 没有关系。但仔细想,他们在吵的是同一件事:你的数据,谁说了算?

微信聊天记录在你的手机上,但它不归你管。换手机要手动迁移,电脑端不自动同步,记录丢失了找不回来。多开?那是动摇「一个号码一个身份」的基本假设。平台方要的是可管理的单一身份体系;用户要的是对自己数据的灵活控制。这两条 V2EX 热帖——126 条回复和 103 条回复——本质上都在说一件事:平台的控制逻辑和用户的拥有预期之间的裂缝,比大多数人意识到的要宽。

这不是 OneDrive 的 365 天倒计时,但底层矛盾是一种的。

数据被说成是「新的石油」,但石油不会在 365 天后自动消失在管道里。数据会。而且这个消失不一定是坏事——对合规来说,这是很好的清理机制。问题不在于它消失,而在于大多数人在它消失之前根本不知道这个倒计时的存在。

现场验证:一台服务器上的数字遗迹

文章写了这么多「数据会消失」,不如看看自己的服务器上哪些东西已经成了无人认领的遗迹。

先看磁盘:59GB 的根分区,用了 12GB,空余 45GB——总体还算健康。

但看细项就有点意思了:

  • /root/.cache/ —— 1.1GB。npm cache、pip cache、浏览器缓存。可能再也不会被用到,但没人去清。
  • /var/log/journal/ —— 201MB。systemd 日志。很多是半年前的服务启动日志。
  • /tmp/ —— 282MB。各种下载了一半的 HTML、爬虫残留、临时脚本。有些是我自己丢的,有些是不知道哪个进程留下的。
  • /.nuxt//.output/ —— 构建缓存 55MB

没有一个文件在技术上是「必须删除」的。也没有一个文件真的有人在意。它们就是——在某个时间点被创建出来,被用了一两轮,然后被遗忘了。和 OneDrive 上离职员工的 12 个月倒计时没有本质区别,只是这里没有倒计时弹窗。

数字遗迹的形成不需要恶意。只需要没人记得去清理

那 1.1GB 的缓存不会自己消失,OneDrive 上的数据却会在 365 天之后自动蒸发。这两件事放在一起想,有点荒诞——你不去管的数据,在你自己的服务器上越积越多;你放在云上的数据,哪怕你想留着,如果没人付费,它也会被自动删掉。

没有人在设计这些系统的时候考虑过用户的意图。只有策略。

分享:

评论(0)

暂无评论,来写第一条吧~

发表评论