显示更新内容

我担心泄露的那23T可能只是冰山一角,至少可以基本确定的是有其他人通过同一个漏洞下载到了除那23T以外的数据。
在之前出售数据的同一个论坛,一位名为“ChinaSeller123"的用户在出售”Passport SHGA: Database of foreign nationals who have visited China - 到过中国的外国人数据库“,这个数据库共有4400万条数据。评论里有人问他这个数据库是否包含在之前泄露的23t数据里时,他回答说”This comes from the same source (now down) however ChinaDan does not appear to have it “ (ChinaDan就是出售23t数据的黑客)所以若他所说是真的,便证明了确实有人下载了那23t之外的数据。
哦对了,这个到过中国的外国人数据库的sample是Obama的信息。纵是美国总统,到了中国也逃不过个人信息泄露。

而在CNN的报告中提到的LeakIX网站上也列出了这次泄露的相关信息。其中有一个数据库暴露时间从去年4月23日到今年7月1日,leak size是7.7g,但其实查看发现这个数据库在今年6月之前大小是26.4T,这与CNN提到的在今年6月遭受攻击和勒索是吻合的。再根据这个数据库的包含的几个tables的标题,很明显那23t数据正是来源于此。
但这只是其中的一个,单单大小以TB为单位的就有另外的60.8t和92.3t。这个60.8t的数据的tables标题大多为地名拼音+拼音缩写或者英文+日期组成,出现的地名主要是上海的各个区和省份,主要是安徽江苏浙江这几个上海周边省份。除此之外很难看出是什么内容。

我们无从知道也很难想象这些数据究竟包含了什么样的信息,也不知道这些信息会被用到什么地方。或许如果被仅仅用于电信诈骗都是一件值得庆幸的事。每个踏足过这个国家的人都有风险,但每个人似乎都完全无能为力。

上面提到的LeakIX列出的本次泄露数据库:leakix.net/search?scope=leak&q
@ly_safeb 参考了象友的这条嘟嘟m.cmx.im/@ly_safeb/10860169863 和其提到的CNN报道

A quick wrap up of CNN reporting on China Data Leak:
1. 2021年4月起,LeakIX(一个公开数据库搜索引擎)就侦察到这个数据库。无需密码,只要注册就可以进入下载。直到上周四黑客售卖数据,这个数据库的入口才被关闭。
2.无法得知在这14个月内有多少人进入并下载过数据。两位西方专家表示,在黑客卖数据前他们就知道这个数据库的存在。另一位专家曾经在网上寻找公开数据时,误入过这个数据库,下载过一份包含970M中国市民的数据。(救命... 就是说黑客卖那么便宜,其实也是因为很多数据早就外泄了?)
3. 本周一阿里云对CNN说他们正在调查并会公布进展,但周三不再接受采访。
4.专家意见是,过错在数据持有者,而非存储平台。

明天看看还有没有其他外网报道。匪夷所思到不敢相信。

edition.cnn.com/2022/07/05/chi

就是说工作几年才有挑公司的机会吧……不然明年我还得重新走一遍难熬的找工流程,我会死掉的 :azukisan008:

显示全部对话

胸无大志了,只要给我得体的薪水,用Excel 工作也没什么不好(。)

之前看见有象友在讨论gender neutral pronouns,分享一下我很喜欢的研究pronouns的语言学家Kirby Conrod的博客:kconrod.medium.com/ask-a-lingu

以及我特别喜欢的一篇博文,是关于singular they应该用themself还是themselves的:kconrod.medium.com/intermediat

阿姆斯特丹所有的好餐厅基本今晚都约满了,所以晚上去了印度姑娘推荐的月满楼。她负责点菜,点了我很想吃的一切!反正公司付钱,我们几乎把菜单都点了一遍。
我老板吃完脆皮烤鸭和脆皮鸡有感:这让我如何回归普通鸡肉!
我笑死。

跟同事聊天也很开心,我们法国区的主管说她很早以前当实习生的时候工资都比我高,我再次笑死 :azukisan009:

巴基斯坦同事跟我弟弟蛮像的,就别人应两句他能叭叭说半天,听他讲话还蛮有意思,感觉去过很多国家。他也是蛮努力的,跟我差不多大,从本科到硕士都是一边做实习一边读书,履历看起来丰富得不行。

上班以后最大的感想,没空约会,不想交友,成年人社交圈子越来越小不是没有道理的(?

同组的越南姑娘,我说我投实习投了二十家,她说还好,她找正职投了一百家
:ablobbounce: 她学的商业分析,是我校赞助的一个独立学院(我有点不太明白)。她说实习能不能转正看我运气,实习结束的时候有没有职位空缺。那我只能cross fingers了………

见了组长的老板,澳大利亚人,好帅啊,说话也好好听,就是净是一些我听不懂的话(

卫生间有棉条,办公桌可以升降,椅子也好舒服,救命我爱上班(?

上班第三天听本网络安全公司介绍,发现这种规模的数据泄露还是挺罕见的()

林二汶大概算是太不懂此时去政治化爱“‘国”已经蛮让人失望的了……姑且当她傻白甜吧 :azukisan033:

就是每一列都是dict ,但是有一个dict 的values是另一个dict ……所以我用pandas读不出来,用json.load也读不出来,难道我要回归原始loop吗,这不可以。

显示全部对话

救命,那个datasets 怎么是json,我没学过json,用pandas打不开。 :azukisan008: 我学的是什么data science

今天去烫头,小红书推荐的日本美发沙龙。跟姐姐聊天,她说她去年十二月刚自愿从东京调到阿姆斯特丹,所以才开始学英语。她的英语不是很好,只不过对才学半年的人来说已经很好了。我过了一会才明白她不怎么讲话是英语不太好的缘故()她说刚来的时候不是很适应,她不喜欢冬天的天气,英语不好又要跟顾客讲话,不过她有很多中国客户,明明这边有很多日本人开的美发沙龙,我说中国的社交媒体上,搜荷兰烫发基本只有她们。
她的手艺很好!才剪完头还没烫我就很满意了。本人学日语中道崩殂,她问我ありがとう还记得吗,我说ありがとう、ございましだ。她很高兴。
贵是有点贵啦……不过这可是阿姆斯特丹,贵也是应该的(?)

今天去看梵高博物馆
我:我好impressed !
房东:没错,他是impressionist
嘎嘎嘎嘎
但是真迹真的太震撼了,我好喜欢浮世绘时期的。我高中时候学他和高更的作品和故事,是真没想到有一天能看到他们两个人的真迹的

@hommes_infame
评论1
“是真的,这个作者在他的发布源里贴了部分样本和索引集。
我下载解包之后导入了excel,发现了三个各含25万条数据的手机号+姓名+地址+身份证号,有效数据总计74万6800多行,最老的数据居然有1930年代生人,某些数据还注明了这些数据来自某某人口办单位,可能是核算或人口普查时留痕的。之后我随机抽取了15行数据,把他们的手机号用“支付宝转账”的姓名校验功能作了验证,结果每一个注册的支付宝实名账号都是真实存在的,每一个人都能被验证(即样本里数据真实)。数据非常杂,地域分布全国,地址也看不出来是快递地址还是备案住址。目前看不出来实用价值,除非是虚假注册账号之类需要这种,但是10BTC的售价成本显然高昂,真搞诈骗的买不起这么贵而且还没经过处理加工的数据。

在第二个包里我找到了“设法联系车主将车撤离”、“报警处理不立案”等字眼,初步判断这是110报警调度台、12345热线或其他应急服务电话调度的数据库数据,还有部分数据是公安局派出所数据,数据构成是“报警原因、出警结果”,偷车和民事纠纷记录特别多。

第三个包里除了身份证信息,所有行数据共同指向一个叫“oss-cn-xx/xxx/xxxx/xxxxx”的数据库,各地都有,应该是个能共同访问的数据库。从文件名判断,里面所有人都有的数据:1.莫名其妙的照片,有出境照片、有证件照、有工作照片,还有在逃人员的照片;2.宗教信仰、民族;3.宾馆酒店入住人脸识别登记信息;4.死亡证明;5.未成年人照片‘’6.驾驶证、执业证;7.不知道代表什么的莫名其妙的照片;8.居住证,身份证照片

接下

……干啊,林二汶我还能理解,在我标准里还没很过火,Super moment 怎么回事,学习王菲吗

Match了一个比利时小哥,他好可爱呜呜呜。我跟他聊天的时候一直在笑 :azukisan008:

显示更早内容
雾海

雾海是一个开放且不限制讨论主题的非营利性中文社区,名字来源于德国浪漫主义画家 Friedrich 的画作《雾海上的旅人》。生活总是在雾海中吞吐不定,不管怎么艰辛,他还是站在了这里!希望大家在这里玩的开心~