大家是否会好奇,最近很火的AI画画是怎么学会画图的呢?
这就要涉及到两个方面了!一个是能生成出像“图”一样的数据(生成模型),一个是要听得懂我们想要它生成什么,并给出对应的结果(条件生成模型)。
首先来说说看如何生成出像图一样的东西!如果之前看过我写的GAN相关的文章:
那么你应该能大致上猜到,一个生成模型先吞进大量的数据(巨量的人类真实图片),然后再学习这些数据的分布,去模仿着生成一样的结果。机器学习呢讲到核心无非就是这么回事,难点终究是在如何设计模型让模型能更好学到这样的分布上。
如果是VAE,那就是和原图计算差距,所以生成的结果总是比较模糊。而GAN因为引进了判别器,生成器的图片需要骗过判别器,被当作真实的图片,于是它生成的结果肉眼上看会更加逼真。但是GAN由于要训练对抗网络,实在是太不稳定了,面对吞噬了网络剧量数据的超大规模网络来说非常难以控制。这就是为什么现在的AI画画普遍使用另一个新潮的生成模型——diffusion model。
Diffusion model生成图片的过程看似很简单,其实背后有一套非常复杂的统计原理。复杂到我至今没看懂,所以我就先不写了。让我来解释一下简单的部分!
图一是diffusion model生成图片的过程。右边是一个正常的图片,从右到左做的事情是在逐次叠加符合正态分布的噪声,最后得到一个看起来完全是噪声的图片。由于每次加噪声只和上一次的状态有关,所以是一个马尔科夫链模型,其中的转换矩阵可以用神经网络预测。
从左到右做的事情是一步步去除噪声,试图还原图片,这就是diffusion model的生成数据过程(inference)。
那么为了达到去噪的目的,diffusion model的训练过程实际上就是要从带有高斯噪声的图片中还原图片,学习马尔科夫链的概率分布,逆转图片噪音,使得最后还原出来的照片符合训练集的分布。模型的loss使用极大似然估计来计算模型参数,将其问题转换为求解Variational Upper Bound,这部分和VAE类似,且我也没看懂,故略过不谈。
这个去噪的网络是如何设计的呢?我们可以从叠加噪声的过程中发现,原图和加噪声后的图片尺寸是完全一样的!(废话)于是很自然能想到用一个U-net结构(如图二)来学习。U-net是一个类似auto-encoder的漏斗状网络,但在相同尺寸的decoder和encoder层增加了直接的连接。以便于图片相同位置的信息可以更好通过网络传递。在去噪任务中,U-net的输入是一张带噪声的图片,需要输出的是网络预测的噪声,Groundtruth是实际叠加上的噪声。有了这样一个网络,我们就可以预测噪声,从而去除掉它还原图片。(带噪声的图片=噪声+图片)
这就是diffusion model生成图片的原理啦!是不是很简单呢!但是背后的数学推导我无论如何都看不懂呢,希望有人来教教我。
——part 2——
主持人:我们先聊一下,北京抗议的人是谁,做了什么,然后可以聊一下政府是如何回应的。
杨希璠:在我去的时候,岸边都被封了。21点的时候计划要开始,但是第一批人很早就去了。100到200人左右,她们在离桥100到200米的地方聚集,是一群年轻女孩子。她们开始把蜡烛放在地上,进行悼念乌鲁木齐受害者。警察来了,把我们隔开了所以我都不知道她们已经开始了。年轻人都来了,20到30岁,这里就像是柏林的Mitte(注:柏林的中心)一样的地方。大家没有大喊口号。更多的小客车来了,我们知道这些车里都是警察。
主持人:这些北京的嬉皮士年轻人是怎么抗议的?
一开始的半小时是静默的抗议,因为我们都不知道下游发生了什么。警察从到来,就说因为疫情,你们不能在这里聚集,赶紧离开!
主持人:你说中国人不可以游行,中国也没有游行相关的法律。那么你解释一下白纸意味着什么可以吗?
杨希璠:是的,中国几乎没有言论自由和新闻自由。政府掌握了所有公开发声的渠道,写就所有的历史。共产党的领导删除了中国人的记忆,所以我们举起了白纸。我们可以从各个角度去理解白纸的意义。一开始的几十分钟我都不知道自己应该说什么。然后我们听到点蜡烛的女生喊起口号,习近平千岁千岁千千岁,我要做核酸,共产党万岁!以前的口号是我不要做核酸。在我们这一侧河岸的女孩子们喊起口号之后,南侧河岸也有人聚集起来,尽管那边有很多警察,他们开始点起手机的手电筒,大喊,我们也在,我们听到你们了,我们看到你们了,我们和你们站在一起!北边的人看到之后也开始把手机电筒点亮,两边开始互相呼喊回应。表达我们是在一起的,我们站在一起!
警察一开始是在南侧阻止人们聚集,还抓了几个女孩子。河岸南侧的人离开了河岸上了桥,来我这边。人们聚集在河岸南侧的时候,桥上全是国际记者和摄像。就在这个时候又个年轻女孩开始分给大家A4纸,大家开始把白纸举起来。此刻大概是快到晚上10点了,这个时刻就是一个无组织的集会开始变成抗议的转折点。
*杨希璠播放了当时的录音,人们大喊牛逼!牛逼!并且开始欢呼*
@bigbrothercat 想起来口语老师是菲律宾的,她之前有吐槽过她周围的人都让自己的小孩跳很性感的舞,穿很少的衣服,她很不能接受。
通过苹果备忘录写博客:
https://montaigne.io
通过邮件写博客:
https://www.hey.com/world/
通过文本文件和命令行写博客:
https://lists.sh
通过极简的在线文字编辑器写博客:
https://bearblog.dev
通过开源的笔记软件写博客:
https://listed.to
在既传统也新颖的平台写博客:
https://hashnode.com
都可以使用自定义域名,都可以备份自己的文章。
翻译一下杨希璠记者在das Politikteil和时代周报两名德国记者里分享在北京参加亮马桥抗议的经历。她讲着讲着有点激动,开始哽咽了,我也听哭了。
我不是专业翻译人士,翻译粗糙,如果我有错漏希望象友指正!
标题“不要核酸要尊严!“
——part 1——
主持人:今天我们要讲一下我们什么时候录制的。现在是德国时间12月1日7点36分,北京已经是7小时后的下午了。
我们今天要紧急报道中国令人惊讶的情况,过去几天发生的抗议是我们根本无法想象的,自从三十年前1989年广场屠杀之后,中国从未有过这样的景象。我们今天要讨论一下中国为什么会发生多个城市大规模的抗议。这是一个历史性的时刻。现在我们甚至看到了中国民主的希望。
今天的嘉宾是时代周刊驻华记者杨希璠,主持人是tina和Heinrich。
杨希璠播报了“绿码,核酸一天”的电子女声,解释了这句话的含义。这是人们在进入餐厅,公共交通时必须扫的码,检察的人要检查健康码,绿码才能进入。健康码是一个非常令人费解的系统,在中国的健康监测系统是混乱的,有些功能完善,有些不好用。
我们现在想讲述一下抗议爆发的夜晚,在短短的几个小时时间就发生了那么多事情。空气中有那么多东西。人们是愤怒的,怀疑的,被压迫的,但是同时也有希望。这些都是无计划的,在中国,人们无法注册并宣传抗议。(注:在德国抗议是可以向警察局报备并得到警力支持的)
主持人:周日有一个在你家附近的抗议,你什么时候知道家里附近有抗议的?
杨希璠:完全是一个巧合,一开始我是看到有人在上海直播。我也想去参加,但是我住在北京。那天晚上我几乎没有睡好,在晚上3点我醒了,本来晚上我是不看手机的,但是那天我上了个厕所,就看到了一个视频。在上海的乌鲁木齐路,我在上海住了五年所以我了解这条路。在视频里有年轻的上海人,有些戴了口罩,有些没有,他们在喊:共产党下台,习近平下台!我太惊讶了,这种口号我从未听过。我立刻意识到现在有什么事情正在发生。我根本睡不着,和我的同事yaqi yang聊了一下,我发现她也还没睡,并且几分钟之后她就找到了instagram上的抗议直播。我们就各自在家看直播,我们两个人都非常惊讶,第二天我们问自己,这意味着什么?
主持人:后来在北京发生了什么?
杨希璠:在北京第二天也出现了抗议,我们下午早些时候知道了会有人在亮马河抗议。亮马河离我住的地方非常近,只有几百米。我去了聚集点,我想这根本就不是什么好地方,附近都是使馆区,到处都是警察。我也不知道,我根本想象不到这天在北京会有什么发生,因为大家知道上海抓了很多人,北京会有很多警察出警。21点开始周围都是警车。至少我在这天看到四小时之后,亮马河岸边还有民警和便衣。
首先他是恐惧的,这是久违的被摆到了公共层面的恐惧——这种恐惧触及了这个系统根本性的脆弱、即习与中共的合法性来源——这恰恰证明彭载舟是对的、最早在上海街头喊出「下台」的人群是对的。直指根本的政治性的公共表达,对这一切的荒谬公开地说不,才是最具动员力与生命力的关于语言与身体经验的勇气「启蒙」。恐惧的天秤中那个隐形的砝码现身了 ,虽然这同时意味着这个依旧强大无比的极权机器的疯狂反扑和更加严防死守的管控。
同样让人想叹一声久违的是这个反应短暂地回到了理性独裁者的逻辑,虽然它只是蜻蜓点水的一瞬,是猝不及防下的一个回神的激灵,因为非理性原本就是权力集中到一定程度后的必然。即便有什么延续性,这也丝毫不值得庆祝而只进一步说明我们处境的可悲,这么多人道灾难的堆积才终于让「亲自指挥」的某一个人理解呼号与疼痛的关联或者找到台阶,而这甚至成了许多人眼中足堪庆贺的胜利——这实在是自我期许上堕落得足够久、与正常的公共生活想像隔绝得足够久、在大环境与具体生活除了指向更坏其他全然无法预判的泥淖里翻滚得足够久,才可能习得的生存惯性。
我心里一直无法摆脱的一条时间线关于规划中2020年全面建成的社会信用系统,这个因为covid在公共讨论层面不如前些年热烈、却恰恰因为covid得以堂而皇之彻头彻尾实现的几乎超越任何反乌托邦小说设定的电子监狱。这是无论习或者官僚集团都无法放弃的甜头、是没有covid也有其他借口加诸所有人的电子镣铐、是早在边疆预演的帝国回旋镖。过去十年以及更久的时间线已经不断向我们证明,自欺欺人对应的只有更彻底更系统性的剥夺与更难以预估的灾难。我们要谈论的难道只是防疫政治、要追问的难道只是这三年吗?
乌鲁木齐东MV(曲:皇后大道中 改编:佚名)
在看《天气好的话,我会去找你》
https://neodb.social/movies/2785/
随着大家越来越注重自己的隐私,会注册另一个或多个邮箱。这里分享几个我会用的小技巧。
1、每次注册新邮箱后都给一个固定邮箱发送一份固定内容,可以是自己喜欢的短文,或者是一封信。
这样以后忘记密码,也无法使用注册手机号码、密码提示时,可以提供这封邮件的题目和内容,可以很快帮助客服确认自己的身份以找回密码。
【多次经历证明非常有效】
2、使用多平台密码记录软件。我目前用Bitwarden的免费功能,完全足够。iOS、Mac、浏览器、window通用。只用记得一个密码就好。
3、利用邮件转发功能。如你填写[email protected]为你的邮件。那么所有发往这个邮件的都会自动转发给你真实邮件地址。
我目前在用
https://duckduckgo.com/email/settings/autofill
免费,且非常便利。避免泄露邮箱与密码。
waiting for the day comes