您当前的位置:网站首页>投名状,马赛克-最健康的常见食物,每日分享

投名状,马赛克-最健康的常见食物,每日分享

2019-07-06 06:32:06 投稿作者:admin 围观人数:137 评论人数:0次
栗子 晓查 发自 凹非寺 
量子位 报导 | 大众号 QbitAI

机器学习全赖调参?这个思路现已过期了。

谷歌大脑团队发布了一项新研讨:

只靠神经网络架构查找出的网络,不练习,不调参,就能直接履行使命。

这样的网络叫做WANN,权重不可知神经网络。

它在MNIST数字分类使命上,未经练习和权重调整,就到达了92%的准确率,和练习后的线性分类器体现适当。

除了监督学习,WANN还能担任许多强化学习使命

团队成员之一的大佬David Ha,把作用发上了推特,现已取得了1300多赞:

那么,先来看看作用吧。吐

作用

谷歌大脑用WANN处理了3种强化学习使命。

(给每一组神经元,同享同一个权重。)

第一项使命,Cart-Pole Swing-Up

这是经littlstar典的操控使命,一条滑轨,一台小车,车上一根杆子。

小车在滑轨的规模里跑,要把杆子从天然下垂的状况摇上来,坚持在直立的方位不掉下来。

(这个使命比单纯的Cart-Pole要难一些:

Cart-Pole杆子的初始方位便是向上直立,不需求小车把它摇上来,只需坚持就能够。)

难度体现在,没有办法用线性操控器 (Linear Controller) 来处理。每一个时刻步的奖赏,都投名状,马赛克-最健康的常见食物,每日同享是依据小车到滑轨一头的间隔,以及杆子摇摆的视点

WANN的最佳网络 (Champion Network) 长这样:

它在没有练习的状况下,现已体现优异:

体现最好的同享权重,给了团队非常满意的作用:只用几回摇摆便到达了平衡状况。

第二项使命,Bipedal Waker-v2


一只两足“生物”,要在随机生成的道路上往前走,跳过凸起,跨过陷坑。奖赏多少,就看它从出发到挂掉走了多长的路,以及电机扭矩的本钱 (为了鼓舞高效运动) 。

每条腿的运动,都是由一个髋关节、和一个膝关节来操控的。有24个输入,会辅导它的运动:包含“激光雷达”勘探的前方地势数据,本体感遭到的关节运动速度等等。

比起第一项使命中的低维输入,这儿或许的网络衔接就更多样了:

所以,需求WANN对从输入到输出的布线办法,有所挑选。

这个高维使命,WANN也优质完成了。

你看,这是查找出的最佳架构,比方才的低维使命海姆立克急救法杂乱了许多:

它在-1.5的权重下奔驰,长这样:

第三项使命,CarRacing-v0

这是一个自上而下的 (Top-Down) 、像素环境里的赛车游戏。

一辆车,由三个接连指令来操控入宅:油门、转向、制动。方针是在规则的时刻里,经过尽或许多的砖块。赛道是随机生成的。

研讨人员把解说每个像素 (Pixel Interpretation) 的作业交给了一个预练习的变分自编码器 (VAE) ,它能够把像素表征压缩到16个潜投名状,马赛克-最健康的常见食物,每日同享在维度。

这16维便是网络输入的维度。学到的特征是用来检测WANN学习笼统相关 (Abstract Associations) 的才能,而不是编码不同输入之间显式的几许联系。

这是WANN最佳网还珠格格第二部络,在-1.4同享权重下、未经练习的赛车作用:

尽管路走得有些弯曲,但很少违背跑道。

而把最佳网络微调一下,不必练习,便愈加顺滑了:

总结一下,在简略程度模块化程度上,第二、三项使命都体现得优异,两足操控器只用了25个或许输入中的17个,疏忽了许多LIDAR传感器和膝关节的速度。

WANN架构不止能在不练习单个权重的状况下完成使命,而且只用了210个网络衔接 (Connections) ,比当时State-of-the-Art模型用到的2804个衔接,少了一个数量级。

做完强化学习,团队又瞄准了MNIST,把WANN拓宽到了监督学习的分类使命上。

一个一般的网络,在参数随机初始化的投名状,马赛克-最健康的常见食物,每日同享状况下,MNIST上面的准确率或许只要10%左右。

而新办法查找到的网络架构WANN,用随机权重投名状,马赛克-最健康的常见食物,每日同享去跑团子,准确率现已超过了80%

假如像刚刚说到的那样,喂给它多个权值的合集,准确率就到达贺联了91.6%

比照一下,经过微调的权重,带钢铁侠2来的准确率是91.9%,练习过的权重,能够带来94.2%的准确率。

再比照一下,具有几千个权重的线性分类器:

也只是和WANN彻底没练习、没微调、只是喂养了一些随机权重时的准确率适当。

论文里着重,MINST手写数字分类是高维分类使命。WANN体现得非常超卓。

而且没有哪个权值,显得比其他值更优异,我们体现得非常均衡:所以随机权重是可行的

不过,每个不同的权重构成的不同网络,有各自拿手分辩的数字,所以能够把一个具有多个权值的WANN,用作一个自给自足的合集 (Self-Contained Ensemble) 。

完成原理

不练习权重参数取得极高准确度,WANN是怎么做到的呢?

神经网络不只有权重偏置这些参数,网络的拓扑结构、激活函授大专函数的挑选都会影响终究作用。

谷歌大脑的研讨人员在论文最初就提出质疑:神经网络的权重参数与其死亡棺材怎么走图解架构比较有多重要?在没有学习任何权重参数的状况下,神经网络架构能够在多大程度上影响给定使命的处理方案。

为此,研讨人员提出了一种神经网络架构的查找办法,无需练习权重找到履行强化学习使命的最小神经网络架构。

谷歌研讨人员还把这种办法用在监督学习范畴,仅运用随机权重,就能在MNIST上完成就比随机猜想高得多的准确率。

论文从架构查找goal、贝叶斯神经网络、算法信息论、网络剪枝、神经科学这些理论中取得启示。

为了生成WANN,必须将权重对网络的影响最小化,用权济源李某富重随机采样能够确保终究的网络是架构优化的产品,但是在高维空间进行权重随机采样的难度太大。

研讨人员采取了“简略粗犷”的办法,对一切权重强制进行权重同享(weight-sharing),让权重值的数量削减到一个。这种高效的近似能够推进对更好架构的查找。

操作过程

处理了权重初始化的问题,接下来的问题便是怎么收查找权重不可知神经网络。它分为四个过程:

1、创立初始的最小神经网络拓扑群。

2、经过多个rollout评价每个网络,并对每个rollout分配不同的同享权重值。

3、依据功能和杂乱程度对网络进行排序。

4、依据排名最高的网络拓扑来创立新的群,投名状,马赛克-最健康的常见食物,每日同享经过竞赛作用进行概率性的挑选。

然后,算法从第2步开端重复,在接连迭代中,发生杂乱度逐步增加的权重不可知拓扑(weight agnostic topologies )。

拓扑查找

用于查找神经网络拓扑的操作遭到神经进化算法(NEAT)的启示。在NEAT中,拓扑和权满足重值一起优化,研讨人员疏忽权重,只进行拓扑查找操作。

上图展现了网络拓扑空间查找的具体操作:

一开端网络上懒人版糖醋排骨是最左边的最小拓扑结构,仅有部分输入和输出是相连的。

然后,网络按以下三种办法进行更改:

1、刺进节点:拆分现有衔接刺进新节点。

2、增加衔接:衔接两个之前未衔接的节点,增加新衔接。

3、更改激活函数:重新分配躲藏节点的激活函数。

图的最右侧展现了权重在[2,2]取值范投名状,马赛克-最健康的常见食物,每日同享围内或许的激活函数,如线性函数、阶跃函数、正弦余弦函数、ReLU理性等等。

权投名状,马赛克-最健康的常见食物,每日同享重仍然重要

WANN与传统的固定拓扑网络比较,能够运用单个的随机同享权重也能取得更好的作用。

尽管WANN在多项使命中取得了最佳作用,但WANN并不彻底独立于权重值,当随机分配单个权重值时,有时也会失利。

WANN经过编码输入和输出之间的联系起作用,尽管权重的巨细的重要性并不高,但它们的一致性,尤其是符号的一致性才是要害。

随机同享权重的另一个优点琅琊是,调整单个参数的影响变得不重要,无需运用依据梯度的办法。

强化学习使命中的作用让作者考虑推行WANN办法的使用规模。他们又测试了WANN在图画分类根底使命MNIST上的体现,作用在权重挨近0时作用欠安。

有Reddit网友质疑WAN听云轩生意惨白N的作用,关于随机权重挨近于0的状况,该网络的功能并不好,先强化学习试验中的具体体现便是,小车会跑出限制规模。

对此,作者给出解说,在权重趋于0的状况下,网络的输出也会趋于0,所以后期的优化很难到达较好的功能。

传送门

原文链接宁财神:
https://weightagnostic.github.io/

源代码:
https://github.com/wei苏格兰牧羊犬ghtagnostic/weightagnostic.github.io

AI内参|重视职业开展

AI社群|与优异的人沟通

量子位 QbitAI 头条号签约作者

'ᴗ' 追寻AI技能和产品新动态

喜爱就点「在看」吧 !


the end
最健康的常见食物,每日分享