如果阿法狗和阿法狗下一盘的话会是什么结果？

阿法狗

阿法狗会

死机

结果

34 条回复 • 2017-01-05 23:01:54 +08:00

1

mofet

2017-01-05 09:56:28 +08:00

你看不到的时候它一直在自己跟自己下棋。

2

ethanlu

OP

2017-01-05 10:00:31 +08:00

@mofet 所以都是和？

3

RqPS6rhmP3Nyn3Tm

2017-01-05 10:03:40 +08:00 via iPhone

……这玩意的学习过程主要就是自己和自己下棋，然后学习

4

qiayue

PRO

2017-01-05 10:04:00 +08:00

今天读读日报上有一篇讲得比较细致，看完你就明白了

5

ycge234

2017-01-05 10:07:23 +08:00

当然是有输有赢，赢的多了那个就可以当下个版本了···

6

laoyuan

2017-01-05 10:11:28 +08:00

想象一下自己给自己调参数，然后两个参数下 100 盘，输了的参数淘汰，继续下一调。。

7

ethanlu

OP

2017-01-05 10:14:34 +08:00

@qiayue https://daily.zhihu.com/story/9123439

8

jmc891205

2017-01-05 10:17:09 +08:00

7

把上万只阿尔法狗关在同一个房间里厮杀
能站到最后的那个就被称为狗中之王:P

9

Mark24

2017-01-05 10:21:51 +08:00

他一直和自己下啊，自我学习。

10

grayon

2017-01-05 10:26:09 +08:00

然后 AlphaGo 就变成了 Master

11

hackerwgf

PRO

2017-01-05 10:36:07 +08:00

@jmc891205 想起了这个 https://www.zhihu.com/question/26688751/answer/52400076

12

debiann

2017-01-05 10:50:26 +08:00 via iPhone

你没自己跟自己下过棋么，这是自我提高的过程啊

13

markx

2017-01-05 10:56:51 +08:00

结果就是赢的继续是阿法狗，输的什么都不是。

14

SuperMild

2017-01-05 11:05:30 +08:00 via iPad

输的版本被舍弃，赢的版本继续撕杀，这不就是养蛊吗！

15

deadEgg

2017-01-05 11:10:15 +08:00

感觉楼上很多都不了解深度学习。。

和版本一点关系都没有，阿法狗的版本不是自己迭代的。阿法狗是一个很多层的神经网络架构。版本只和开发调整了网络架构有关。

和自己下棋就像是自己和自己全力玩游戏而已。产生的结果是可以作为样本的，自己下棋会让自己变得更强为啥呢？就是因为样本越来越大。

16

zuotech

2017-01-05 13:29:06 +08:00

这个他们早就测过了,AlphaGo 联机版 VS 单机版的胜率是 70% , 单台对战胜率应该是 50%咯

17

BOYPT

2017-01-05 13:31:42 +08:00

这不是测不测过的问题， AlphaGo 的下棋过程每一步全都是自己跟自己下,

18

UnisandK

2017-01-05 13:33:52 +08:00

@ycge234 阿法狗：你们不明白我为什么能下赢你们吗？因为你们是为了爱好在下棋，而我是为了生命啊。。

19

BeSmile

2017-01-05 14:01:45 +08:00

这注定是一场没有结局的战争，一盘棋下一个多世纪

20

quericy

2017-01-05 14:13:16 +08:00

@jmc891205
@grayon AlphaGo 就变成了孙一峰....

话说狗就快要打星际了,拭目以待

21

ayconanw

2017-01-05 14:13:41 +08:00

2

说胜率 50%的估计不懂围棋。
目前黑棋贴 7.5 目（或 6.5 目）是人类的凭经验定的，然而人类的围棋经验还远远不足，所以这个贴目未必合适。
alphago 自己跟自己下，要么是执黑胜率远超执白，这说明贴目贴少了；要么是执白胜率远超执黑，这说明贴目贴多了

那么有没有一个贴目 x ，可以让 alphago 自己跟自己 50%呢？
我认为是没有的，因为胜负只有两种状态。比较大可能是贴 x 目黑大概率胜，贴 x+0.5 （具体 0.几都无所谓，因为盘面目数只有整数）目白大概率胜

22

stcasshern

2017-01-05 15:36:33 +08:00

这就是学习过程。。。

23

easyzhao

2017-01-05 16:03:15 +08:00

阿法狗之所以这么厉害就是因为阿法狗一直在和阿法狗下棋

24

ovear

2017-01-05 16:18:24 +08:00

感觉阿法狗玩星际比人类有优势啊，精确到毫秒级别的运营。。

25

hoythan

2017-01-05 16:53:39 +08:00

阿尔法狗每下一子都是跟自己博弈无数把后的最佳结果.

26

malkavia

2017-01-05 16:55:19 +08:00

@ayconanw 不懂围棋的人表示完全看不懂。。。

27

ayconanw

2017-01-05 16:59:58 +08:00

@malkavia 就是最后计算目数的时候，后下的人（白棋）要加 7.5 目，因为先下的人有优势

28

malkavia

2017-01-05 17:14:34 +08:00

@ayconanw 这回懂了：） thx

29

Cytion

2017-01-05 17:30:25 +08:00 via Android

@quericy 孙一峰：阿尔法狗你下面凉不凉快？啊？

30

LeeCloud

2017-01-05 17:54:41 +08:00

就像高手过招，对视十分钟，一方卒。。。

31

mortal

2017-01-05 18:55:09 +08:00

@quericy 一家之主阿法狗，厚颜无耻阿法狗，为什么阿法狗打星际这么好？因为它是真瞎子啊（大雾

32

chiv2

2017-01-05 22:14:24 +08:00

@ovear 会限制 APM 所以考的是战术选择？我觉得 AlphaGo 会搞出来很多奇葩战术。

33

scriptB0y

2017-01-05 22:40:13 +08:00

会出现更厉害的阿发狗

34

t6attack

2017-01-05 23:01:54 +08:00

3 年前， DeepMind 在自主增强学习算法上有了一个突破。这是“深度学习”领域，最接近 AI 的一个研究方向。
其中一个令人振奋的成果，就是不去由程序员编写传统的固定下棋算法。而是初始化一个空白的深度神经网络系统，然后让 AI 自我对弈，自己学会了下棋。之后通过无限自我对局，不断完善自身。

DeepMind 的论文引起了 Google 的关注，随即以超过 4 亿美金的价格收购了 DeepMind 。