囲碁王者を倒したAlphaGoをゼロから始めて30時間で打ち負かす「AlphaZero」、将棋・チェスの最強ソフトもサクッと制圧

1: しじみ ★ 2018/12/08(土) 17:04:46.85 ID:CAP_USER

囲碁の世界チャンピオンを打ち負かしたソフト「AlphaGo」が正常進化して、「AlphaZero」が誕生しました。人間による手助けを一切必要としないAlphaZeroは、ルールしか知らない状態から自己教育することで、たった30時間でAlphaGoを完膚なきまでに打ち負かす強さに成長可能。囲碁だけでなく、数十時間の独学でチェス・将棋でも、既存の最強ソフトを圧倒する強さへと進化できます。

AlphaZero: Shedding new light on the grand games of chess, shogi and Go | DeepMind
https://deepmind.com/blog/alphazero-shedding-new-light-grand-games-chess-shogi-and-go/

囲碁チャンピオンを打ち負かしたソフト「AlphaGo」は、自分で自分を鍛えられる「AlphaGo Zero」へと進化しました。自分と戦いつつ実力をメキメキ向上させられるため、自己学習可能なAlphaGo Zeroでは人間の関与が不要になりました。

囲碁に特化していたAlphaGo Zeroは、あらゆるボードゲームに対応できる汎用性を持つ「AlphaZero」へと進化しました。

そして、DeepMindによって2018年12月7日にScienceで発表された論文では、AlphaZeroが、チェス・将棋・囲碁の3つの代表的なボードゲームにおいて、これまでに開発された最強のソフトウェアを数日で打ち負かす能力に成長できることが明らかにされました。

A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play | Science
http://science.sciencemag.org/content/362/6419/1140
no title

2016年に開催されたチェスプログラムの世界大会TCECシーズン9を制した「Stockfish」とのイロレーティングの比較。AlphZeroは自己学習開始から4時間でStockfishを上回りました。
no title

将棋のチャンピオンソフト「elmo」との対決では、2時間後にはAlphaZeroが上回ったとのこと。
no title

囲碁チャンピオンのイ・セドルに勝ったときのAlphaGoを、たった30時間で超えました。
no title

強化学習で自分を鍛えるAlphaZeroは、試行錯誤のプロセスを通じて成長します。ニューラルネットワークが必要とするトレーニング時間はゲームによって変わり、チェスでは約9時間、将棋では約12時間、囲碁では13日間必要だとのこと。

トレーニングされたネットワークは、モンテカルロ木探索(MCTS)と呼ばれる検索アルゴリズムで最も有望な「手」を選びます。AlphaZeroでは従来のエンジンに比べて考慮する検索数が圧倒的に少ないとのこと。例えば、チェスのStockfishが1秒間に6000万ポジション検索するのに対して、AlphaZeroは6万ポジションしか検索しないとのこと。伝統的なAIエンジンでは計算可能な解決法がない場面に直面すると迷いが生じるのに対して、AlphaGoではこの欠点がなく、「直感」が要求されるような場面で無類の強さを発揮します。
https://i.gzn.jp/img/2018/12/07/alphazero/b01_m.png

従来型のAIエンジンと異なるAlphaZeroは、その強さだけでなく繰り出す「手」の独創性も際立っているとのこと。生身の人間ではもはや歯が立たないレベルに達したAlphaZeroを相手にすることで、これまでプロプレイヤーが考えもしなかった新鮮な局面が現れるため、人間のプレイヤーの世界を広げる役目を果たしているとDeepMindは述べています。

人気の3つのボードゲームを完全制覇してその汎用性を示したAlphaZeroですが、今後は製薬、材料設計、バイオテクノロジーなどの科学技術を中心とした、世界的な課題の解決を目指す壮大な”ゲーム”を攻略するために、研究・開発される予定です。

AlphaZero: Shedding new light on the grand games of chess, shogi and Go https://youtu.be/7L2sUGcOgh0

GIGAZINE
https://gigazine.net/news/20181207-alphazero/

21: ニュースソース検討中@自治議論スレ 2018/12/08(土) 18:53:40.21 ID:67t4r7gl

>>1
最強の将棋ソフトをたったの二時間で制圧

たったのニ時間・・・!!!

森田将棋とか内藤九段将棋秘伝とか何だったんや

 

2: ニュースソース検討中@自治議論スレ 2018/12/08(土) 17:11:20.29 ID:bbLdYTkI
Alphaは怖いほど凄いのに、
GoogleHomeはなんであんな馬鹿なの?

 

4: ニュースソース検討中@自治議論スレ 2018/12/08(土) 17:15:56.30 ID:kewRzKrr
>>2
バカを相手に学習しちゃうからでは?

 

13: ニュースソース検討中@自治議論スレ 2018/12/08(土) 17:57:24.88 ID:qVP75F/N

>>4
天才現る!

AlphaZeroも>>4には敵わない!

 

40: ニュースソース検討中@自治議論スレ 2018/12/08(土) 20:49:56.70 ID:5r4SgBXo
>>2
Google Home「自分でググれよ、ご主人様。それが最適解だ」

 

14: ニュースソース検討中@自治議論スレ 2018/12/08(土) 17:58:21.84 ID:TeDK6A9T
宇宙流の棋譜だらけ

 

15: ニュースソース検討中@自治議論スレ 2018/12/08(土) 18:01:56.46 ID:Sinyo2BM
自己学習タイプのAI強い 定石定跡とかの人間的な概念はいらんな
他の分野でもこのタイプのものは増えそう
先入観いらんしな一からだと

 

18: ニュースソース検討中@自治議論スレ 2018/12/08(土) 18:20:33.46 ID:/7DzipTt
>>15
ボードゲームは極端にいえばマルバツゲームを複雑にしただけで
数学的にモデル化できるから可能なのよ
実世界で教師無しの学習は難しいしぞ

 

16: ニュースソース検討中@自治議論スレ 2018/12/08(土) 18:08:41.57 ID:Xu9GXttf
全数の0.001%すら計算していないそれは、
別のアルファGOを一瞬で打ち負かす学習したソフトだってできることを逆に説明しているのと同じである。

 

17: ニュースソース検討中@自治議論スレ 2018/12/08(土) 18:20:01.97 ID:97uAgFy7
ロボット兵や軍事戦略に利用できそう

 

19: ニュースソース検討中@自治議論スレ 2018/12/08(土) 18:39:39.31 ID:IvLNGDns
囲碁では画像認識を活用したらしい、白黒のパターンだから、まあQRコードみたいなもんだ、読みやすいだろ、コンピュータには

 

22: ニュースソース検討中@自治議論スレ 2018/12/08(土) 18:54:18.78 ID:dGazNIkM
摩訶大大将棋のCOMやってくれ

 

23: ニュースソース検討中@自治議論スレ 2018/12/08(土) 19:05:10.85 ID:kwFtwCD5
汎用性が生まれたってことだよなこれ
このままいけば人間の汎用性を超えるのか

 

26: ニュースソース検討中@自治議論スレ 2018/12/08(土) 19:10:46.87 ID:ydaexbvK

AlphaZeroどうしを戦わせたら

どうなるのかな?

 

27: ニュースソース検討中@自治議論スレ 2018/12/08(土) 19:20:15.70 ID:Vap8cdjl

>>26

そら、AlphaZeroが勝つだろ (笑)

 

43: ニュースソース検討中@自治議論スレ 2018/12/08(土) 20:53:58.84 ID:QpAKCFGs
>>26
まだこんな事を書き込む糞バカがあるのかよ!
このゴミクズさっさと死ねばいいのに。

 

47: ニュースソース検討中@自治議論スレ 2018/12/08(土) 21:35:39.19 ID:Wa/n3S/J
>>26
そら勝率が5割同士になるだろ

 

29: ニュースソース検討中@自治議論スレ 2018/12/08(土) 19:30:33.47 ID:A6DCthJt

スゴイとは思うが、一方で消費電力も凄いんだろうな

アルファ碁の電気使用量が「どこかの街並み」な25万ワット
(人間の脳は起きてる時で20ワット)

年間のサーバー使用料が30億円だっけか

これを大きく超えるのではなんかもにょるわ

 

74: ニュースソース検討中@自治議論スレ 2018/12/09(日) 03:09:29.82 ID:u9kZcFni

>>29
なるほど
優れていても省電コスパは
人間のがまだ優れてるんだな。

こういう採算性ってのが
新技術の壁になると予感

 

33: ニュースソース検討中@自治議論スレ 2018/12/08(土) 20:06:16.95 ID:TsiI3gUJ
初手天元はともか、くいきなり辺に打つのには驚いた。
人間のプロ相手に数百連勝してるね。

 

34: ニュースソース検討中@自治議論スレ 2018/12/08(土) 20:22:04.47 ID:ZfO5ZK0Y
これって春ぐらいからなんか情報の更新ある?

 

35: ニュースソース検討中@自治議論スレ 2018/12/08(土) 20:30:36.03 ID:h+u5E8RF
街並みの設計とか高層ビルの設計とか
まったく無駄のない高効率のものを組み上げてくれそうだなあ

 

36: ニュースソース検討中@自治議論スレ 2018/12/08(土) 20:39:45.85 ID:V8BglqBH
プロ棋士の意義がどんどん薄れていくな
鍬一本で自動運転のトラクターと勝負するようなものだ

 

39: ニュースソース検討中@自治議論スレ 2018/12/08(土) 20:44:18.60 ID:zL9KzDDy
>>36
乗馬、自転車、自動車等の人力より速く走れる文明の利器が在ろうとも
マラソン及びマラソンランナーの意義が消えてないのと同じように
対人競技のプロとしての棋士の意義は変わらないのでは?

 

49: ニュースソース検討中@自治議論スレ 2018/12/08(土) 21:42:43.16 ID:m0oOnKKm
今の将棋ルールならAIが勝つだろう
しかし量子将棋なら量子将棋なら

 

50: ニュースソース検討中@自治議論スレ 2018/12/08(土) 21:45:24.61 ID:w1C+oCBE
素人が出鱈目に打っても勝てるのかね

 

51: ニュースソース検討中@自治議論スレ 2018/12/08(土) 21:57:25.17 ID:awKISrH9
最初に職を失うのは気象予報士

 

57: ニュースソース検討中@自治議論スレ 2018/12/08(土) 22:58:51.84 ID:Ka36Vhem
>>51
美乳なら引く手あまた
これはAIには真似できない

 

96: ニュースソース検討中@自治議論スレ 2018/12/09(日) 12:09:23.26 ID:dAeSe+Lg
>>51
人間が失敗するのは許せても
AIが失敗するのは許せない人達のおかけで
むしろ最後まで残る方の職業なんじゃww

 

52: ニュースソース検討中@自治議論スレ 2018/12/08(土) 22:46:12.45 ID:yWjEMVWy
50年もしたら現在の数学の未解決問題はすべて解決されていて
人間には理解できない定理がどんどん作られているのだろうね

 

53: ニュースソース検討中@自治議論スレ 2018/12/08(土) 22:49:36.12 ID:m0oOnKKm
>>52
何かAIに過度の期待してない
やってることは桁数の多い計算と莫大なデータベースであって新しい理論や定義、定理を導いてるわけじゃないぞ

 

60: ニュースソース検討中@自治議論スレ 2018/12/08(土) 23:21:19.89 ID:IOpLO4Is

>>53
>やってることは桁数の多い計算と莫大なデータベースであって新しい理論や定義、定理を導いてる

病気の治療法をとんでもない方法を組み合わせて作った、というのはあったなあ

定理を作るのはどうだろうね
解くのは出来るかも知れんが、これは重要そうだ!という定理を作るのは色々と数学書の各種定理を読み込ませないといかんなあ

この分野にこういう定理があるのにこの分野に同様の定理が無いのはおかしい!類似するものは出来ないか?
みたいなのを引っ張り出せないかなあ?

 

79: ニュースソース検討中@自治議論スレ 2018/12/09(日) 06:22:08.28 ID:bCsk6g9v

>>60
「概念」の認識・生成ができるかだなぁ
そのためには「常識」が要る

こうして芋づる式に「自我」まで必要になるかも…

 

55: ニュースソース検討中@自治議論スレ 2018/12/08(土) 22:57:36.10 ID:mQFtT8Jm
ボードゲームで神々の黄昏に到達。

 

56: ニュースソース検討中@自治議論スレ 2018/12/08(土) 22:58:10.80 ID:c1+a5t+L
てか実際に勝ってから言えよ
まだぽんぽこと勝負すらしてないんだろ?

 

58: ニュースソース検討中@自治議論スレ 2018/12/08(土) 23:11:22.74 ID:ZfO5ZK0Y
>>56
そんなゴミでは勝負にならん

 

61: ニュースソース検討中@自治議論スレ 2018/12/08(土) 23:22:57.42 ID:OdzMypeP

こうなると、問題は「強さに限界」があるかだな

これ以上強いのは現れないという限界が存在し得るか?
この問いを解いたら、10円あげる

 

62: ニュースソース検討中@自治議論スレ 2018/12/08(土) 23:24:34.10 ID:HKQ/Z28R
チェスの世界は知らんが、
囲碁将棋はやたら一般人に説教垂れる不快な奴が多いから
バンバン機械に負かされてほしい。

 

63: ニュースソース検討中@自治議論スレ 2018/12/08(土) 23:28:53.22 ID:PrFXx6YL
人類に残された時間は後僅か

 

65: ニュースソース検討中@自治議論スレ 2018/12/08(土) 23:55:15.90 ID:8nDvQoFe
将棋は王を取られたら勝ち
囲碁は陣地の少ない方が勝ち
このルールを教えたらどーなるの?

 

78: ニュースソース検討中@自治議論スレ 2018/12/09(日) 03:41:59.03 ID:mDzrD1z8

>>65
将棋も囲碁も決着がつかない
将棋の場合、玉を取らないように動いていくので
王手がかからないので逆の意味で詰まない。

囲碁の場合は、黒番、白番ともに、地を作らないように
辺から順番に石を置いていくため、盤面に石が敷き詰められるだけ。

 

68: ニュースソース検討中@自治議論スレ 2018/12/09(日) 00:27:19.50 ID:1JpCFOIC
将棋は王手を連続5回やらないと王様が詰まないように
ルール変更すべきだな。
これで王手を見逃しても即詰めは無くなるし、良いこと
づくめで、将棋の奥深さが増すだろう。

 

98: ニュースソース検討中@自治議論スレ 2018/12/09(日) 13:03:46.32 ID:9NhoPsUM
>>68
いや、王が居なくなったら新し王を立てるのが現実世界だろ
それと同じで王を取られたら金を裏返して新しい王にするとかすればいい
王のなりてが無くなったら負け

 

69: ニュースソース検討中@自治議論スレ 2018/12/09(日) 01:22:50.07 ID:DrXTiEmU
「オレはゼロ!オレを超える者はオレしかいない!!」

 

71: ニュースソース検討中@自治議論スレ 2018/12/09(日) 01:59:03.40 ID:CAIYjSjA
製薬とかバイオテクノロジーは難しそう
なにせ
何をやったら人間にはどういう変化がでるのか
というルールが明確じゃないから
もちろん、コンピュータが得意そうなことがらについては
人間を超える能力を発揮することがあってもおかしくないけど

 

73: ニュースソース検討中@自治議論スレ 2018/12/09(日) 02:53:34.84 ID:OPADgLX2
AIがどんなに強くなろうとも
自身が囲碁や将棋を指しているなんてことは絶対に認識できない
それを認識できるのは今のところ人間だけ
なので人間の指す囲碁将棋に意味はないのではなくて
人間が指すから意味がある

 

75: ニュースソース検討中@自治議論スレ 2018/12/09(日) 03:18:15.80 ID:Qs9ZBz1Q

最強ソフトを負かすのに、自己学習で数日もかかるという、
DeepMind社のAlphaZeroとやら、ちょっと待ってろ。

さてと、そろそろ、本気でアップするかな。
AlphaZeroに完勝無敗のボードゲームAIを。

 

76: ニュースソース検討中@自治議論スレ 2018/12/09(日) 03:23:50.00 ID:Qs9ZBz1Q

AIが、ボードゲームの世界を制覇したからには、
次は、芸術・音楽の世界を凌駕するものが出てくるだろう。

例えば音楽でいえば、もちろん「既存の譜面通りに美しく演奏」などという芸術のゲの字もない模倣「技術」ではなく、すべての演奏家、作曲者をうならせ、聴衆を感動させる、文字通り「音楽」を作り・奏でる、AI。

 

77: ニュースソース検討中@自治議論スレ 2018/12/09(日) 03:32:20.36 ID:Qs9ZBz1Q

現在でも合成音声が歌うのはあるけど、ヒットチャート上位を独走するなんてことはない。
しかし近い将来必ず、オールAIによる作詞、作曲、演奏、歌の楽曲で、ヒットチャート上位を賑わすものが巷にあふれるだろう。
最初はAIを前面に出さず偽名で、どこの誰だろう?状態で、巷に登場し、しばらく正体は不明なままだろう。

ボードゲームのレベルのなまやさしさではないけれど。

 

81: ニュースソース検討中@自治議論スレ 2018/12/09(日) 09:57:19.19 ID:VUItmwZx
これは、自然のデータを全部打ち込めば
あらゆる自然法則を導き出してしまうんではないんだろうか

 

83: ニュースソース検討中@自治議論スレ 2018/12/09(日) 10:05:31.48 ID:Zv4I9sbp
完全な手はAIとはまた別の話だがな
まあ量子コンピュータなら可能かも、という話は出てるな
別に今のコンピュータだって時間がかかるだけで理論的にできないわけじゃないしね

 

87: ニュースソース検討中@自治議論スレ 2018/12/09(日) 10:34:52.62 ID:Gep6Xhf1
やがてこういうボードゲーム系は全ての手数が解析されて、どっちが先手を取るかで
勝敗まで決まってしまう時代が来るのかね。

 

89: ニュースソース検討中@自治議論スレ 2018/12/09(日) 10:43:28.85 ID:fqtV+lIK

チェス(笑い)に並ぶAIの王道アプリケーションと言われてる「コンピュータ内科医」は
IBMが大失敗してたよな・・・試験導入したすべての病院で誤診しまくりでえらいことになったらしい
自動運転も意味不明なところに突っ込んだりする事故がどうしても無くせないようで・・・

そうこうしてるうちにムーア則も破綻してしまったから、ハードの向上が進展する余地は
もう残されて無いしという・・・結局、制約が多いボードゲーム以外では人間を越えるのは不可能だったのか?

 

90: ニュースソース検討中@自治議論スレ 2018/12/09(日) 11:09:54.63 ID:2gjMIaaf
童貞がいきなり加藤鷹になる話か

 

91: ニュースソース検討中@自治議論スレ 2018/12/09(日) 11:32:44.67 ID:4AdxJrqa
人間がその機能としての役割を失ったら消滅するのも必然なのかな
それが種としての一応ゴールなのか

 

95: ニュースソース検討中@自治議論スレ 2018/12/09(日) 12:06:22.15 ID:AN21YNyt
秘技「ちゃぶ台返し」よりも強い?

 

転載元https://egg.5ch.net/test/read.cgi/scienceplus/1544256286/