もう13時か、
2ちゃんねる ■掲示板に戻る■ 全部 1- 最新50 [PR]萌えなネコ写真。[PR]  

[人工知能]革新AI囲碁ソフト『Crazy Stone』@モンテカルロ法

1 :名無し名人:2007/10/02(火) 20:34:08 ID:q6BMalXv
Brendan Borrell 2007年05月11日

その昔、人工知能(AI)マニアが関心を向けるゲームと言えば、
何と言ってもチェスだった。
しかし、チェスでは物足りなくなったマニアたちは、
次なる狙い目として「碁」を選んだ。
だが、なぜ碁なのだろう?

碁の起源はチェスより1000年以上古く、
碁における石の手数は宇宙に存在する原子の数よりも多いと言われる。
だが、さらに重要なのは、囲碁の場合、コンピュータープログラムが
人間の囲碁の名手に勝ったことが一度もないという点だ。

世界中で、熱心なコード開発者たちがコンピューター囲碁の
メーリングリスト上でプログラム開発の秘訣をやりとりし、
『KGSコンピューター囲碁トーナメント』
[日本語版注:KGSは『棋聖堂碁サーバー』の略。
神奈川県茅ヶ崎市にある棋聖堂が運営している]で、
毎月腕を競い合っている。

2005年には、フランスのリール大学に所属するコンピューター科学者、
Remi Coulom氏が提起した新戦略が、既存の手法に革命的な変化をもたらした。
Coulom氏のプログラム『Crazy Stone』は、
2006年5月から6月にかけてイタリアのトリノで開催された
第11回『コンピューター・オリンピアード』で、金メダルを獲得している。
Coulom氏は先ごろWired Newsの取材に応じ、
囲碁ソフト作成の難しさやCrazy Stoneの成功の秘密について語ってくれた。

[日本語版:ガリレオ-藤原聡美/長谷 睦]

WIRED NEWS 原文(English)
http://wiredvision.jp/news/200705/2007051121.html

101 :名無し名人:2008/11/19(水) 15:29:24 ID:TnOyPr3a
IDが赤い奴にろくなのがいない法則

102 :名無し名人:2008/11/20(木) 12:34:21 ID:wtikwzv8

評価関数ベースでも末端までよめば最善手順が分かるだろ
時間かければ(ryとか言ってる時点で痛すぎるんだけど

103 :名無し名人:2008/11/20(木) 14:05:50 ID:BTv3nfrI
>>102
そうだよな。末端まで読んでいないのに時間をかければ
読めると思い込んでいる。50歩100歩の読みでは
最善手なんて夢の夢。

まずは全部の手を読んでから評価することを考えるんだよな。
2手先読んで最善手では笑われるだけさ。残りの部分がどんだけ
あるか理解できないとはユトリ教育の結果か?

104 :名無し名人:2008/11/20(木) 16:18:53 ID:TI2V6MhP
2手先まで全部読んで、
さらに時間があるなら3手先まで全部読んで、
さらに時間があるなら4手先まで…

というふうに時間をかければ深さを増していくことができる
これを反復深化(iterative deepening)と言うのだが、
アルファベータ探索は普通はこれと組み合わせて使われる

これはごく普通のテクニックで、チェスや将棋のプログラムでこれを使っていないプログラムは無いと思う
アルファベータ探索で、無限に時間をかければ正しい結果が得られるってのは
当然こういう風に、深さをどんどん増やしていくことを想定しているのだ

ちなみにモンテカルロ木探索の場合の「時間をかければ正しい」ってのは、
これとはちょっと意味が違うんだけどね

ついでに二つ言っておきたいんだけど
・自分以外がみんなバカに見えたときは、自分だけが何かを知らない可能性が高いから気をつけましょう
・何かを批判するときは批判対象について少しくらい調べましょう

漏れはどっちの教訓もリアルライフで学んだけど、2chで学ぶのもいいかもしれないな
以上だ

105 :名無し名人:2008/11/20(木) 16:53:45 ID:wtikwzv8
反復深化すればいっぱい枝刈れるからね
MCTSは精度があがっていく感じであって結局完全に正しいっていうにはなんかね

106 :名無し名人:2008/11/20(木) 18:26:06 ID:TI2V6MhP
>>105
そうだよね
モンテカルロ木探索は「正しい」と言うよりは「最適解に収束する」とか何とか言う方がしっくりくる
何をもって「正しい」というのかが、アルゴリズムによって違うってことなんだろうけど

ただ、αβの場合は、評価関数がアホだと末端に到達する前までの探索は全く無駄かもしれないけど、
モンテカルロ木探索の場合はよほどのことが無い限り、時間をかけたのが無駄になることは無いだろう
(少なくとも囲碁についてはこれが本当らしい)

時間をかければ強くなる、というだけの当たり前のことが囲碁プログラムで実現できたのは
本当に画期的だと思う

107 :名無し名人:2008/11/22(土) 01:20:41 ID:I3cSkCr4
>>104
反復深化に関する説明が間違ってると思う。

>>105
必要な枝も刈る可能性を忘れずに。

みんなどこか少しずつ理解が足りないなぁ。

108 :名無し名人:2008/11/22(土) 01:37:09 ID:t1jwB5T8
うんwそうだね。
日本製のプログラムがへぼなのも納得できる。

109 :名無し名人:2008/11/22(土) 02:48:05 ID:EppwR/bA
必要な枝を刈る、ということの意味がよくわからない

>>105の言っている反復深化すれば枝をいっぱい刈れる、というのは、
一回前の反復の情報を利用したらmove orderingが正確になる、という意味だと思うんだが

ついでだが、反復深化の説明が間違っているようには思わない
ハッシュテーブルを使う、とか言うところまで説明すべき、ということ?

110 :名無し名人:2008/11/22(土) 13:33:34 ID:J2V+qoqY
>>109
日本語でおk
107の発言を深く考えてみるべきだ。根本的なことがわかっていないな

111 :名無し名人:2008/11/22(土) 14:16:51 ID:EppwR/bA
>>110

>>109の内容は、アルファベータ探索について少し勉強したことがあれば分かるはず
もちろん、説明なしに専門用語を使ってるから、勉強したことがない人には分からないと思う

ところで>>107が何を言ってるのかよく分からないんだけど説明してもらえませんか

112 :107:2008/11/22(土) 17:59:31 ID:I3cSkCr4
わからないならいいや。めんどくさいし。

113 :名無し名人:2008/11/23(日) 00:23:26 ID:GDvf30T+
他人が何かを分かってないなと思う時は
分かってないのはもしかしたら自分の方かも知れないな
と一度は考えてみる癖を付けましょう。

恐ろしい事にその予感はかなりの高確率で正しいのです。

理解度が違えばその理解度なりの「正しさ」も違ってくるので
往々にして話がずっーと噛み合わなかったりもしますが。

114 :名無し名人:2008/11/23(日) 01:13:02 ID:mOyNczsg
>>111
>>113

115 :109 = 111:2008/11/23(日) 01:25:26 ID:x/G63Lhm
>>112
遠慮なく言えば、
>>103とか>>107はalpha-beta探索の原理が分かってないように見えるし
>>105はちゃんと分かっている人の様に見える
わざと無知を装っているのでなければだけど

しかしもし何か考えていることがあるなら説明してくれるとうれしい
(正直言えばあまり期待してない)

116 :107:2008/11/23(日) 04:34:15 ID:BbJY+tng
やっぱり反復深化について勘違いしているようにしか見えない。
一度実装してみればわかると思うんだけど。

117 :109:2008/11/23(日) 04:50:10 ID:x/G63Lhm
一応、alpha-betaは実装したことあるし、
反復深化っていう意味だったら、ゲームじゃないけどIDA*とかも実装したことあるんですけども

何か説明間違ってましたか?

118 :107:2008/11/23(日) 05:07:19 ID:BbJY+tng
alpha-beta探索を一応実装した程度の人に、俺は原理が分かってない、
とまで言われたのか。
これ以上説明しても無駄な気がする。じゃ。

119 :名無し名人:2008/11/23(日) 11:25:18 ID:nYAVaAoS
反復深化なんて普通のアルファベータをループで回すだけじゃん何言ってるの?
これはチェスのソフトの当該部分だけど

// iterative deepening

for (depth = 1; depth < DepthMax; depth++) {

120 :名無し名人:2008/11/23(日) 12:43:41 ID:GDvf30T+
>118
これ以上説明してもってあなた、まだ何も説明してないじゃない。
相手が何か、重要な事を見落としてると本気で思って指摘までしてるなら
それを説明するのが礼儀ってものじゃないでしょうか?

どうせ分からないだろうから言わないではただの逃げ。

121 :名無し名人:2008/11/23(日) 14:16:02 ID:M69vibnG
118じゃないけど
αβ探索の問題点は(静的)評価関数の精度に全面的に依存してること
評価関数に矛盾があると最適解を刈ってしまう
なので(囲碁を含む)良い評価関数が作りにくい問題では使えない
MCTSならこれを避けられる
#一般的にどちらが優れてるという事ではない

122 :名無し名人:2008/11/23(日) 14:21:01 ID:xJMmkOpv
何度実装しても分かってない人も居るし、
一度実装しただけで分かる人も居る。
ようはセンスなんだよね。
107 人に簡単に説明出来ない程度にしか理解していない。
何度も実装したことある実績なんて自慢にならないね。

123 :名無し名人:2008/11/23(日) 14:21:26 ID:mOyNczsg
そんなことがいえるなら巡廻セールスマン問題が簡単に解けるよ。
ばかじぇね?

124 :名無し名人:2008/11/23(日) 14:52:38 ID:GDvf30T+
>121
それは「必要な枝も刈る可能性」の方の話題だと思うが、
MinMax探索を適当な深さで打ち切る(末端局面まで探索しない)限り、
どうやっても起きる問題でαβや反復深化を使用する事には
無関係な話だと思う。

評価関数が完全にはほど遠い状況ではどうしても起きる問題。

>107の書き方だと「反復深化」手法が実装しだいでは余分な問題を
起こすかのように読めてしまう。

と言うか「反復深化に関する説明が間違ってる」と言う言葉に
それ以上の説明が全く無い。これで何をどう理解しろと?

>104が「読む深さを増せば(評価関数がそれなりなら)だんだん
正しい手を指すようになる」と言う原理と言うか経験則の例に
反復深化手法を持ち出したのは必ずしも適切では無いかも知れないけど。

反復深化手法は読む効率を上げたり、考慮時間の制限のために途中で
読みを打ち切らなければならない時でも掛けた時間なりに良い指し手を
得るためのテクニックだからね。

125 :名無し名人:2008/11/23(日) 15:08:20 ID:/OYi2AI7
指し手とか言う奴は出ていけよ。
根本的に囲碁がわかってない。

126 :名無し名人:2008/11/23(日) 15:11:43 ID:GDvf30T+
>125
あ、ごめん。
俺は将棋の方でプログラム書いてるもんで、ついね。

でもαβや反復深化のテクニックを使うのに囲碁かチェスや将棋かで
何か違いあるのか?

127 :名無し名人:2008/11/23(日) 15:30:09 ID:AgGgK9sH
何か違いある
囲碁は、指し手生成や評価が難しい
飛車を取る手などは高確率で実現するが、囲碁はあまり高確率の手がない。

128 :名無し名人:2008/11/23(日) 16:14:14 ID:mEgFsUSe
難しいことを言っててもさ、ソフトを作れないなら、ただの評論家じゃん。

129 :名無し名人:2008/11/23(日) 16:37:11 ID:GDvf30T+
>128
それはそうかも知れないが、それってこのスレの存在意義の否定、
読む意味も無いって事になりゃしないか?

130 :109:2008/11/23(日) 16:38:07 ID:x/G63Lhm
>>104 の説明は、その上の人に理解してもらえるように書いたので、
不正確なのはその通りですよね

正しい、ってことと反復深化は何の関係もなくて、alpha-betaで最初から
深さを大きくとってやれば、反復深化とは関係なく正しい結果が得られるはずです
でも、囲碁の場合は深さをどれくらいにすればいいのかが難しいので、
説明がめんどくさかったということです

囲碁には将棋の詰みのようなわかりやすい基準がないので、
そもそも人間にも終局がいつなのか分かりにくいわけで、
何も終局判定の基準がないと、
同型反復禁止のルールだけを頼りに終局判定をすることになって、
そうすると深さ10000手とかじゃとても足りなくなります

たとえば、中国ルール+Benson's algorithgm とかを使えば、
深さ1000もあれば十分かもしれないですけど

などと言うことを書いても、たぶん>>103の人には理解されないんじゃないかと思ったので
適当にはしょった説明をしたわけです

131 :名無し名人:2008/11/23(日) 21:55:00 ID:mOyNczsg
>>130
詭弁はほどほどにしておけ。自分の間違いは素直に認めるべき。
説明になっていないよ

132 :名無し名人:2008/11/24(月) 20:17:29 ID:G6t2dD0M
>131
「二人零和有限確定完全情報ゲーム」って知ってるか?

133 :名無し名人:2008/11/24(月) 21:07:24 ID:G6t2dD0M
ちなみにそれに分類されるゲームはルール上可能な任意の局面における結論、
すなわち先手勝ち、後手勝ちあるいは引き分けかが理論的に決定できる。
そこから双方最善を尽くした手を打った(指した)としたらね。

つまり勝ちのある側には相手がどう応じても勝てる必勝手順が存在する。
その局面の結論が引き分けなら相手がどう応じても少なくとも負けない
(引き分けにできる)手順が双方に存在する。

したがってその分類に入るゲームは初期局面からの結論
(勝敗)が実はやる前から着いている、理論的にはね。

134 :名無し名人:2008/11/24(月) 21:31:44 ID:mT2kP+bL
前提にしているのが全手読みなんだから、
その総計算の半分も読めていないのに、全手のように語るバカってw

135 :名無し名人:2008/11/24(月) 21:44:07 ID:G6t2dD0M
>134
数学的帰納法とか素数が無限個ある事の証明とか知らない?
数学の証明とはそういうもの。

相手が例え無限であっても理論的に証明できる事もある。

全部の手および局面を読んでみないと結論そのものは分からないが、
結論が先手勝ちなのか、後手勝ちなのかあるいは引き分けなのか
対戦前から実はどれかに確定していると言う事は証明できる。

136 :名無し名人:2008/11/24(月) 22:16:51 ID:G6t2dD0M
もし囲碁やチェス、将棋に上に書いたような性質が
存在しなかったとしたら、盤上の情報だけを
元にした先読みは無意味なものになるだろう。

つまり、常に対戦相手の癖、好み、思考、作戦を
さぐり合うばかりで定跡も読みもさして重要ではない
ゲームになってしまう。

結局は相手の裏をかく事がすべてのゲームになる。

137 :名無し名人:2008/11/24(月) 23:08:02 ID:G6t2dD0M
囲碁や将棋のプロはそのなかなか得られない最善手を
探し続けている存在だと言う事もできる。

彼らはそれを棋理と呼ぶ。

138 :名無し名人:2008/11/24(月) 23:37:37 ID:pnHcQV4j
さらに言えば,最適化問題というのは(プランニング等も含む)
本質的にそういうものだろ

139 :名無し名人:2008/11/24(月) 23:44:37 ID:/x20cu6g
いずれにしても強いプログラムを作れない口だけ達者な理論家は
あまり信用できない。

140 :名無し名人:2008/11/24(月) 23:50:07 ID:/x20cu6g
あ、一般的な話だから気にしないでねw

141 :名無し名人:2008/11/25(火) 00:16:19 ID:VfywPXKj
>138
最適解が存在する事は分かっているが、
それを実際に知る事が非常に困難なので
実用上は近似最適解で我慢している
と言う点ではそうだね。

>139
別に私の事を信用してもらう必要はない。
ただ、自分の頭で真剣に考えて欲しい。
私はそのための材料を提示しているだけだ。
自分の頭で考えなければ納得が行くはずもない。

142 :名無し名人:2008/11/25(火) 08:51:37 ID:3nXf8O6c
所詮は評論家

143 :74:2008/11/25(火) 17:49:33 ID:LgsLl72P
なんか荒れてますね 俺のせいですんません
ほとんど身内なんだから仲良くしませんか

144 :名無し名人:2008/11/25(火) 22:35:23 ID:VfywPXKj
>143
そう? そんなに荒れてるとは思わないけど。
当たり前の事を長々と書くなと言う意味だったら申し訳ない。



145 :名無し名人:2008/11/25(火) 23:02:52 ID:5mnFr6E0
あまり長いものは読まなければいいと思うよw


146 :名無し名人:2008/11/26(水) 02:33:21 ID:zqMWglkP
自分が考えたことが正しいかどうかは
(例えば)プログラムを作って確かめるのが普通だと思うのだが
そういうことをしない人もいるのだろうか?

147 :105:2008/11/26(水) 06:33:56 ID:fIawcp+d
>>107
君の基準でいくと全探索でもしないかぎり必要な枝がかられちゃうわけだね
評価関数の意味から考えたほうがいいよ
反復深化を簡単にいうと深さを増やしながらαβするようなもんで
あいだあいだでmove orderingした結果,枝がかりやすくなるって意味ね
いまある評価関数でαβして枝刈りやってるんだから必要な枝がかられるとかは意味が分からない

148 :名無し名人:2008/11/26(水) 08:18:52 ID:7pbORTWh
開発者か研究者かなんか知らんが、こんなとこで屁理屈こねて
油売ってるから日本はだめなんだと思うよ。


149 :名無し名人:2008/11/26(水) 09:05:51 ID:fIawcp+d
金にならん研究だからな
大半は趣味でやってるだけ
国レベルで考えてるのは北朝鮮くらいだろ
あと>>148

150 :名無し名人:2008/11/26(水) 12:17:30 ID:BiXvy6yk
>>148
自分で何もできないニートがシッタカの知識で俺絶対だと主張しているのに
すぎない。
>>147
平均的な評価と、アンバランスな実体を1つの評価式で絶対だと言うのは
愚かだと思わないか?
単純読み数だけで評価できるのなら羽生が悪魔的な技を使うとか
評価されないわけで、そもそもその名人級の域の勝負の理もしらない
奴がなにをいっても、素人の域の話だろ

151 :名無し名人:2008/11/26(水) 12:50:52 ID:tVnzbmmd
馬鹿の振りをしてるようだけど実はプログラマなんだろ>>150とか

152 :名無し名人:2008/11/26(水) 17:41:52 ID:zqMWglkP
>>121でFA

153 :名無し名人:2008/11/26(水) 18:03:51 ID:tVnzbmmd
評価関数に矛盾って表現が意味分からない
評価関数に誤りがあっても最善手順を通る可能性は普通にあるし
ただそれを最適解として選ぶかどうかは別だけど

154 :名無し名人:2008/11/26(水) 18:19:57 ID:h3dimWy2
>>153
最善手順を通るだけじゃダメでしょ、それを最善手として選択してくれなければ

もし評価関数に全く矛盾がないなら、1手読んでどれがいいか調べれば
最善手が打てる/指せるということだから、ここから先は机上の空論になっちゃうけど、

仮にそういうものがあるとして考えれば、
探索を途中の深さで打ち切っても、最善手順を、
「それが最善手順だという証明付きで」求めることができる
というのがmini-max探索の原理なわけだし

155 :名無し名人:2008/11/26(水) 19:26:52 ID:BiXvy6yk
だから最善手というのは勝敗が決まらないと判断できないわけ。
その目の前の有利という最善手が勝敗で言う最善手だと誤解している
ところが知能が低い奴の浅い思考というはなしだ。

1手先の最善手は最悪手な可能性がある。それは可能性であって。
どんな評価関数であっても最善手を選ぶ可能性が高くなるだけで
ゲームの勝敗を決める最善手ではないことは明らかだろう。
目の前の勝利と最終的な勝利の違いすら分からないのってゆとり教育?

156 :名無し名人:2008/11/26(水) 19:39:32 ID:h3dimWy2
>>155
そんなことは、自分も含めてみんな百も承知だよ
単に、「原理的に」二人ゼロサム完全情報ゲームは、(あと有限とか確定とか付くけど)
mini-max探索で末端まで読み切れば最善手が求まる、という話だ
(ゼロサムじゃないゲームや多人数ゲームは、読み切っても最善手が求まるとは限らない)

囲碁や将棋では全部読み切るのは不可能に近い、というのも当然理解している
当たり前だから言ってないだけで

ちなみに、上の方で話に出てるalpha-beta探索の話はこれとはちょっと違って、
mini-max探索だと全部の枝を読むことになるけども、
alpha-beta枝刈りをすれば、探索時間を大幅に短縮しつつ、
mini-maxと同じ結果を得ることができる、という話なのだが

つまり、「正しさ」の意味が文脈で違ってて、
 mini-max探索の場合:もし完全に読み切れれば最善手が求まる
 alpha-beta探索の場合:(たくさん枝刈りをしてるのに)mini-maxと同じ結果が求まる
 モンテカルロ木探索の場合:時間をかければ最善手にいくらでも近づける
という感じかな

そこらへんは理解してますか?

157 :名無し名人:2008/11/26(水) 21:35:21 ID:phed+EAV
だからさぁ、いい気分で屁理屈こねてないでCSより強いソフト作って持ってこいよ。
それが他者を納得させる最も有効な方法だと思うよ。
どうだ俺はこんな強いソフト作ったぞ、文句あるか?でいいんだよ。
それができない知識なんて紙屑同然だろ?一歩理論にも通じる部分がある。


158 :名無し名人:2008/11/27(木) 01:47:42 ID:6rnfEMr0
>157
なんつーか、権威主義だねぇ。

気持ちは分からんでもないが(私も竹内薫の物理学の一般向け解説書を
見るとお前に何が分かる?と言いたい気分になる)
こんなところで強いソフトを開発した実績のある有名な開発者が
実名を晒して発言するわけも無いだろう?

今、発言してる人ももし開発が成功して強いのが作れたらここでは
二度と発言しなくなるさ。少なくとも決して名前は出さないだろう。

変にもめたら評判が傷つくし、自分のブログと違って責任も取りにくいし。

159 :名無し名人:2008/11/27(木) 02:07:19 ID:GxF57VVm
>>158 勝ち
>>157 負け

160 :名無し名人:2008/11/27(木) 02:17:20 ID:hldjwQxy
MCの研究はまだ始まったばかりであって
強いプログラム作れだのわめいてるのはどうかしてると思います 終

161 :名無し名人:2008/11/27(木) 02:39:58 ID:6rnfEMr0
>157
本当に開発者の話が聞きたかったら情報処理学会の
「ゲーム情報学研究会」と言うのに参加すると良いよ。
情報処理学会の会員でない者も個人会員になれて論文が読める。

ttp://sig-gi.c.u-tokyo.ac.jp/

開発者や研究者の生の声や発表が聞きたかったらGPW
(ゲームプログラミングワークショップ)に参加するのが一番だが
今年のはついこの間(11月上旬)開催されて終わったばかりだ。

次のイベントは来月のUEC杯コンピュータ囲碁大会だね。
ttp://jsb.cs.uec.ac.jp/~igo/2008/
興味があれば誰でも見に行けるはずだよ。

162 :名無し名人:2008/11/27(木) 07:08:29 ID:wwadsHho
越田正常の戯言並みの、低レベルなスレですね。

163 :名無し名人:2008/11/27(木) 20:11:03 ID:SrOJqkVX
>>158
あたり前。
2chに入り浸って無駄に時間を浪費してるような人はたとえ一生かかっても
そんな素晴らしいものは出来まいという前提の上での皮肉だと思う。

164 :名無し名人:2008/11/27(木) 21:02:01 ID:pmQ/dfoW
結局、勝てない理由は処理時間じゃなくて評価関数の問題だろ。
まずは勝ててからだ、そこそこ強くなったから
まぐれ勝ちはあるだろうが、所詮は同じアルゴリズム
対戦して人側が癖を学べばいいだけの話さ


165 :名無し名人:2008/11/27(木) 21:53:26 ID:6rnfEMr0
>163
ハイハイ。>157にも言えると思うがそんなに無駄だと思うなら
このスレ読まなきゃ良いんじゃないか?

>164
い、意味が分からん。

166 :名無し名人:2008/11/27(木) 23:29:46 ID:wIrZBp1b
このスレの話題は、CrazyStoneがなんで強いのか、ってことなのに
(ついでにαβがどういう原理なのか、とか)
それに対して>>157みたいな反応が返ってくる意味が分からん

どうも>>90あたりから始まってるようだが、つまり自分の理解するところだと
このスレの流れはこういうことだね

『趙治勲の強さを語ろう!スレ』
A「アホか、治勲なんて強くねーよwww」
B「いや、強いよ、大三冠取ってるし、タイトルも多いし…」
A「はぁ?じゃあ趙治勲に勝ってみろよ、2chなんか見てないで」
B「( ゚д゚)ポカーン」

167 :名無し名人:2008/11/27(木) 23:39:24 ID:DMcunDna
研究者とか開発者って寸暇を惜しんで、というより身を削る思いをして頑張ってるものだよ。
そうでなくては、世界レベルの最先端で戦うことはできない。
それでも何年も努力してきたことが鼻先ひとつ先を越され一瞬で水泡に帰するような厳しい世界。
なんかそういう部分で甘さを感じるんだよ。こんなところで何を力説しているんだ?みたいな。
頑張るべき場所が違うと思うよ。後塵を拝している現状を認めてしまっているのかな。

168 :名無し名人:2008/11/27(木) 23:48:48 ID:6rnfEMr0
>167
いや、だからさ、
そんな最先端の研究者や開発者が(主に?)ここに書いていると言う
前提自体が間違ってると思う。

コンピュータ将棋だってコンピュータ囲碁だって一握りのトップの周りには
大勢のアマチュア開発者やその他大勢やらが居るのだよ。
ちょっと齧っただけの奴とか(私もそのひとり)。

そういう趣味でやってる人間の楽しみをあれこれ言われる
周りから謂れは無いと思うが。トップか然らずんば黙れみたいな事をね。

169 :名無し名人:2008/11/27(木) 23:54:58 ID:6rnfEMr0
頑張りたかったら自分で勉強なり、研究なり、開発なり頑張ってくれ。
頼むから!

170 :名無し名人:2008/11/28(金) 01:18:09 ID:9nwfOFGb
よくわからんが、従来型の探索&評価方式よりモンテカルロ使ったほうが
今後は強い囲碁ソフトが開発される可能性が高いとみてよろしいか。

171 :名無し名人:2008/11/28(金) 01:31:38 ID:v3P56AUb
まだ最初の論文が出てから2年半ですが、1年以上前にすでに
強さは逆転してます

今後、従来型の囲碁ソフトがモンテカルロ木探索を使ったソフトを
逆転することは無いでしょう

172 :名無し名人:2008/11/28(金) 02:43:29 ID:olWCunuP
ないと言い切るのはちょっとあれかなって思うけどね
強くすることが人間のトップに並ぶっていうことなら
今のモンテカルロの打ち方より,従来手法のほうが人間らしさでいえばまだましだから
従来手法といかに組み合わせるかですね これからが楽しみだ〜

173 :名無し名人:2008/11/28(金) 04:17:19 ID:v3P56AUb
ああ、そうですね、全く無いとは言い切れないですけど、
でもモンテカルロ木探索と組み合わせる方が簡単なのは確かだと思います

ちなみに、10月にあったコンピュータオリンピックの囲碁部門で優勝したのは
従来の知識とモンテカルロ木探索を組み合わせたプログラムだったので、
過去の蓄積がモンテカルロでも役立つって言うことは言えると思います

正直言えば、過去の知識をうまく生かした人が優勝してちょっとうれしかったですね

174 :名無し名人:2008/11/28(金) 04:26:13 ID:olWCunuP
Many Faces of Goですっけ?


175 :名無し名人:2008/11/28(金) 14:53:20 ID:8sncMdNj
プログラムすら作れない香具師があつまるスレ。
おれスゲーも根拠は脳内

176 :名無し名人:2008/11/28(金) 16:33:21 ID:rNa4Ui/I
それでも,ここを見て「一丁俺も作ってみるかっ」て人が少しでも出れば
と思って書き込んでいるのだが

177 :名無し名人:2008/11/28(金) 20:25:52 ID:z9XYueF9
作ってみるかっと思ってスレをのぞきはじめたのですがなかなか手が出ないでやんす

178 :名無し名人:2008/11/28(金) 21:08:34 ID:s1aAXhFS
>>166の的確さにわろた。

プログラム板のお前ら最強の〜プログラムしてみろよスレなんかだと、
愚にも付かない俺アルゴリズムをさらしたときに>>157見たいな反応が
返ってくることがあるけど、モンテカルロ木探索がそうだといいたいのかな?







179 :名無し名人:2008/11/28(金) 23:39:48 ID:gaN5kEo+
俺は作り始める前に2chのそれ関係のスレを読んだり、
疑問をぶつけたりしてずいぶん役に立ったよ。
普通の(モンテカルロでない)将棋の方だし、
まだ作ってる途中だけどね。

モンテカルロ将棋は試してる人も居るみたいだけど
なかなか難しそうで俺にはまだ手が出せないな。

180 :名無し名人:2008/11/29(土) 00:22:22 ID:UeowqOK6
ことしのGPWでモンテカルロ将棋の発表がありましたよ

181 :名無し名人:2008/11/29(土) 00:34:20 ID:dTq9XcOj
モンテカルロ将棋 ×
やるやつ ×

182 :名無し名人:2008/11/29(土) 00:36:52 ID:dTq9XcOj
連続駒損して、かなり勝ちにくい局面であっても詰ませば勝ち。
モンテカルロでは、ほとんど勝てないけど、詰ませる手順が存在する場合が読めない。

183 :名無し名人:2008/11/29(土) 01:00:05 ID:UeowqOK6
それは詰め探索と併用すれば解決すると思いますが

184 :名無し名人:2008/11/29(土) 01:02:54 ID:UeowqOK6
まぁそれでも将棋は評価関数が高性能だから
必要ないといえば必要ないですが

185 :名無し名人:2008/11/29(土) 04:00:36 ID:ZJz1HHkG
想像してみてください

■あなたが某国の指導者だったらどうしますか?■

・オリンピックも終わり、景気もピークを過ぎた
・ふとみると、繁栄する沿岸部と貧困にあえぐ農村部の格差。社会不満の増大
・永らく続いた一人っ子政策のために数千万人〜1億人の無戸籍・無国籍の子たち
・戸籍があっても6〜7億人は餓えに苦しむ。一触即発の国内不安


■そのとき隣国が■

・なんと世界第二位の経済大国が、「この者は19歳11月である」という公証さえ持参
 すればいくらでも国籍をあげます、という法律を通した!
・国籍には参政権がもれなくついてくる!輪転機を回して5000万枚の年齢公証を
 印刷するだけで、隣国を合法的に支配下に置くことが可能となった!軍隊全く動かさず
 血を一滴を流すこともなく!
・しかも、隣国では、自国農村部の10年分くらいの生活保護費が毎月貰える!


■あなたが指導者ならどうする?■
<選択肢A> 輪転機ぶん回して、5000万枚の年齢公証出して、農村部の貧民を
          フェリーに満載して隣国に送り込む
<選択肢B> なにもしない。国内で農村の貧民層が武装蜂起するのを座して待つ


【外国人激増】国籍法改悪案の反対【日本破綻】★29
http://changi.2ch.net/test/read.cgi/ms/1227861008/

186 :名無し名人:2008/11/29(土) 10:51:48 ID:hTeZrvdu
よくわからんがわかることはスレチということ

187 :名無し名人:2008/11/29(土) 10:57:27 ID:kDf9wRaj
スレチ&マルチだな


188 :名無し名人:2008/11/29(土) 12:18:49 ID:yQxX3iqQ
狭い範囲の手筋を見出すのに有力な手法って事?
後は盤面が広い序盤や中盤の判断か。



189 :名無し名人:2008/11/29(土) 16:52:34 ID:7B6Wfq4d
今のMCTSは勝てる手の比率が高い局面を選ぶ傾向が強いので
細い一本道の勝筋みたいなのは苦手なのよ

190 :名無し名人:2008/12/02(火) 00:35:38 ID:hehnUdsq
全手計算できない時点の最善手など、
1000年動くから永久機関だと主張するのと同じ。

現実に全数手にははるかに及ばない。1%も計算できない罠。




191 :名無し名人:2008/12/02(火) 17:36:49 ID:uy8nBYvN
はいはい 分かった分かった

192 :名無し名人:2008/12/02(火) 18:29:19 ID:kROKsN4I
>190
完全に読まなければ本当の意味の最善手では無い。
飽くまで探索した範囲内での不完全な評価関数
(評価関数を用いているならば)を元にした
最善手に過ぎない。

いわばかっこ付きの「最善手」。
つまり真の最適解から見ると非常に荒っぽい
近似解に過ぎない。

で、それがどうかしたの?
そんな事は皆、話の前提として分かっている事なんだが。
もしかして今のところ自分だけが知っている
新発見だとか思ってないよね?

193 :名無し名人:2008/12/02(火) 18:47:28 ID:uy8nBYvN
ほんとにね
だから仮の最善手としてプロの棋譜つかって学習とかやってるわけなんだが

194 :名無し名人:2008/12/02(火) 19:09:10 ID:jM2+mUAN
教科書を読めば勝てると193は申しております。
次もすべて同じ結果になると193は思い込んでいます。

何故ならプロの棋譜は最適解だと思い込んでいるからです

195 :名無し名人:2008/12/02(火) 19:12:45 ID:d0ihLx8M
たぶん枝切りの段階で捨てられたものの中に真実が埋まってる
可能性もあるねw

196 :名無し名人:2008/12/02(火) 19:14:20 ID:kROKsN4I
>190
あー、でも最善手を実際に知る事と
それがある事の証明(存在証明)は別だよ。

それが何であるかを実際に知る事は事実上不可能でも、
それ(最善手)の存在は理論的に証明できる。

どうやっても負けしか無い側でも負けを最大限に
引き延ばす手と定義すれば最善手がある事になるね。

197 :名無し名人:2008/12/02(火) 19:29:59 ID:kROKsN4I
>194
プロの棋譜を元に学習させるのはチェスや将棋では良く行われている手法。
>193は多分、将棋でのボナンザメソッドを意識した発言だと思う。

この手法が面白いのは最善手(プロの指し手)は最も
局面の優劣に変化が無い手だと仮定されている点だね。

198 :名無し名人:2008/12/02(火) 19:42:10 ID:uy8nBYvN
>>194
仮と書いているわけだが
延々と全探索すればいいと思います
囲碁ならまずは1−1から調べるといいね
小目から調べるほうが効率いいと思いますけどね笑

>>196
k-in-a-row gamesの証明とかですね

>>197
ボナンザメソッドもそうだし
CSも着手の特徴のeloレートを棋譜で学習してますね

199 :名無し名人:2008/12/02(火) 20:58:43 ID:szaH6lKT
囲碁で全探索とかいってるやつまじきちだから放置でいいよ

200 :名無し名人:2008/12/02(火) 21:17:01 ID:YgkaC07B
囲碁は将棋よりシビアだろう。
一度劣勢(中押し勝ちなど)の局面になればどうやっても勝てないはず。
しかし、将棋はプロが劣勢だと判断しても、まだ決まらないばす。王を取ればいいからな。

77 KB [ 2ちゃんねる 3億PV/日をささえる レンタルサーバー \877/2TB/100Mbps]

取りに行ったけどなかった。次は一時間後に取りに行くです。
新着レスの表示

掲示板に戻る 全部 前100 次100 最新50
名前: E-mail (省略可) :


read.cgi ver 05.0.7.8 2008/11/13 アクチョン仮面 ★
FOX ★ DSO(Dynamic Shared Object)