Alpha Go Zeroの論文の翻訳　その5

Posted on 2018 年 11 月 27 日 by 後藤暁子

うわぁ。

以前、下記を書いて、「まだまだ続くよ！」とか言ってましたが…

Alpha Go Zeroの論文の翻訳　その4

7月20日のことでした。(;^ω^)

もう4か月も経ってるやんけ！！！( ﾟДﾟ)

いやー、光陰矢の如し。7月末からいろんなことがあったなぁ…( ˊᵕˋ )

…と、ついつい楽しい夏の思い出を思い返しちゃいましたが、本題は、Alpha Go Zeroの論文の翻訳の最後を書くことでした。

仕事でもAIの開発を進めておりまして、少し詳しくなったと思います。

では、Go!

原文はこちら。

https://www.nature.com/articles/nature24270.epdf

前回の続きということで、付録的な、「METHODS」という部分の後半になります。

Domain knowledge　というところからですね。ではGo!

Domain knowledge

Domain knowledgeとは、専門知識のことである。碁のプログラムでいえば、碁のうちかた、どうやって強い手を繰り出すか、というような専門知識のことである。

Alpha Go Zeroの一番の功績は、専門知識なくして人間を超える知力を達成したということにある。

この功績を明らかにすべく、Alpha Go Zeroが使っている専門知識をトレーニングプロシージャーやMCTS内にかかわらず、数え上げてみることにする。

これらは、ほかのゲーム（マルコフゲーム　プレーヤーが1対1で進める手によって勝率などが左右される、オセロ・将棋・碁などのゲームの総称と思われ。）に使うときは、置き換えられるものである。

①ゲームのルール

Alpha Go Zeroはゲームのルールについては、完全に知っている。MCTSのポジションのシミュレーションや最終手を打った時のスコアをつけるのに使われている。

ゲームは両方のプレーヤーがパスしたときと722手進んだ時に終了する。また、プレーヤーはルールにのっとって、有効な手を打つ必要がある。

②スコアリング

Alpha Go ZeroではMCTSのシミュレーションとセルフプレイのトレーニングの最中にTromp-Taylorスコアリングを使っている。

なぜかというと、韓国式・日本式・中国式にせよ、人間のスコアリングはよく定義されてないからである。

ちなみにAlpha Go Zeroで採用しているのは中国式である。（この辺、私が囲碁わからないのでよくわからなかったです(;´･ω･)）

③盤面

盤面は、19×19の画像的なイメージで扱われる。ニューラルネットワークはこのボードに合わせた形になっている。

④盤面の回転など

碁のルールは盤面を回転しても反転しても盤面の強さは変わらない。

それを利用して、MCTSの途中で、盤面の回転と、反転状態もデータの中に入れることができている。

komiっていうものを抜かせば、碁は色を取り換えてもなりたつ。色を変えても成り立つことにより、盤面をどちらのプレーヤーから見るか、と言ったことが成り立たせられる。

以上が、Alpha Go Zeroが使っている専門知識の全部である。Alpha Go Zeroがディープニューラルネットワークを使っているのは、MCTSの末端のノードを評価するときと、手を選択するときだけ。

ロールアウトポリシーも使ってないし、ツリーポリシーも使っていないし、MCTSは他のヒューリスティックだったり専門知識によるルールによって評価されたりもしない。

ルール違反の手は使わない。プレーヤーの「目」を埋めることもしない。（多分、碁の話と思われ）

このアルゴリズムはランダムな初期パラメーター（ニューラルネットワークに入れるやつ）で始められた。

ニューラルネットワークの構造は、先進的な画像認識の構造である。ハイパーパラメーターは学習の中で変わっていく。

MCTSの探索パラメーターは1個前にトレーニングしたニューラルネットワークを使ったセルフプレイを最適化するために、ガウス過程最適化（でいいのかな？）を使って選択されていく。

より大きい実行のために（40ブロック、40日かける実行）MCTSの探索パラメータはより小さい実行でトレーニングされたニューラルネットワーク（20ブロック、3日）を使って再最適化される。

トレーニングのアルゴリズムは人間が介在することなく、自主的にアップデートされていくのである。

Self-play training pipeline

Alpha Go Zeroのセルフプレイのトレーニングパイプラインは3つに分かれていて、全部が非同期で平行に動作する。

ニューラルネットワークのパラメーターΘは継続的にセルフプレイのデータで最適化されていく。

Alpha Go Zeroのプレーヤーαは継続的に評価されていく。

ベストなプレーヤーはセルフプレイのデータを生み出すために使われていく。

今日はここまで~　ハァハァ(*´Д`)

231 thoughts on “Alpha Go Zeroの論文の翻訳　その5”

Nikegredy

2024 年 5 月 18 日 ·

tor markets 2024 https://mydarknetmarketlinks.com/ – tor markets 2024 dark web site
Nikegredy

2024 年 5 月 20 日 ·

dark web links https://mydarknetmarketlinks.com/ – deep web sites dark market link
Hatay defne otelleri

2024 年 5 月 21 日 ·

Hatay defne otelleri
shell c99 php download

2024 年 5 月 22 日 ·

thx
free games hack

2024 年 5 月 22 日 ·

thxx
hacker games unblocked

2024 年 5 月 22 日 ·

thank youu
hacker roblox apk

2024 年 5 月 22 日 ·

thx admin
shell c99 asp

2024 年 5 月 22 日 ·

thx
c99 txt shell download

2024 年 5 月 22 日 ·

thx
fake hacking game

2024 年 5 月 22 日 ·

thx admin
bismil şark odaları

2024 年 5 月 22 日 ·

bismil şark odaları
what is c99 shell

2024 年 5 月 22 日 ·

thx
download c99 shell.php.jpg

2024 年 5 月 22 日 ·

thx
pharmacy

2024 年 5 月 22 日 ·

buy glucophage online
ラブドール男性

2024 年 5 月 23 日 ·

ラブドール最高の愛のダッチワイフはあなたが選ぶものですなぜ大人のダッチワイフはあなたの次の恋人になることができますか？あなたの夢を高める–正確なシリコーンとTPEのダッチワイフメイクのためのあなたのダッチワイフのヒントをドレスアップする方法
bursa evden eve nakliyat

2024 年 5 月 23 日 ·

bursa evden eve nakliyat
canadian prescription pharmacy

2024 年 5 月 24 日 ·

canadian drugstore pharmacy
canadian pharmacies

2024 年 5 月 24 日 ·

medication without prior prescription
k8 カジノ

2024 年 5 月 30 日 ·

ミリオンゴッド-神々の凱旋
素晴らしい記事でした。多くのことを考えさせられました。
bucakda oto kurtarma

2024 年 6 月 8 日 ·

burdur bucak oto kurtarma
ankara seo

2024 年 6 月 11 日 ·

ankara seo
pill

2024 年 6 月 18 日 ·

buy baclofen online australia
best canadian drug prices

2024 年 6 月 19 日 ·

canadian pharmacy rx
canadian pharmacies reviews

2024 年 6 月 19 日 ·

safe online pharmacies
pills

2024 年 6 月 20 日 ·

advair diskus canada pharmacy
슬롯

2024 年 6 月 20 日 ·

안전한 슬롯 사이트
사실 Wang Shouren이 부름을 받았을 때 그는 이미 이상한 점을 발견했습니다.
drug

2024 年 6 月 22 日 ·

albuterol online without rx
canadian drug stores

2024 年 6 月 23 日 ·

order prescription medicine online without prescription
medication

2024 年 6 月 24 日 ·

cost of sildenafil 100 mg tablet
order

2024 年 6 月 24 日 ·

buy combivent from canada
online

2024 年 6 月 25 日 ·

best accutane brand
pill

2024 年 6 月 25 日 ·

baclofen 20 mg cost
the generics pharmacy online delivery

2024 年 6 月 25 日 ·

online meds no rx reliable
pill

2024 年 6 月 26 日 ·

can you buy amoxicillin without a prescription
drug

2024 年 6 月 26 日 ·

diflucan 50 mg price
sale

2024 年 6 月 26 日 ·

lyrica 25 mg cost
tablets

2024 年 6 月 28 日 ·

accutane prescription
tablet

2024 年 6 月 29 日 ·

provigil prescription online
medication

2024 年 7 月 1 日 ·

buy combivent
HasıR şEmsi̇Ye

2024 年 7 月 2 日 ·

Today, while I was at work, my cousin stole my iPad and tested to see if it can survive a thirty foot drop, just
so she can be a youtube sensation. My apple ipad
iss now destroyed andd she has 83 views.
I know this is entieely off topic but I had to share it with someone!

my blog – HasıR şEmsi̇Ye
medication

2024 年 7 月 2 日 ·

buy cheap lasix
Samsun Siemens servisi

2024 年 7 月 3 日 ·

Oh my goodness! Incredible article dude! Thank you, However I amm experiencing
issues with your RSS. I don’t understand why I can’t join it.
Is there anyone else having identical RSS problems?
Anyone who knows the solution cann you kindly respond?
Thanx!!

My site :: Samsun Siemens servisi
Telefonda Sürekli Reklam Çıkıyor

2024 年 7 月 3 日 ·

I used to be recommended this website viia my cousin. I’m now nott certain whether this post is written by way of
him as no one else recognise such exact about mmy difficulty.
You’re amazing! Thanks!

Feel free to surf to mmy website – Telefonda Sürekli Reklam Çıkıyor
medication

2024 年 7 月 4 日 ·

propecia where to buy canada
şanlıurfa oto kurtarma

2024 年 7 月 5 日 ·

şanlıurfa oto kurtarma
escape roomy lista

2024 年 7 月 6 日 ·

You really make it seem so easy along with your presentation however I in finding this topic to be really something that I
believe I’d by no means understand. It kind of feels too complicated and
extremely broad for me. I am looking forward on your next post,
I will try to get the grasp of it! Escape room
online

2024 年 7 月 6 日 ·

doxycycline 400 mg daily
pill

2024 年 7 月 6 日 ·

diflucan 200mg
Kapı Sistemleri

2024 年 7 月 7 日 ·

What’s up, constantly i uded to check webpage posts here in the early hours in the daylight, as i enjoy too learn more and more.

Here is my website; Kapı Sistemleri
price

2024 年 7 月 7 日 ·

can you buy baclofen over the counter uk

コメントを残す

コメントを投稿するにはログインしてください。