アルファ碁のSLポリシーネットワークモデル部分 アルファ碁では入力の特徴量が48、中間層5x5の192チャネル、出力層の全13層からなっている。 # Network definition class CNN(chainer.Chain): def __init__(self, train=True): super(CNN, self).__init__( c…
Chainerを使ってSLポリシーネットワークを作成するため、まずはMNISTを使ってChainerの使い方を学習する。 勉強用なのでGoogle Colaboratoryで試してみる。 本格的にディープラーニングするときはクラウド使うかもしれない。 環境構築 Google Colaboratoryで…
今日やったこと 最強囲碁AI アルファ碁 解体新書の第一章、第二章を読んだ。 AlphaGOでの次の一手の予測モデル(CNN) 最強囲碁AI アルファ碁 解体新書第二章より。 (完全に理解できているわけではないので間違いがありますことご了承ください。) AlphaGO…
はじめに このブログでは囲碁AIをつくる過程を記録していきます。 自己紹介 機械学習初心者。 普段はゲノム解析などバイオインフォマティクスやってます。 数年前から囲碁が好きなので囲碁AIやってみようと思いました。 R, Pythonはちょっと使えるレベル。 …