2020-01-01から1年間の記事一覧

GPT-2の論文中に出てくるBloom filterの解説

OpenAIが出したGPT-2の論文中でtrainデータセットとtestデータセットの間で重複したデータが無いか確かめるためにBloom filterを使ったと述べられている。 Bloom filterは与えられた集合に、ある要素が含まれるかを判別するデータ構造である。要素が無いと判…

なぜ変数の微分に小さな値を掛けたものを変数から引くと損失が減るのか

とすると、 はxを極少量増加させたときのyの増加量を表す(増加量が負になることもありえることに注意)。なので、yが損失だった場合にyを最小化するためにはxからを引けばyを減少させることができる。 ここでは変数xのyへの影響度の大きさと考えることがで…