GPT-2の論文中に出てくるBloom filterの解説

OpenAIが出したGPT-2の論文中でtrainデータセットとtestデータセットの間で重複したデータが無いか確かめるためにBloom filterを使ったと述べられている。 Bloom filterは与えられた集合に、ある要素が含まれるかを判別するデータ構造である。要素が無いと判…

なぜ変数の微分に小さな値を掛けたものを変数から引くと損失が減るのか

とすると、 はxを極少量増加させたときのyの増加量を表す(増加量が負になることもありえることに注意)。なので、yが損失だった場合にyを最小化するためにはxからを引けばyを減少させることができる。 ここでは変数xのyへの影響度の大きさと考えることがで…

ResidualNNメモ

ILSVRC2015 classification taskで1位だった手法.開発はMicrosoft Researchの人. [1512.03385] Deep Residual Learning for Image Recognition NNの層数を増やすと精度はサチった後どんどん低下する.これはテストエラーが増加する(オーバーフィッティン…

Boost.Computeでグラボを燃やす

はじめに この記事ではBoost.Computeの紹介と使い方の説明をします。 Boost.Compute Boost.Computeとは kylelutz氏が作成しているOpenCLのC++ラッパです。Boostにはまだ正式に採用されていませんが、主要な部分の実装は既に終わっており、十分使えるレベルに…

「unique_ptrにポインタ以外のものを持たせるとき」で話したことと話さなかったこと

歌舞伎座.tech#8「C++初心者会」で「unique_ptrにポインタ以外のものを持たせるとき」というタイトルで発表したが、この記事ではそのまとめと、追加の話題について述べる。 発表資料はここにある。 TL;DR std::unique_ptrはハンドルがポインタライクな型のリ…

bloggerから引っ越した。

前のクリアボックス