特徴量選択アルゴリズム HSIC Lasso とその周辺を調べた

機械学習論文

先日、特徴量選択についてツイートしたところ Kaggle Master のアライさんに「HSIC Lassoはまさにぴったしなんではないでしょうか?」と教えていただきました。お、となるとHSICLassoはまさにぴったしなんではないでしょうか？https://t.co/Ezigm9OriK— Hide…

2020-12-15

SGDにおける「順番」の問題

論文機械学習 SGD

この記事は atma Advent Calendar adventar.org の 12/1 分の記事です。大分遅くなってしまいましたがこの記事では Stochastic Gradient Descent における順番が与える影響とそれにまつわる論文をいくつか紹介したいと思います。 Stochastic Gradient Descen…

2020-05-01

NGBoostを読んで、実装する。

機械学習論文

不確実性を考慮した予測が可能と噂の NGBoost の論文を読んでみたので、全体のながれをまとめて見ました。加えて自分でも NGBoost を実装して、その結果を載せています。元の論文 NGBoost: Natural Gradient Boosting for Probabilistic Prediction はこち…

2020-04-13

Wantedly さんの Machine Learning 輪講に参加しました!

論文

先週、wantedly さんの Machine Learning 輪講に参加させていただきました。 www.wantedly.com Machine Learning 輪講は最新の技術や論文を追うことで、エンジニアが「技術で解決できること」のレベルをあげていくことを目的にした会です。とのことで社内外…

2019-08-16

RAdam: Adam の学習係数の分散を考えたOptimizerの論文紹介

論文機械学習 SGD

表題の通り噂の最適化手法 RAdam の論文 On the Variance of the Adaptive Learning Rate and Beyond を読んだので, そのまとめです!! 概要一言でいうと「今までヒューリスティックに行っていた Adam 学習開始時の LR 調整を自動化できるような枠組みをつく…

2019-05-30

Adabound の final_lr と収束性について

Python pytorch ディープラーニング論文 SGD

みなさん optimizer は何を使っていますか? (僕は SGD + Momentum + Nesterov が好きです) adagrad/adadelta/adam などなど NN で用いられる optimizer は数多くありますが, 最近提案された optimizer に adabound というものがあります。 adabound はざっく…

2019-02-24

文章の埋め込みモデル: Sparse Composite Document Vectors を読んで実装してみた

Python 機械学習論文

自然言語処理である単語の意味情報を数値化したいという場合に単語を特定のベクトルに埋め込む(分散表現)手法として word 2 vec があります。この word2vec と同じような発想で文章自体をベクトル化するという発想があり Doc2Vec やそのたもろもろも方法が…

2018-11-28

敵対的サンプリング検出のための基準としての相互情報量 - Understanding Measures of Uncertainty for Adversarial Example Detection

論文機械学習

Understanding Measures of Uncertainty for Adversarial Example Detection https://arxiv.org/pdf/1803.08533.pdf 概要 (200文字程度) 敵対的サンプルを判別する基準として相互情報量 (Mutual Information) が優れていることを主張する論文. MI の推定に D…

2018-11-03

重みのスケールに依存しないSGD: Path Normalized Optimization in Deep Neural Network

論文機械学習 SGD

表題の論文を読んだのでまとめます！ url: [1506.02617] Path-SGD: Path-Normalized Optimization in Deep Neural Networks Path-SGD を考えたモチベーションニューラルネットワークがこの論文の主題です。 Rescaling 今、あるニューラルネットワークの $i,…