2023-01-01から1年間の記事一覧

VAR(ベクトル自己回帰)モデルを用いた多変量時系列データ分析

1.やりたいこと 2.VAR(ベクトル自己回帰)モデル 3.グレンジャー因果性 4.インパルス応答解析 5.NIKKEI225とS&P500の因果探索(Pythonでの実装) 5.1.データの用意 5.2.定常性の確認 5.3.VARモデルの構築 5.4.グレンジャー因果性の統計的仮説検定 5.5.インパ…

BERTで感情予測をしてみる

https://arxiv.org/pdf/1810.04805.pdf 0.目次 0.目次 1.やりたいこと 2.BERT(Bidirectional Encoder Representation from Transformers) 2.1.BERTの事前学習 Masked Language Model Next Sentence Prediction 2.2.BERTのファインチューニング 3.Transformer…

混合モデルによる潜在変数の特定(PyMC3)

1.背景 2.混合モデル(Mixture Model) 3.PyMC3によるポアソン混合モデルの実装 3.1.データの生成 3.2.混合ポアソンモデルの実装 1.背景 観測データの背後にある構造を把握することで有用な示唆を得られることがある。今回は簡単のために以下のような時系列…

生存時間解析をやってみる2(PyMC3)

masao-ds.hatenablog.com ベイズモデリングによる生存時間解析はこちらを参考にしてください。 1.やりたいこと/課題設定 2.ベイズモデリングによる生存時間解析を用いた機会損失額の比較 2.1.データの生成 2.2.装置の生存時間解析 2.2.1.変更前の装置の生存…

生存時間解析をやってみる1(PyMC3)

1.生存時間解析 2.PyMC3による生存時間解析の実装 2.1.データの作成 2.2.打ち切りなしデータのみを用いた生存時間解析 2.3.打ち切りなし+打ち切りありデータを用いた生存時間解析 1.生存時間解析 生存時間解析は、医療分野や工学分野を始めとした様々な領域…

PytorchでPINNs(Physics Informed Neural Network)を実装してみる(Burgers方程式)

1.やりたいこと 2.Burgers方程式 3.問題設定 4.PINNsによる解法 4.1.初期条件及び境界条件のデータ作成 4.2.計算領域内のサンプリングデータの作成 4.3.学習モデル定義 4.4.PINNsの学習 4.5.PINNs学習済モデルの予測結果 4.6.解析結果との比較 1.やりたいこ…

ベイズ推論を用いたA/Bテストを行なってみる(PyMC3)

1.背景 ビジネスにおいて、異なる施策を試す場合、各施策の効果の差を検証し、意思決定を行うことが重要です。しかし、得られるデータは限られており、ばらつきが存在することが多いです。このような状況では、少数のデータのばらつきを適切に考慮しながら効…

PytorchでPINNs(Physics Informed Neural Network)を実装してみる

0.目次 1.背景 2.やりたいこと 3.PINNs(Physics Informed Neural Network) 3.1.PINNsとは 3.2.自動微分 4.マス-バネ-ダンパー系(1次の自由振動系) 4.1.解析解 4.2.NNによる解法 4.3.PINNsによる解法 5.まとめ 1.背景 業務でPINNs(Physics Informed Neural …

AttentionモデルとCNNモデルの判断根拠を比較してみる

0.目次 1.やりたいこと 2.使用するライブラリ 3.使用するデータ 4.Self-Attentionモデルの学習/判断根拠の可視化 4.1.Self-Attention 4.2.学習モデルの定義 4.3.Dataloaderの作成/学習 4.4.Self-Attentionによる判断根拠の可視化 5.CNNモデルの学習/判断根拠…

SnapshotPODについてまとめてみる

出所:https://www.nagare.or.jp/download/noauth.html?d=30-2rensai2.pdf&dir=54 0.はじめに 機械学習において、主成分分析はデータの可視化や次元圧縮等に使用される。 この主成分分析を流体の数値計算に適用すること(SnapshotPOD)で流れの空間モードの…

GCN(Graph Convolutional Networks)を使用して化合物の物性値を予測してみた

0.はじめに 化合物の物性予測の際には、記述子を用いたり、フィンガープリントを用いたり等アプローチがいくつかあります。 今回、化合物の構造データ(グラフデータ)から畳み込み演算により特徴を抽出しながらモデルを構築するGCNN(Graph Convolutional N…

Flask+Vue.jsでベイズ最適化アプリを作成してみた

0.はじめに Flask + Vue.jsで簡単なベイズ最適化アプリを作成したので備忘録がてらまとめておきます。 1.つくりたいもの 以下のような、csv形式のテーブルデータ(property:目的変数、feature:説明変数、説明変数は2つ)を読み込んで目的変数を最大化する条…

PLS(部分的最小二乗法)の変数重要度をvip法を使って算出してみた

1. 背景 化学工学における物性値の予測やスペクトル解析においては、サンプル数に対して説明変数(特徴量)が非常に大きいということがある。そのような場合、一般的なOLS(最小二乗法)等の線形回帰モデルが使用できない。また、説明変数同士の相関が大きい(…

Kedro + MLFlowでMLOpsを導入してみた

1. 背景 データフローパイプラインとモデルの実験管理を行えるようなMLOpsパイプラインを作成したいと思い、調べているとKedro+MLflowでできることがわかりました。実際にKedroとMLFlowを使ってパイプラインを作って実験管理をしてみたので共有します。 2. K…

初めまして

自己紹介 初めまして、まさおと申します。 以下に私の簡単なプロフィールを記載します。 半導体メーカー研究職 新卒3年目の27歳 データ分析業務に従事(2年目) データサイエンティストとして活躍するために日々勉強中 本ブログに関して このブログでは、デ…