ソフト工房 - ブログ

RNNによる時系列データの予測（TensorFlow.js）

22/12/2021

今回は時系列データの予測で用いられるRNN（Recurrent Neural Network）をKerasを使わずにTensorFlow.jsだけでモデル化し、それを使って\(\sin\)曲線上の等間隔の3つのポイントから次のポイントを予測するプログラムを作成します。

RNNの定式化

通常、RNNは入力層、隠れ層、出力層の3層から構成され、\(\boldsymbol{x_{1}},\boldsymbol{x_{2}},\cdot\cdot\cdot,\boldsymbol{x_{n}}\)から\(\boldsymbol{x_{n+1}}\)を予測するRNNは下記の数式で表されます。\(\boldsymbol{x_{k}}\), \(\boldsymbol{h_{k}}\)はベクトル、\(f\)は活性化関数です。

sequence length：\(n\)
入力層：\(\boldsymbol{x_{1}},\boldsymbol{x_{2}},\cdot\cdot\cdot,\boldsymbol{x_{n}}\)
隠れ層：\(\boldsymbol{h_{1}},\boldsymbol{h_{2}},\cdot\cdot\cdot,\boldsymbol{h_{n}}\)
出力層：\(\boldsymbol{x_{n+1}}\)

\[\boldsymbol{h_{1}}=f(\boldsymbol{x_{1}}W_{1}+\boldsymbol{b}_{1})\] \[\boldsymbol{h_{2}}=f(\boldsymbol{x_{2}}W_{1}+\boldsymbol{h_{1}}U_{1}+\boldsymbol{b}_{1})\] \[\boldsymbol{h_{3}}=f(\boldsymbol{x_{3}}W_{1}+\boldsymbol{h_{2}}U_{1}+\boldsymbol{b}_{1})\] ︙ \[\boldsymbol{h_{n}}=f(\boldsymbol{x_{n}}W_{1}+\boldsymbol{h_{n-1}}U_{1}+\boldsymbol{b}_{1})\] \[\boldsymbol{x_{n+1}}=\boldsymbol{h_{n}}W_{2}+\boldsymbol{b}_{2}\]

今回は \(n=3\) のモデルを作成するので、次のようになります。

\[\boldsymbol{h_{1}}=f(\boldsymbol{x_{1}}W_{1}+\boldsymbol{b}_{1})\] \[\boldsymbol{h_{2}}=f(\boldsymbol{x_{2}}W_{1}+\boldsymbol{h_{1}}U_{1}+\boldsymbol{b}_{1})\] \[\boldsymbol{h_{3}}=f(\boldsymbol{x_{3}}W_{1}+\boldsymbol{h_{2}}U_{1}+\boldsymbol{b}_{1})\] \[\boldsymbol{x_{4}}=\boldsymbol{h_{3}}W_{2}+\boldsymbol{b}_{2}=f(\boldsymbol{x_{3}}W_{1}+f(\boldsymbol{x_{2}}W_{1}+f(\boldsymbol{x_{1}}W_{1}+\boldsymbol{b}_{1})U_{1}+\boldsymbol{b}_{1})U_{1}+\boldsymbol{b}_{1})W_{2}+\boldsymbol{b}_{2}\]

この式を使って\(\sin\)曲線上の\(x_{1}=\sin{0.01t},x_{2}=\sin{0.01(t+1)},x_{3}=\sin{0.01(t+2)}\)から\(x_{4}=\sin{0.01(t+3)}\)を予測するモデルを作成すると下記のようになります。活性化関数は\(\tanh\)を使っています。

rnn.mjs


import * as ph from "perf_hooks";
import * as tf from "@tensorflow/tfjs";

class NeuralNetwork {
  constructor(units1, units2, units3) {
    /* units1：第１層（入力層）のユニット数 */
    /* units2：第２層（隠れ層）のユニット数 */
    /* units3：第３層（出力層）のユニット数 */
    this.w1 = tf.variable(tf.randomUniform([units1, units2], -1, 1));
    this.u1 = tf.variable(tf.randomUniform([units2, units2], -1, 1));
    this.b1 = tf.variable(tf.randomUniform([units2], -1, 1));
    this.w2 = tf.variable(tf.randomUniform([units2, units3], -1, 1));
    this.b2 = tf.variable(tf.randomUniform([units3], -1, 1));
  }
  model(x) {
    const x1 = x.gather([0], 1);
    const x2 = x.gather([1], 1);
    const x3 = x.gather([2], 1);
    const h1 = x1.matMul(this.w1).add(this.b1).tanh();
    const h2 = x2.matMul(this.w1).add(h1.matMul(this.u1)).add(this.b1).tanh();
    const h3 = x3.matMul(this.w1).add(h2.matMul(this.u1)).add(this.b1).tanh();
    return h3.matMul(this.w2).add(this.b2);
  }
  loss(x, y) {
    return tf.losses.meanSquaredError(this.model(x), y);
  }
  train(x, y, epochs) {
    const optimizer = tf.train.adam(0.001, 0.9, 0.999, 0.00000001);
    for (let epoch = 1; epoch <= epochs; epoch++) {
      optimizer.minimize(() => this.loss(tf.tensor(x), tf.tensor(y)));
      if (epoch % 1000 == 0) {
        const loss = this.loss(tf.tensor(x), tf.tensor(y));
        console.log(`${epoch} epoch: loss = ${loss.arraySync()}`);
      }
    }
  }
  predict(x) {
    return this.model(tf.tensor([x])).arraySync()[0];
  }
}

const neuralNetwork = new NeuralNetwork(1, 2, 1);

const n = 500;
const x_train = [];
const y_train = [];
for (let t = 0; t < n; t++) {
  x_train.push([Math.sin(0.01 * (t + 0)), Math.sin(0.01 * (t + 1)), Math.sin(0.01 * (t + 2))]);
  y_train.push([Math.sin(0.01 * (t + 3))]);
}

/* 学習 */
const start = ph.performance.now();
neuralNetwork.train(x_train, y_train, 50000);
const stop = ph.performance.now();

/* 検証 */
for (let t = 0; t < n; t++) {
  const predictedValue = neuralNetwork.predict([Math.sin(0.01 * (t + 0.5)), Math.sin(0.01 * (t + 1.5)), Math.sin(0.01 * (t + 2.5))]);
  const actualValue = Math.sin(0.01 * (t + 3.5));
  console.log(`${Math.abs(predictedValue / actualValue - 1)}`);
}

console.log(`${(0.001 * (stop - start)).toFixed(3)}sec`);

まとめ

結果は省略しますが、units2 = 2、sequence length = 3 というコンパクトなモデルであるにも関わらず結構いい精度で予測できました。

参考記事

TensorFlowでJavaScriptとPythonの処理速度を比較

7/10/2021

TensorFlowで３層ニューラルネットワークを作成し、それを使ってJavaScriptとPythonの処理速度を比較しました。
結果は表１の通りPythonの圧勝でした。また、Pythonは「@tf.function有り」が「@tf.function無し」に比べ10倍以上も速いことが分かりました。 Pythonを使う場合は「@tf.function」を付けた方が絶対絶対いいです！

〈PC〉
・OS：Windows 8.1
・CPU：Celeron Dual-Core 1005M（1.9GHz）

〈JavaScript〉
・Node.js 15.1.0
・@tensorflow/tfjs 3.9.0

〈Python〉
・Python 3.8.8
・TensorFlow 2.3.0

表１．学習に要した時間（エポック数：50000）
プログラミング言語	学習に要した時間
JavaScript	115 sec
Python（@tf.function無し）	394 sec
Python（@tf.function有り）	29 sec

下記の tensorflow.mjs と tensorflow.py が処理速度を計測するのに使用したプログラムです。

〈掛け算の九九の表を学習して乗算をする３層ニューラルネットワーク〉
units1：第１層（入力層）のユニット数 = 2
units2：第２層（隠れ層）のユニット数 = 7
units3：第３層（出力層）のユニット数 = 1
epochs：エポック数 = 50000

tensorflow.mjs


import * as ph from "perf_hooks";
import * as tf from "@tensorflow/tfjs";

class NeuralNetwork {
  constructor(units1, units2, units3) {
    this.w1 = tf.variable(tf.randomUniform([units1, units2], -1, 1));
    this.b1 = tf.variable(tf.randomUniform([units2], -1, 1));
    this.w2 = tf.variable(tf.randomUniform([units2, units3], -1, 1));
    this.b2 = tf.variable(tf.randomUniform([units3], -1, 1));
  }
  model(x) {
    return x.matMul(this.w1).add(this.b1).tanh().matMul(this.w2).add(this.b2);
  }
  loss(x, y) {
    return tf.losses.meanSquaredError(this.model(x), y);
  }
  train(x, y, epochs) {
    const optimizer = tf.train.adam(0.001, 0.9, 0.999, 0.00000001);
    const x_tensor = tf.tensor(x);
    const y_tensor = tf.tensor(y);
    for (let epoch = 1; epoch <= epochs; epoch++) {
      optimizer.minimize(() => this.loss(x_tensor, y_tensor));
    }
  }
  predict(x) {
    return this.model(tf.tensor([x])).arraySync()[0];
  }
}

const neuralNetwork = new NeuralNetwork(2, 7, 1);

//掛け算の九九の表
const x_train = Array.from((function* () { for (let x1 = 1; x1 <= 9; x1++) for (let x2 = 1; x2 <= 9; x2++) yield [x1, x2]; })());
const y_train = Array.from((function* () { for (let x1 = 1; x1 <= 9; x1++) for (let x2 = 1; x2 <= 9; x2++) yield [x1 * x2]; })());

//学習
const start = ph.performance.now();
neuralNetwork.train(x_train, y_train, 50000);
const stop = ph.performance.now();

//推論
for (let x1 = 1; x1 <= 9; x1++)
  for (let x2 = 1; x2 <= 9; x2++)
    console.log(`${x1} * ${x2} -> ${neuralNetwork.predict([x1, x2])}`);

console.log(`${(0.001 * (stop - start)).toFixed(3)}sec`);

注）importステートメントを使ってモジュールを呼び出しているので、ファイルの拡張子は mjs にしてください。

tensorflow.py（@tf.function有り）


import tensorflow as tf
import time

class NeuralNetwork:
  def __init__(self, units1, units2, units3):
    self.w1 = tf.Variable(tf.random.uniform(shape = (units1, units2), minval = -1, maxval = 1))
    self.b1 = tf.Variable(tf.random.uniform(shape = (units2,), minval = -1, maxval = 1))
    self.w2 = tf.Variable(tf.random.uniform(shape = (units2, units3), minval = -1, maxval = 1))
    self.b2 = tf.Variable(tf.random.uniform(shape = (units3,), minval = -1, maxval = 1))
    self.optimizer = tf.keras.optimizers.Adam(learning_rate = 0.001, beta_1 = 0.9, beta_2 = 0.999, epsilon = 1e-8)

  def model(self, x):
    return tf.matmul(tf.tanh(tf.matmul(x, self.w1) + self.b1), self.w2) + self.b2

  def loss(self, x, y):
    return tf.keras.losses.MeanSquaredError()(self.model(x), y)

  @tf.function
  def optimize(self, x, y):
    with tf.GradientTape() as tape:
      loss = self.loss(x, y)
      parameters = self.w1, self.b1, self.w2, self.b2
      gradients = tape.gradient(loss, parameters)
    self.optimizer.apply_gradients(zip(gradients, parameters))

  def train(self, x, y, epochs):
    x_tensor = tf.convert_to_tensor(x, tf.float32)
    y_tensor = tf.convert_to_tensor(y, tf.float32)
    for epoch in range(epochs):
      self.optimize(x_tensor, y_tensor)

  def predict(self, x):
    return self.model(tf.convert_to_tensor([x], tf.float32))[0][0]

neuralNetwork = NeuralNetwork(units1 = 2, units2 = 7, units3 = 1)

#掛け算の九九の表
x_train = [[x1, x2] for x1 in range(1, 10) for x2 in range(1, 10)]
y_train = [[x1 * x2] for x1 in range(1, 10) for x2 in range(1, 10)]

#学習
start = time.time()
neuralNetwork.train(x_train, y_train, epochs = 50000)
stop = time.time()

#推論
for x1, x2 in ((x1, x2) for x1 in range(1, 10) for x2 in range(1, 10)):
  print(f"{x1} * {x2} -> {neuralNetwork.predict([x1, x2])}")

print("{:.3f}sec".format(stop - start))

参考記事

〈ブラウザ版〉TensorFlow.jsで作成した非線形回帰モデル

18/9/2021

以前書いた記事〈Node.js版〉TensorFlow.jsで作成した非線形回帰モデルのブラウザ版です。WASMバックエンドを使って高速化を図っています。Node.js版に比べ、処理速度が30%程度落ちるレベルです。
Node.js版からの改良点は、ユニット数をコンストラクタの引数から設定できるようにしたことです。これにより、ユニット数の異なる複数のモデルを生成し実行できるようになりました。また、エポック数も train(x, y, epochs) の引数から入力できるようにしました。
※ブラウザはGoogle Chromeがお勧めです。Mozilla Firefoxは遅いです。古いブラウザでは動作しません！

〈デモ〉

をクリックすると学習がスタートします。学習が完了すると"Completed!"と表示されるので、２ヶ所の入力フィールドに１～９の数値を入力し、をクリックすると結果が表示されます。当たり前のことですが、学習データの範囲外の数値を入力すると、とんでもない値が出力されます。
ちなみに学習時間は、Celeron搭載の私のPCでChromeを使って３分近くかかりました。古いPCをお使いの方は気長にお待ちください^^

〈2021年10月24日追記〉
当初、WASMバックエンドが有効だったのですが、今日実行するとなぜかWASMバックエンドが効いていないことがわかりました。原因不明です。
そのため学習時間が私のPCで10分以上かかるようになりました！

〈掛け算の九九の表を学習して乗算をする３層ニューラルネットワーク〉

tensorflow.html


<!doctype html>
<html>
<body>
<div>
  <button id="ButtonTrain">train</button>
  <input id="Input1" type="text"> &times; <input id="Input2" type="text">
  <button id="ButtonPredict">&rarr;</button> <output id="Output"></output>
</div>
<script src="https://cdn.jsdelivr.net/npm/@tensorflow/[email protected]/dist/tf.min.js"></script>
<script src="https://cdn.jsdelivr.net/npm/@tensorflow/tfjs-backend-wasm/dist/tf-backend-wasm.js"></script>
<script>
class NeuralNetwork {
  constructor(units1, units2, units3) {
    /* units1：第１層（入力層）のユニット数 */
    /* units2：第２層（隠れ層）のユニット数 */
    /* units3：第３層（出力層）のユニット数 */
    this.w1 = tf.variable(tf.randomUniform([units1, units2], -1, 1));
    this.b1 = tf.variable(tf.randomUniform([units2], -1, 1));
    this.w2 = tf.variable(tf.randomUniform([units2, units3], -1, 1));
    this.b2 = tf.variable(tf.randomUniform([units3], -1, 1));
  }
  model(x) {
    return x.matMul(this.w1).add(this.b1).tanh().matMul(this.w2).add(this.b2);
  }
  loss(x, y) {
    return tf.losses.meanSquaredError(this.model(x), y);
  }
  train(x, y, epochs) {
    tf.setBackend("wasm");
    tf.ready().then(() => {
      const optimizer = tf.train.adam(0.001, 0.9, 0.999, 0.00000001);
      for (let epoch = 1; epoch <= epochs; epoch++) {
        optimizer.minimize(() => this.loss(tf.tensor(x), tf.tensor(y)));
      }
      alert("Completed!");
    });
    console.log(tf.getBackend());
  }
  predict(x) {
    return this.model(tf.tensor([x])).arraySync()[0];
  }
}
</script>
<script>
const neuralNetwork = new NeuralNetwork(units1 = 2, units2 = 7, units3 = 1);
document.getElementById("ButtonTrain").onclick = () => {
  /* 掛け算の九九の表 */
  const x_train = Array.from((function* () { for (let x1 = 1; x1 <= 9; x1++) for (let x2 = 1; x2 <= 9; x2++) yield [x1, x2]; })());
  const y_train = Array.from((function* () { for (let x1 = 1; x1 <= 9; x1++) for (let x2 = 1; x2 <= 9; x2++) yield [x1 * x2]; })());

  /* 学習 */
  neuralNetwork.train(x_train, y_train, epochs = 50000);
};
document.getElementById("ButtonPredict").onclick = () => {
  /* 推論 */
  const x1 = Number(document.getElementById("Input1").value);
  const x2 = Number(document.getElementById("Input2").value);
  document.getElementById("Output").innerHTML = neuralNetwork.predict([x1, x2]);
};
</script>
</body>
</html>

参考記事

UbuntuにSwift for TensorFlowをインストールして実行する

5/1/2021

Ubuntu で Swift for TensorFlow を利用するには下記のものが必要になります。

♦Clang
♦Swift
♦Swift for TensorFlow

以下がインストール手順です。

〈Clangのインストール〉


$ sudo apt update
$ sudo apt install clang -y

〈Swiftのインストール〉


$ wget https://swift.org/builds/swift-5.3.2-release/ubuntu2004/swift-5.3.2-RELEASE/swift-5.3.2-RELEASE-ubuntu20.04.tar.gz
$ tar fvxz swift-5.3.2-RELEASE-ubuntu20.04.tar.gz
$ sudo mv swift-5.3.2-RELEASE-ubuntu20.04 /usr/local/swift
$ export PATH=/usr/local/swift/usr/bin:$PATH

注）Swift の最新バージョンは https://swift.org/download/ で確認してください。

〈Swift for TensorFlowのインストール〉


$ wget https://storage.googleapis.com/swift-tensorflow-artifacts/releases/v0.12/rc2/swift-tensorflow-RELEASE-0.12-ubuntu20.04.tar.gz
$ tar fvxz swift-tensorflow-RELEASE-0.12-ubuntu20.04.tar.gz
$ sudo mv swift-tensorflow-RELEASE-0.12-ubuntu20.04 /usr/local/swift-tensorflow
$ export PATH=/usr/local/swift-tensorflow/usr/bin:$PATH

注）Swift for TensorFlow の最新バージョンは https://github.com/tensorflow/swift/blob/main/Installation.md で確認してください。

〈コンパイルと実行〉


$ swiftc -O tensorflow.swift -o tensorflow
$ ./tensorflow

tensorflow.swift


import TensorFlow
let t1 = Tensor<Float>([[1, 2]])
let t2 = Tensor<Float>([[1, 2, 3], [4, 5, 6]])
let t3 = Tensor<Float>(ones:[2, 3])
let t4 = Tensor<Float>(zeros:[2, 3])
let t5 = Tensor<Float>(randomNormal:[2, 3])
let t6 = Tensor<Float>(randomUniform:[2, 3])
print(t2 + t3)
print(matmul(t1, t2))

〈実行結果〉


[[2.0, 3.0, 4.0],
 [5.0, 6.0, 7.0]]
[[9.0, 12.0, 15.0]]

〈３層ニューラルネットワーク〉
units1：第１層（入力層）のユニット数
units2：第２層（隠れ層）のユニット数
units3：第３層（出力層）のユニット数
epochs：エポック数

tensorflow.swift


import TensorFlow

struct NeuralNetwork:Layer {
  var w1:Tensor<Float>
  var b1:Tensor<Float>
  var w2:Tensor<Float>
  var b2:Tensor<Float>
  init(units1:Int, units2:Int, units3:Int) {
    w1 = Tensor<Float>(randomUniform:[units1, units2])
    b1 = Tensor<Float>(randomUniform:[units2])
    w2 = Tensor<Float>(randomUniform:[units2, units3])
    b2 = Tensor<Float>(randomUniform:[units3])
  }
  func callAsFunction(_ x:Tensor<Float>) -> Tensor<Float> {
    return matmul(tanh(matmul(x, w1) + b1), w2) + b2
  }
}

func loss(_ model:NeuralNetwork, _ x:Tensor<Float>, _ y:Tensor<Float>) -> Tensor<Float> {
  return meanSquaredError(predicted:model(x), expected:y)
}

func train(model:inout NeuralNetwork, x:inout Tensor<Float>, y:inout Tensor<Float>, epochs:Int) {
  let optimizer = Adam(for:model, learningRate:0.001)
  for epoch in 1...epochs {
    let gradients = gradient(at:model) { model -> Tensor<Float> in
      let loss = loss(model, x, y)
      if epoch % 1000 == 0 { print("\(epoch) epoch: loss = \(loss)") }
      return loss
    }
    optimizer.update(&model, along:gradients)
  }
}

var neuralNetwork = NeuralNetwork(units1:2, units2:7, units3:1)

var x_train:Tensor<Float> = [[1.0, 1.0], [1.0, 2.0], [1.0, 3.0], [2.0, 1.0], [2.0, 2.0], [2.0, 3.0], [3.0, 1.0], [3.0, 2.0], [3.0, 3.0]]
var y_train:Tensor<Float> = [[1.0], [2.0], [3.0], [2.0], [4.0], [6.0], [3.0], [6.0], [9.0]]

let start = clock()
train(model:&neuralNetwork, x:&x_train, y:&y_train, epochs:10000)
let stop = clock()
print("\(String(format:"%.3f", 0.000001 * Double(stop - start)))sec")

参考記事

〈Node.js版〉TensorFlow.jsで作成した非線形回帰モデル

22/11/2020

最近は、Keras API（高水準API）を使うのが流行のようですが、ここでは TensorFlow.js の Core API（低水準API）を使って非線形回帰モデルを作成する方法を「掛け算の九九の表を学習して乗算をするニューラルネットワーク」を例にとって紹介します。Core API でも簡単に回帰モデルを作成することができます。

※ブラウザ版はこちらです。
※TensorFlow.js のインストール手順や実行方法については、こちらの記事を参考にしてください。

〈掛け算の九九の表を学習して乗算をする３層ニューラルネットワーク〉

tensorflow.mjs


import * as fs from "fs";
import * as os from "os";
import * as tf from "@tensorflow/tfjs";

class NeuralNetwork {
  units1 = 2;  /* 第１層（入力層）のユニット数 */
  units2 = 7;  /* 第２層（隠れ層）のユニット数 */
  units3 = 1;  /* 第３層（出力層）のユニット数 */
  epochs = 50000;  /* エポック数 */
  w1 = tf.variable(tf.randomUniform([this.units1, this.units2], -1, 1));
  b1 = tf.variable(tf.randomUniform([this.units2], -1, 1));
  w2 = tf.variable(tf.randomUniform([this.units2, this.units3], -1, 1));
  b2 = tf.variable(tf.randomUniform([this.units3], -1, 1));
  model(x) {
    return x.matMul(this.w1).add(this.b1).tanh().matMul(this.w2).add(this.b2);
  }
  loss(x, y) {
    return tf.losses.meanSquaredError(this.model(x), y);
  }
  train(x, y) {
    const optimizer = tf.train.adam(0.001, 0.9, 0.999, 0.00000001);
    for (let epoch = 1; epoch <= this.epochs; epoch++) {
      optimizer.minimize(() => {
        const loss = this.loss(tf.tensor(x), tf.tensor(y));
        if (epoch % 1000 == 0) console.log(`${epoch}epoch: loss = ${loss.arraySync()}`);
        return loss;
      });
    }
  }
  predict(x) {
    return this.model(tf.tensor([x])).arraySync()[0];
  }
}

const neuralNetwork = new NeuralNetwork();

/* 掛け算の九九の表 */
const x_train = Array.from((function* () { for (let x1 = 1; x1 <= 9; x1++) for (let x2 = 1; x2 <= 9; x2++) yield [x1, x2]; })());
const y_train = Array.from((function* () { for (let x1 = 1; x1 <= 9; x1++) for (let x2 = 1; x2 <= 9; x2++) yield [x1 * x2]; })());

/* 学習 */
neuralNetwork.train(x_train, y_train);

/* 推論 */
for (let x1 = 1; x1 <= 9; x1++) for (let x2 = 1; x2 <= 9; x2++) console.log(`${x1} * ${x2} -> ${neuralNetwork.predict([x1, x2])}`);

/* パラメーターのファイル出力 */
const parameters = `
w1 = ${JSON.stringify(neuralNetwork.w1.arraySync())}${os.EOL}
b1 = ${JSON.stringify(neuralNetwork.b1.arraySync())}${os.EOL}
w2 = ${JSON.stringify(neuralNetwork.w2.arraySync())}${os.EOL}
b2 = ${JSON.stringify(neuralNetwork.b2.arraySync())}${os.EOL}
`;
fs.writeFileSync("parameters.dat", parameters);

注）importステートメントを使ってモジュールを呼び出しているので、ファイルの拡張子は mjs にしてください。
注）３層ニューラルネットワークのモデル関数及び w1、b1、w2、b2 については、ニューラルネットワークで使う数式のまとめを参照してください。
注）train(x, y)及びpredict(x)の引数は、テンソルではなくJavaScriptの配列です。関数本体の方でtf.tensor(･･･)を使ってテンソルに変換しています。

結論

TensorFlow.js の Core API はとても使い易いです！ニューラルネットワーク以外の回帰分析に使えるのもメリットの一つです。 TensorFlow.js の登場で、これまで Python の独壇場だった AI の分野で JavaScript が使われるようになりそうですね。

参考記事

TensorFlow.jsをWindowsにインストールしてNode.js上で実行する

21/11/2020

まず、Node.js をインストールします。続いて、コマンドプロンプトから npm を使ってローカルに TensorFlow.js をインストールします。
注）Node.js のバージョンによっては、TensorFlow.js をインストールできないことがあります。Node.js 15.1.0 は OK でした。

〈ローカルインストール〉


> cd /d D:\tensorflowjs
> npm install @tensorflow/tfjs-node

〈実行〉


> cd /d D:\tensorflowjs
> set path=node_modules\.bin;%path%
> node tensorflow.mjs

D:\tensorflowjs\tensorflow.mjs


import * as tf from "@tensorflow/tfjs";
const s = tf.scalar(0);
s.print();
const t = tf.tensor([[0, 1, 2], [3, 4, 5]]);
t.print();
const v = tf.variable(tf.zeros([2, 3]));
v.print();
v.assign(tf.ones([2, 3]));
v.print();
console.log(v.arraySync());
console.log(`${v.arraySync()}`);
console.log(v.dataSync());
console.log(`${v.dataSync()}`);
console.log(v.toString());

注）importステートメントを使ってモジュールを呼び出しているので、ファイルの拡張子は mjs にしてください。

参考記事

TensorFlow：Eager Modeで高速化する方法

20/2/2019

突然ですが、TensorFlow の Eager Mode（Eager Execution）を使っていますか？私が初めて使った時、これは便利だと思ったのですが、速度が遅いので止めました。

そんなのろまな Eager Mode（Define by Run）を Graph Mode（Define and Run）より高速にする方法を紹介します。

参考にした記事は、Tensorflow Eager vs PyTorch （強化学習編）です。jack_ama さん、ありがとうございます <(_ _)>

やり方は簡単！下記の nn99_eager.py を見てもらえればわかるように、@tf.contrib.eager.defun を一行追加するだけです。
結果は以下のようになりました。（TensorFlow 1.13.1で再度計測しました2019/3/3）

処理時間比較（TensorFlow 1.13.1）
Mode	処理時間
Graph Mode	21.501 sec
Eager Mode（@tf.contrib.eager.defun無し）	85.694 sec
Eager Mode（@tf.contrib.eager.defun有り）	17.486 sec

なんと、Eager Mode（@tf.contrib.eager.defun有り）が、Graph Mode より約1.2倍高速になりました。
比較対象の Graph Mode 版は、TensorFlow：ニューラルネットワークによる乗算の学習の nn99_graph.py です。

今回作成したプログラムは、以下のようになります。

OS：Ubuntu 18.04
TensorFlow 1.13.1（Eager ModeではTensorFlow 1.12.0の方が高速です）

nn99_eager.py（@tf.contrib.eager.defun有り）


import math
import numpy as np
import tensorflow as tf
import time

tf.enable_eager_execution()

class Model:
  units1 = 2
  units2 = 7
  units3 = 1
  epochs = 50001

  def __init__(self):
    self.W1 = tf.Variable(tf.random_uniform([self.units1, self.units2], -1.0, 1.0, tf.float32))
    self.b1 = tf.Variable(tf.random_uniform([self.units2], -1.0, 1.0, tf.float32))
    self.W2 = tf.Variable(tf.random_uniform([self.units2, self.units3], -1.0, 1.0, tf.float32))
    self.b2 = tf.Variable(tf.random_uniform([self.units3], -1.0, 1.0, tf.float32))
    #self.optimizer = tf.train.GradientDescentOptimizer(learning_rate=0.001)
    self.optimizer = tf.train.AdamOptimizer(learning_rate=0.001, beta1=0.9, beta2=0.999, epsilon=1.0e-8)

  def model(self, x):
    return tf.matmul(self.f(tf.matmul(x, self.W1) + self.b1), self.W2) + self.b2

  def f(self, x):
    return tf.tanh(x)

  def loss(self, x, y):
    return tf.reduce_mean(tf.square(self.model(x) - y))

  def grad(self, x, y):
    with tf.GradientTape() as tape:
      loss = self.loss(x, y)
      params = [self.W1, self.b1, self.W2, self.b2]
    return tape.gradient(loss, params)

  @tf.contrib.eager.defun
  def optimize(self, x, y):
    grads = self.grad(x, y)
    params = [self.W1, self.b1, self.W2, self.b2]
    self.optimizer.apply_gradients(zip(grads, params))

  def train(self, x, y):
    start = time.time()
    for step in range(self.epochs):
      self.optimize(x, y)
      if step % 1000 == 0:
        loss = self.loss(x, y)
        print("Step={:5d}, Loss={:8.5f}".format(step, loss))
    stop = time.time()
    print("{:.3f}sec".format(stop - start))

  def predict(self, x):
    return self.model(x)[0].numpy()

model = Model()

x_train = tf.convert_to_tensor(np.array([[x1, x2] for x1 in range(1, 10, 1) for x2 in range(1, 10, 1)]), tf.float32)
y_train = tf.convert_to_tensor(np.array([[x1 * x2] for x1 in range(1, 10, 1) for x2 in range(1, 10, 1)]), tf.float32)

model.train(x_train, y_train)

for i in range(1, 21, 1):
  print("{:2d} * {:2d} -> {:7.3f}".format(i, i, model.predict([[float(i), float(i)]])[0]))

Graph Mode さよ～なら～ (^o^)/~

Eager Mode だ～いすき♪（菊川怜）

最後に残念なお知らせがあります。TensorFlow 2.0 では、@tf.contrib.eager.defun がサポートされないそうです。
どうしたらいいんでしょう．．．

参考サイト

TensorFlow：ニューラルネットワークによる乗算の学習

18/2/2019

今回は、掛け算の九九の表（1～9までの整数の掛け算）を3層のニューラルネットワークに学習させ、実数の乗算ができるようにします。
言い換えると、

　　F(x1, x2) = x1 * x2

という関数をニューラルネットワークで作るということです。
プログラムは、TensorFlow を使って作成します。また、活性化関数は、双曲線正接関数 tanh を使うことにします。

　　units1 ：入力層のユニット数（入力変数の個数）
　　units2 ：隠れ層のユニット数
　　units3 ：出力層のユニット数（出力変数の個数）
　　epochs：勾配降下法の反復回数

尚、3層ニューラルネットワークのモデル関数及び W1、b1、W2、b2 については、ニューラルネットワークで使う数式のまとめを参照してください。

今回作成したプログラムは、以下のようになります。

OS：Ubuntu 18.04
TensorFlow 1.12.0

nn99_graph.py


import math
import numpy as np
import tensorflow as tf
import time

class Model:
  units1 = 2
  units2 = 7
  units3 = 1
  epochs = 50001

  def __init__(self):
    self.W1 = tf.Variable(tf.random_uniform([self.units1, self.units2], -1.0, 1.0, tf.float32))
    self.b1 = tf.Variable(tf.random_uniform([self.units2], -1.0, 1.0, tf.float32))
    self.W2 = tf.Variable(tf.random_uniform([self.units2, self.units3], -1.0, 1.0, tf.float32))
    self.b2 = tf.Variable(tf.random_uniform([self.units3], -1.0, 1.0, tf.float32))
    self.xd = tf.placeholder(tf.float32, [None, self.units1])
    self.yd = tf.placeholder(tf.float32, [None, self.units3])
    #self.optimizer = tf.train.GradientDescentOptimizer(learning_rate=0.001)
    self.optimizer = tf.train.AdamOptimizer(learning_rate=0.001, beta1=0.9, beta2=0.999, epsilon=1.0e-8)
    self.loss = self.loss()
    self.optimizer_op = self.optimize(self.loss)

  def model(self, x):
    return tf.matmul(self.f(tf.matmul(x, self.W1) + self.b1), self.W2) + self.b2

  def f(self, x):
    return tf.tanh(x)

  def loss(self):
    return tf.reduce_mean(tf.square(self.model(self.xd) - self.yd))

  def optimize(self, loss):
    return self.optimizer.minimize(loss)

  def train(self, session, x, y):
    start = time.time()
    for step in range(self.epochs):
      session.run(self.optimizer_op, feed_dict={self.xd:x, self.yd:y})
      if step % 1000 == 0:
        loss = session.run(self.loss, feed_dict={self.xd:x, self.yd:y})
        print("Step=%5d, Loss=%8.5f" % (step, loss))
    stop = time.time()
    print("%.3f sec" % (stop - start))

  def predict(self, session, x):
    return session.run(self.model(x)[0])

model = Model()

with tf.Session() as sess:
  sess.run(tf.global_variables_initializer())

  x_train = np.array([[x1, x2] for x1 in range(1, 10, 1) for x2 in range(1, 10, 1)])
  y_train = np.array([[x1 * x2] for x1 in range(1, 10, 1) for x2 in range(1, 10, 1)])

  model.train(sess, x_train, y_train)

  for i in range(1, 21, 1):
    print("%2d * %2d -> %7.3f" % (i, i, model.predict(sess, [[float(i), float(i)]])[0]))

注）今回は、-1～+1の範囲で乱数を生成させ、パラメータの初期値を設定しましたが、入力変数や出力変数のデータの範囲を考慮して乱数の範囲を設定してください。

注）オプティマイザーとして局所最適解に陥りにくい Adam Optimizer を用いていますが、局所解に陥ることもあるので、何度か初期値を変えて学習させ、損失関数の最も小さいものを選んでください。

結果は以下のようになりました。もちろん、2.3 × 5.8 のような実数同士の掛け算もできます。


 1 *  1 ->   0.983
 2 *  2 ->   3.973
 3 *  3 ->   8.937
 4 *  4 ->  15.956
 5 *  5 ->  24.924
 6 *  6 ->  35.976
 7 *  7 ->  48.929
 8 *  8 ->  63.953
 9 *  9 ->  81.006
10 * 10 ->  90.502
11 * 11 ->  91.155
12 * 12 ->  89.974
13 * 13 ->  88.384
14 * 14 ->  86.649
15 * 15 ->  84.887
16 * 16 ->  83.185
17 * 17 ->  81.614
18 * 18 ->  80.221
19 * 19 ->  79.030
20 * 20 ->  78.042

データを与えた1～9までの範囲では、比較的いい値になっていますが、データの範囲外では大きくずれることがわかります。これは活性化関数として±∞で定数に近づく双曲線正接関数を用いたからです。同様に、シグモイド関数を使った場合でも、外挿すると大きくずれるので注意してください。

参考サイト

ニューラルネットワークで使う数式のまとめ

31/1/2019

ここでは、実際に TensorFlow などのライブラリを使ってニューラルネットワークのモデルを作成するための数式をまとめました。
以降ニューラルネットワークと言えば、順伝播型ニューラルネットワーク（多層パーセプトロン）のことです。

ここで扱うのは、教師あり機械学習（supervised machine learning）です。教師あり機械学習では、入力データと出力データのペア（訓練データ）を学習します。尚、入力データを特徴量（features）、出力データを教師データ（labels, labeled data）と呼ぶことがあります。

\(L\)：層数（第\(1\)層：入力層、第\(L\)層：出力層）

\(n_{l}\)：第\(l\)層のユニット数（ノード数）

\(x_{1},x_{2},\cdot\cdot\cdot,x_{n_{1}}\)：入力変数（独立変数、説明変数、特徴量）

\(y_{1},y_{2},\cdot\cdot\cdot,y_{n_{L}}\)：出力変数（従属変数、目的変数、教師データ）

\(f\)：活性化関数（activation function）

\(F^{(L)}\)：\(L\)層ニューラルネットワークのモデル関数（model function）

\(w^{(l)}_{ij}\)：第\(l\)層の\(i\)番目のユニットと第\(l+1\)層の\(j\)番目のユニットをリンクする重み（weight）

\(b^{(l)}_{i}\)：第\(l+1\)層の\(i\)番目のユニットのバイアス（bias）

\(\boldsymbol{x}=(x_{1},x_{2},\cdot\cdot\cdot,x_{n_{1}})\)

\(\boldsymbol{y}=(y_{1},y_{2},\cdot\cdot\cdot,y_{n_{L}})\)

\(\boldsymbol{b}^{(l)}=(b^{(l)}_{1},b^{(l)}_{2},\cdot\cdot\cdot,b^{(l)}_{n_{l}})\)

\(W^{(l)}=\Bigl(w^{(l)}_{ij}\Bigr)\)

注）\(\boldsymbol{x}\)、\(\boldsymbol{y}\)、\(\boldsymbol{b}^{(l)}\)は行ベクトル、\(W^{(l)}\)は行列です。

回帰モデルのモデル関数

ニューラルネットワークは3層あれば、隠れ層（中間層）のニューロン（ノード、ユニット）を増やすことで、有限領域でどんな関数でも作り出せることが知られています。これを利用して回帰モデルでは、入力データの関数として出力データを近似します。

注）ほとんどの教科書では、\(W\boldsymbol{x}\) のように重み \(W\) を左側にしますが、TensorFlow の表記に合わせ、以下では \(\boldsymbol{x}W\) のように表記します。

○2層ニューラルネットワーク

\[ \boldsymbol{y}=F^{(2)}(\boldsymbol{x})=\boldsymbol{x}W^{(1)}+\boldsymbol{b}^{(1)} \] \[ y_{j}=F^{(2)}_{j}(x_{1},x_{2},\cdot\cdot\cdot,x_{n_{1}})=\sum_{i=1}^{n_{1}}x_{i}w^{(1)}_{ij}+b^{(1)}_{j} \]

○3層ニューラルネットワーク

\[ \boldsymbol{y}=F^{(3)}(\boldsymbol{x})=f(\boldsymbol{x}W^{(1)}+\boldsymbol{b}^{(1)})W^{(2)}+\boldsymbol{b}^{(2)} \] \[ y_{k}=F^{(3)}_{k}(x_{1},x_{2},\cdot\cdot\cdot,x_{n_{1}})=\sum_{j=1}^{n_{2}}f\Bigl(\sum_{i=1}^{n_{1}}x_{i}w^{(1)}_{ij}+b^{(1)}_{j}\Bigr)w^{(2)}_{jk}+b^{(2)}_{k} \]

○4層ニューラルネットワーク

\[ \boldsymbol{y}=F^{(4)}(\boldsymbol{x})=f(f(\boldsymbol{x}W^{(1)}+\boldsymbol{b}^{(1)})W^{(2)}+\boldsymbol{b}^{(2)})W^{(3)}+\boldsymbol{b}^{(3)} \] \[ y_{l}=F^{(4)}_{l}(x_{1},x_{2},\cdot\cdot\cdot,x_{n_{1}})=\sum_{k=1}^{n_{3}}f\Bigl(\sum_{j=1}^{n_{2}}f\Bigl(\sum_{i=1}^{n_{1}}x_{i}w^{(1)}_{ij}+b^{(1)}_{j}\Bigr)w^{(2)}_{jk}+b^{(2)}_{k}\Bigr)w^{(3)}_{kl}+b^{(3)}_{l} \]

○5層ニューラルネットワーク

\[ \boldsymbol{y}=F^{(5)}(\boldsymbol{x})=f(f(f(\boldsymbol{x}W^{(1)}+\boldsymbol{b}^{(1)})W^{(2)}+\boldsymbol{b}^{(2)})W^{(3)}+\boldsymbol{b}^{(3)})W^{(4)}+\boldsymbol{b}^{(4)} \] \[ y_{m}=F^{(5)}_{m}(x_{1},x_{2},\cdot\cdot\cdot,x_{n_{1}})=\sum_{l=1}^{n_{4}}f\Bigl(\sum_{k=1}^{n_{3}}f\Bigl(\sum_{j=1}^{n_{2}}f\Bigl(\sum_{i=1}^{n_{1}}x_{i}w^{(1)}_{ij}+b^{(1)}_{j}\Bigr)w^{(2)}_{jk}+b^{(2)}_{k}\Bigr)w^{(3)}_{kl}+b^{(3)}_{l}\Bigr)w^{(4)}_{lm}+b^{(4)}_{m} \]

6層以上の場合も同様です。

注）回帰モデルの場合、出力層の活性化関数は恒等関数なので、右辺の全体に活性化関数は掛かっていません。

活性化関数（Activation Function）

活性化関数はモデル関数を作る基になる関数です。

○\(\tanh{x}\)：双曲線正接関数 \[ \tanh{x}=\frac{e^{x}-e^{-x}}{e^{x}+e^{-x}}=\frac{2}{1+e^{-2x}}-1 \] \[ \tanh'{x}=1-(\tanh{x})^{2} \]
○\({\rm{sigmoid}}(x)\)：\({\rm{Sigmoid}}\)関数 \[ {\rm{sigmoid}}(x)=\frac{1}{1+e^{-x}}=\frac{1}{2}(\tanh{\frac{x}{2}}+1) \] \[ {\rm{sigmoid}}'(x)={\rm{sigmoid}}(x)\,(1-{\rm{sigmoid}}(x)) \]
○\({\rm{relu}}(x)\)：\({\rm{ReLU}}\)関数（\({\rm{Ramp}}\)関数） \[ {\rm{relu}}(x)=\begin{cases}x & x \geqq 0 \\ 0 & x<0\end{cases} \] \[ {\rm{relu}}'(x)=\begin{cases}1 & x>0 \\ 0 & x<0\end{cases} \]
○\({\rm{softplus}}(x)\)：\({\rm{Softplus}}\)関数 \[ {\rm{softplus}}(x)=\ln{(e^{x}+1)}=\max{(x,0)}+\ln{(1+e^{-|x|})} \] \[ {\rm{softplus}}'(x)=\frac{1}{1+e^{-x}} \]
○\({\rm{S}}_{i}(\boldsymbol{x})\)：\({\rm{Softmax}}\)関数 \[ {\rm{S}}_{i}(\boldsymbol{x})={\rm{S}}_{i}(x_{1},x_{2},\cdot\cdot\cdot,x_{n})=\frac{e^{x_{i}}}{e^{x_{1}}+e^{x_{2}}+\cdot\cdot\cdot+e^{x_{n}}} \] \[ \frac{\partial{\rm{S}}_{i}(\boldsymbol{x})}{\partial x_{j}}={\rm{S}}_{i}(\boldsymbol{x})\,(\delta_{ij}-{\rm{S}}_{j}(\boldsymbol{x})) \] 注）\({\rm{Softmax}}\)関数の入力値をロジット（logit）と呼ぶことがあります。出力値は確率です。\({\rm{Softmax}}\)関数はマルチクラス分類の際に用いられます。

損失関数

回帰モデルでは、損失関数として平均二乗誤差（Mean Squared Error）を用います。尚、損失関数（loss function）のことを誤差関数（error function）と呼ぶことがあります。

平均二乗誤差

\(N\)：データ数

\(l_{k}(w,b)\)：二乗誤差

\(L(w,b)\)：平均二乗誤差

\(x_{k}\)：\(k\)番目の入力データ

\(y_{k}\)：\(k\)番目の出力データ

\[ l_{k}(w,b)=\sum_{j=1}^{n_{L}}(F_{j}(x_{k,i})-y_{k,j})^{2} \] \[ L(w,b)=\frac{1}{N}\sum_{k=1}^{N}l_{k}(w,b) \]

回帰分析

27/7/2017

♦平均２乗誤差（Mean Squared Error）

\[MSE=\frac{1}{n}\sum_{i=1}^{n}(y_{i}-f(x_{i}))^{2}\]

♦決定係数（Coefficient of Determination）

\[R^{2}=1-\frac{\displaystyle{\sum_{i=1}^{n}(y_{i}-f(x_{i}))^{2}}}{\displaystyle{\sum_{i=1}^{n}(y_{i}-\bar{y})^{2}}}\]

決定係数は回帰関数\(f\)がどの程度データにフィットしているかを表します。1に近い程フィットしています。

決定係数が1に近い		決定係数が1から離れている

図３．バラツキが小さい		図４．バラツキが大きい

<<Previous

RNNの定式化

rnn.mjs

まとめ

参考記事

tensorflow.mjs

tensorflow.py（@tf.function有り）

参考記事

tensorflow.html

参考記事

〈Clangのインストール〉

〈Swiftのインストール〉

〈Swift for TensorFlowのインストール〉

〈コンパイルと実行〉

tensorflow.swift

〈実行結果〉

tensorflow.swift

参考記事

結論

参考記事

〈ローカルインストール〉

〈実行〉

D:\tensorflowjs\tensorflow.mjs

参考記事

参考サイト

参考サイト

回帰モデルのモデル関数

活性化関数（Activation Function）

損失関数

平均二乗誤差

♦平均２乗誤差（Mean Squared Error）

♦決定係数（Coefficient of Determination）

作成者

Archives

カテゴリ