在浏览器中进行深度学习：TensorFlow.js (十一）时间序列预测-低调大师

在浏览器中进行深度学习：TensorFlow.js (十一）时间序列预测

2019-05-20 702

时间序列是对某一个或者一组变量 x(t) 进行观察测量，将在一系列时刻 t1,t2,⋯,tn 所得到的离散数字组成的序列集合。

时间序列预测的机器学习的一种常见应用，例如预测股票和金融产品价格走势，温度，天气的走势等等

传统的统计学时间序列预测的一些方法包括：

AR （自回归模型 Auto Regression）
MA （移动平均 Moving Average ）
ACF/PACF （自相关和偏自相关）
ARIMA （AR和MA模型的结合）
卡尔曼滤波

但是这些传统的基于统计的方法用起来并不方便，你可能需要利用ACF/PACF找到一些时序数据的规律然后设置超参数来进行时序数据的分析。

facebook开源的prophet是另一个选择，利用prophet来进行时许数据的分析比较简单，但是本质上，prophet是基于另一盒开源工具pystan，仍然是基于统计来进行时序数据的分析。

利用深度神经网络，例如LSTM，我们也可以很方便的进行时序数据的分析，那么我们就看看如可利用TensorflowJS来进行时序数据的分析吧。

数据导入

我们要分析的数据集是一组模拟的航空旅客的数据信息，如下图：

这组数据可以看成一个线性模型和一个震荡模型（正余弦）的叠加，我们看看LSTM能不能学习出这个规律。

async function loadData(path) {
  return await d3.csv(path);
}

const airPassagnerData = await loadData(
    "https://cdn.jsdelivr.net/gh/gangtao/datasets@master/csv/air_passengers.csv"
  );

数据准备

在数据准备阶段，我们要为我们的LSTM模型准备训练数据。

首先我们对数据进行做一个标准化操作：

  // Normalize data with value change
  let changeData = [];
  for (let i = 1; i < airPassagnerData.length; i++) {
    const item = {};
    item.date = airPassagnerData[i].Date;
    const val = parseInt(airPassagnerData[i].Number);
    const val0 = parseInt(airPassagnerData[i - 1].Number);
    item.value = val / val0 - 1;
    changeData.push(item);
  }

也就是把绝对数据变成涨跌的百分比，标准化后的数据都在 -1 和 +1之间，反映了数据相对于前一个时间点的涨跌。

然后就是就是准备训练数据了，在准备训练数据之前，我们要理解一下LSTM的输入数据的形状：

LSTM需要一个三维的数据输入，分别对应Batch（数据是一批一批进入神经网络训练），Input是输入数据的size和Timestep，时间。所以我们在构造训练数据的时候，需要针对时间维度创建训练数据。

const STEP_SIZE = 3;
const STEP_NUM = 24;
const STEP_OFFSET = 1;
const TARGET_SIZE = 12;

function buildX(data, stepSize, stepNum, stepOffset) {
  let xData = [];
  for (let n = 0; n < stepNum; n += 1) {
    const startIndex = n * stepOffset;
    const endIndex = startIndex + stepSize;
    const item = data.slice(startIndex, endIndex).map(obj => obj.value);
    xData.push(item);
  }
  return xData;
}

function makeTrainData(data, stepSize, stepNum, stepOffset, targetSize) {
  const trainData = { x: [], y: [] };

  const length = data.length;

  const xLength = stepSize + stepOffset * (stepNum - 1);
  const yLength = targetSize;
  const stopIndex = length - xLength - yLength;

  for (let i = 0; i < stopIndex; i += 1) {
    const x = data.slice(i, i + xLength);
    const y = data.slice(i + xLength + 1, i + xLength + 1 + yLength);

    const xData = buildX(x, stepSize, stepNum, stepOffset);
    const yData = y;

    trainData.x.push(xData.map(item => item));
    trainData.y.push(yData.map(item => item.value));
  }
  return trainData;
}

const trainData = makeTrainData(
    changeData,
    STEP_SIZE,
    STEP_NUM,
    STEP_OFFSET,
    TARGET_SIZE
  );

这里我们利用滑动时间窗口的方法来构建训练数据，用到了以下几个参数：

STEP_SIZE
这个是数据窗口的大小，3表示每一个数据包含三个值，数据input维度就是3
STEP_NUM
这个是一共要走多少步，24表示走24步，那个Time维度就是24
STEP_OFFSET
这个offset决定了时间窗口向前移动的时候，每次走多少个时间单位，我这里取1，也就是每次走一步，这样第一个数据和第二个数据其实存在两个重复值。
TARGET_SIZE
这个是我要预测的时间长度，12表示预测12个月的数据。

模型构建

模型的构建代码如下：

function buildModel() {
  const model = tf.sequential();

  //lstm input layer
  const hidden1 = tf.layers.lstm({
    units: LSTM_UNITS,
    inputShape: [STEP_NUM, STEP_SIZE],
    returnSequences: true
  });
  model.add(hidden1);

  //2nd lstm layer
  const output = tf.layers.lstm({
    units: TARGET_SIZE,
    returnSequences: false
  });
  model.add(output);

  model.add(
    tf.layers.dense({
      units: TARGET_SIZE
    })
  );

  model.add(tf.layers.activation({ activation: "tanh" }));

  //compile
  const rmsprop = tf.train.rmsprop(0.005);
  model.compile({
    optimizer: rmsprop,
    loss: tf.losses.meanSquaredError
  });

  return model;
}

我们的网络一共有两个LSTM层，一个Dense层和一个激活层。优化器我们选择了rmsprop，损失函数是mse，因为我们其实一个回归模型。

利用TensorflowJS提供的模型导出功能，我们可以导出训练好的模型，并利用Netron（一个神经网络可视化工具，支持各种神经网络）来查看我们的模型。

const saveResults = await model.save('downloads://model-name');

我第一次用Netron的时候，TensorflowJS导出的JSON模型有错误，我给作者提了一个Issue，当天修复，赞一个！

模型训练

训练数据和模型都准备好了，下一步我们就开始训练了。

async function trainBatch(data, model) {
  const metrics = ["loss", "val_loss", "acc", "val_acc"];
  const container = {
    name: "show.fitCallbacks",
    tab: "Training",
    styles: {
      height: "1000px"
    }
  };
  const callbacks = tfvis.show.fitCallbacks(container, metrics);

  console.log("training start!");
  tfvis.visor();

  const epochs = config.epochs;
  const results = [];
  const xs = tf.tensor3d(data.x);
  const ys = tf.tensor2d(data.y);

  const history = await model.fit(xs, ys, {
    batchSize: config.batchSize,
    epochs: config.epochs,
    validationSplit: 0.2,
    callbacks: callbacks
  });

  console.log("training complete!");
  return history;
}

const trainData = makeTrainData(
    changeData,
    STEP_SIZE,
    STEP_NUM,
    STEP_OFFSET,
    TARGET_SIZE
  );
const model = buildModel();
model.summary();

为了监控训练的过程，我们使用了tfvis，它在DOM中提供了一个可视化的框架，可以很方便的监控训练过程。

我们发现，从开始到第30的迭代，损失指标有明显的下降，这正是我们希望看到的，30个迭代后，损失下降的不明显。

预测

最后我们可以预测了，注意预测的时候，我们需要把标准化的涨跌数据还原为实际的值。

  async function predict(model, input) {
    const prediction = await model.predict(tf.tensor([input])).data();
    return prediction;
  }

  const inputStart = changeData.length - X_LEN;
  const inputEnd = changeData.length;
  const input = changeData.slice(inputStart, inputEnd);
  const predictInput = buildX(input, STEP_SIZE, STEP_NUM, STEP_OFFSET);
  const prediction = await predict(model, predictInput);
  
  // re-constructe predicted value based on change
  const base = airPassagnerData[airPassagnerData.length-1];
  const baseDate = moment(new Date(base.Date));
  const baseValue = parseInt(base.Number);
  
  let predictionValue = [];
  let val = baseValue;
  for( let i = 0; i < prediction.length; i+=1) {
    const item = {};
    const date = baseDate.add(1, 'months');
    item.time = moment(date).format('YYYY-MM-DD');
    item.value = val + val * prediction[i];
    item.isPrediction = "Yes";
    predictionValue.push(item);
    val = item.value;
  }
  
  console.log(predictionValue);
  let airPassagnerDataWithPrediction = [];
  chartData.forEach(item => {
    item.isPrediction = "No";
    airPassagnerDataWithPrediction.push(item);
  })
  predictionValue.forEach(item => {
    airPassagnerDataWithPrediction.push(item);
  })

上图是训练了一个迭代后的结果。

上图是10个迭代后的结果。

上图是我训练30个迭代后的结果，感觉LSTM很好的学习到了趋势和震荡。有兴趣的同学可以去跑我在Codepen上的代码。或者我的gist

总结

本文提供了一个使用LSTM来预测时间序列的例子。有一些经验分享给大家：

对于输入数据，一开始是的size是1，但是训练的效果很差，为了有好的训练效果，把Size增加到3，结果很不错。
LSTM会有梯度消失的问题，如果选择合适的网络结构，参数需要有相当的经验和尝试。
在本文的问题中，复杂和更深的网络并不能带来效果的明显提升。
我们利用窗口滑动获取训练数据的过程和卷积操作很像，据说利用CNN也可以达到不错的效果，有兴趣的同学可以试一下。

参考

微信关注我们

原文链接：https://my.oschina.net/taogang/blog/3051709

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Solr搜索引擎 — SolrCloud介绍和环境准备

搞定了一切的一切之后下一步就是正式使用了，但是之前介绍的都是在单台服务器上进行的部署，如果在生产环境出现了单台故障怎么办呢？提供稳定性和性能的最直观的方式就是集群，solr官方提供了cloud的集群方式附上: 喵了个咪的博客：http://w-blog.cn Solr官网：http://lucene.apache.org/solr/ PS：8.0.0版本已经发布，本文使用此时较为稳定的7.7.1版本一，SolrCloud介绍 SolrCloud是基于Solr和Zookeeper的分布式搜索方案。它的主要思想是使用Zookeeper作为SolrCloud集群的配置信息中心，统一管理solrcloud的配置，比如solrconfig.xml和schema.xml。 SolrCloud(solr集群)是Solr提供的分布式搜索方案，一下场景能够比较好的使用SolrCloud 当你需要大规模，容错，分布式索引和检索能力时使用SolrCloud。当索引量很大，搜索请求并发很高时，同样需要使用SolrCloud来满足这些需求。不过当一个系统的索引数据量少的时候是没有必要使用SolrClou...

2019-05-20

585

问：线程安全问题的主要诱因？存在共享数据（也称临界资源）存在多条线程共同操作这些共享数据解决方法：同一时刻有且只有一个线程在操作共享数据，其他线程必须等到该线程处理完数据后再对共享数据进行操作互斥锁的特征：互斥性：即在同一时间只允许一个线程持有某个对象锁，通过这种特性来实现多线程协调机制，这样在同一时间只有一个线程对需要同步的代码块（复合操作）进行访问。互斥性也称为操作的原子性。可见性：必须确保在锁被释放之前，对共享变量所做的修改，对于随后获得该锁的另一个线程是可见的（即在获得锁时应该获得最新共享变量的值），否则另一个线程可能是在本地缓存的某个副本上继续操作，从而引起不一致。 ps：synchronized 锁的不是代码，锁的是对象获取锁的分类：获取对象锁、获取类锁获取对象锁的两种用法：同步代码块（synchronized(this),synchronized(类实例对象)），锁是小括号中的实例对象同步非静态方法（synchronized method）锁是当前对象的实例对象获取类锁的两种用法：同步代码块（synchronized(类.class)），锁是小括...

2019-05-20

775

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。