在 EMR 中使用 Mongo-Hadoop
在 EMR 中使用 Mongo-Hadoop
Mongo-Hadoop 是 MongoDB 推出的用于 Hadoop 系列组件连接 MongoDB 的组件。其原理跟我们上一篇文章介绍的 ES-Hadoop 类似。EMR 中已经集成了 Mongo-Hadoop,用户不用做任何部署配置,即可使用 Mongo-Hadoop。下面我们通过几个例子来展示一下 Mongo-Hadoop 的用法。
准备
在下面这几个例子中,我们使用一个统一的数据模型
{
"id": long,
"name": text,
"age": integer,
"birth": date
}
由于我们是要通过 Mongo-Hadoop 向 MongoDB 的特定 collection (可以理解成数据库中的表)写数据,因此需要首先确保 MongoDB 上存在这个