今天聊聊怎么给表写入数据-低调大师

今天聊聊怎么给表写入数据

2019-12-19 570

上期给大家将了，如何在交互式分析中高效建表，并构建表索引以及给表设置属性，以期在同等资源情况下，能更快的查询到表数据。往期精彩传送门：今天来聊聊怎么高效建表。今天小编就来为大家讲讲如何把数据写入进表里。

当前版本的交互式分析支持的数据写入来源有：MaxCompute、实时计算（Flink）以及交互式分析这3种，当前交互式分析支持insert into select 和insert into vaues两种标准的PG表达方式，可以写入部分字段，也可以写入全部字段，下面就以分区表和非分区表两种场景来将，如何将数据写入表中。

场景1：将数据写进非分区表中

1.建一张非分区表

CREATE TABLE holo_test (
 id int8 NOT NULL,
 age int8,
 name text,
 born timestamptz,
 class text,
 tel text,
PRIMARY KEY (id)
);
CALL SET_TABLE_PROPERTY('holo_test', 'orientation', 'column');

2.两种方式导入数据

//方式1:
INSERT INTO holo_test VALUES 
(1,    25,    'Tom',    '1993-07-02', 'mid', '0253-889902'),
(2, 22, 'Dad', '1994-09-12', 'hig', '0222-555222'),
(3, 24, 'www', '1995-09-15', 'mid', '0232-5445292'),
(4, 23, 'Lily', '1996-02-17', 'hig', '0234-8745209');

//方式2:
INSERT INTO holo_test 
SELECT  5, 23, 'neal', '1994-05-13', 'hig', '0154-8778209';

若是直接从MaxCompute 中导入数据，还可以使用以下语句

insert into table1
select * from table2; //全部字段导入

insert into table1
select 
id,
name
from table2;//导入部分字段数据

说明：两种insert的方式，在性能上，若是大量数据，insert into values可能写入的比较麻烦，insert into select可以直接将数据从另一个表中写入，较简单，性能表现也会更快。

场景2:将数据写入分区表中

当一张表数据很大时，通常会用到分区，在交互式分析中也支持分区表，关于分区表的创建可以参考文档：管理和创建分区表。
1.新建一张分区表

CREATE TABLE par_holo (
 id int8,
 name text,
 ds text
)
PARTITION BY LIST (ds);
CALL SET_TABLE_PROPERTY('par_holo', 'orientation', 'column');

2.新建一张分区子表

CREATE TABLE par_holo_1 PARTITION of par_holo 
FOR VALUES in ('ds');

3.将数据写入进分区子表

//方式1
INSERT INTO par_holo_1 VALUES (1,'a','ds');

INSERT INTO par_holo_1 
SELECT  2,'b','ds';

关于MaxCompute数据导入至交互式分析中可以参见文档：MaxCompute导入查询。
或者往期精彩：来了，2行代码秒级查询MaxCompute！
但看完本文的朋友们可能会又疑问，要是导本地文件，或者这么负责的写法，数据量大的时候怎么办，偷偷告诉大家，别担心，下期给大家讲解如何使用copy。
关于在使用交互式分析中有任何问题，请进钉钉群交流

微信关注我们

原文链接：https://yq.aliyun.com/articles/740039

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

今天来聊聊怎么给表写入数据

上期给大家将了，如何在交互式分析中高效建表，并构建表索引以及给表设置属性，以期在同等资源情况下，能更快的查询到表数据。往期精彩传送门：今天来聊聊怎么高效建表。今天小编就来为大家讲讲如何把数据写入进表里。当前版本的交互式分析支持的数据写入来源有：MaxCompute、实时计算（Flink）以及交互式分析这3种，当前交互式分析支持insert into select 和insert into vaues两种标准的PG表达方式，可以写入部分字段，也可以写入全部字段，下面就以分区表和非分区表两种场景来将，如何将数据写入表中。场景1：将数据写进非分区表中 1.建一张非分区表 CREATE TABLE holo_test ( id int8 NOT NULL, age int8, name text, born timestamptz, class text, tel text, PRIMARY KEY (id) ); CALL SET_TABLE_PROPERTY('holo_test', 'orientation', 'column'); 2.两种方式导入数据 //方式1: INSERT ...

2019-12-19

779

有人说，「深度学习“等于”深度卷积神经网络算法模型+大规模数据+云端分布式算力」。也有人说，「能够在业内叱咤风云的AI都曾“身经百战”，经历过无数次的训练与试错」。以上都需要海量数据做依托，对于那些数据量匮乏的领域，就衍生出了数据增强技术。即，根据一个原始数据，稍作改动，变成一个对于AI来说的全新的数据。 01 为什么做数据增强？数据规模的重要性到底怎样呢？可以说，深度学习的火热和蓬勃发展，直接源于普林斯顿大学教授李飞飞及她所带领的团队创作的一个包含百万级图片的数据集ImageNet。工业级人脸识别模型的训练，也是动辄百万级、千万级的人脸图片数量。深度学习是基于大数据的一种方法，我们当然希望数据的规模越大、质量越高越好，模型才能够有着更好的泛化能力。但大家都知道，海量数据的标注是一件非常庞大、非常耗时耗力耗金的工作，能标注的数据往往十分有限，同时，我们希望数据能覆盖各种场景，然而实际采集数据的时候，往往很难覆盖掉全部的场景。这时数据增强是扩充数据样本规模的一种有效的方法。 02 如何进行数据增强？数据增强可以分为常规的数据增强和特殊的数据增强。常规的数据增强方法又可分为：空间几何变...

2019-12-18

724

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。