妙手试探MySQL单表Insert插入极限-已实现每秒插入8.5万条数据-低调大师

妙手试探MySQL单表Insert插入极限-已实现每秒插入8.5万条数据

2021-12-07 529

很多同学都有这样的困扰：

工作中项目的数据量不大，遇不到sql优化的场景：单表就几万，我优化个der啊；
业务对性能要求不高，远远没达到性能瓶颈：咱这项目又不是不能跑，优化个der啊；

确实，如果你的项目体量不大，不管是数据层还是应用层，都很难接触到性能优化，但是我们可以自己造数据啊！！

推荐Spring Cloud分布式微服务云架构电子商务源码

扫码体验

今天我带来了一个demo，不仅让你能把多线程运用到实际项目中，还能用它往数据库造测试数据，让你体验下大数据量的表优化

定个小目标，今天造它一亿条数据！！

首先搞清楚，不要为了用技术而用技术，技术一定是为了实现需求：

插入一亿条数据，这是需求；
为了提高效率，运用多线程异步插入，这是方案；

1、为了尽可能模拟真实场景，我们new个对象

靠phone和createTime俩字段，能大大降低数据重复度，抛开别的字段不说，这俩字段基本能保证没有重复数据，所以我们最终的数据很真实，没有一条是重复的，而且，最后还能通过createTime来统计每秒插入条数，nice~

public class Person {
    private Long id;
    private String name;//姓名
    private Long phone;//电话
    private BigDecimal salary;//薪水
    private String company;//公司
    private Integer ifSingle;//是否单身
    private Integer sex;//性别
    private String address;//住址
    private LocalDateTime createTime;
    private String createUser;
}

2、想要插的更快，我们得使用MyISAM引擎，并且要主键自增

DDL：

CREATE TABLE `person` (
  `id` bigint NOT NULL AUTO_INCREMENT,
  `name` varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL,
  `phone` varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL,
  `salary` decimal(10,2) NOT NULL,
  `company` varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL,
  `if_single` tinyint NOT NULL,
  `sex` tinyint NOT NULL,
  `address` varchar(225) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL,
  `create_time` datetime NOT NULL,
  `create_user` varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL,
  PRIMARY KEY (`id`)
) ENGINE=MyISAM AUTO_INCREMENT=30170001 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;

3、为了模拟真实数据，我们得用到一些枚举值和随机算法

部分属性枚举值：

private String[] names = {"黄某人", "负债程序猿", "谭sir", "郭德纲", "蔡徐鸡", "蔡徐老母鸡", "李狗蛋", "铁蛋", "赵铁柱"};
private String[] addrs = {"二仙桥", "成华大道", "春熙路", "锦里", "宽窄巷子", "双子塔", "天府大道", "软件园", "熊猫大道", "交子大道"};
private String[] companys = {"京东", "腾讯", "百度", "小米", "米哈游", "网易", "字节跳动", "美团", "蚂蚁", "完美世界"};

随机获取person

private Person getPerson() {
        Person person = Person.builder()
                .name(names[random.nextInt(names.length)])
                .phone(18800000000L + random.nextInt(88888888))
                .salary(new BigDecimal(random.nextInt(99999)))
                .company(companys[random.nextInt(companys.length)])
                .ifSingle(random.nextInt(2))
                .sex(random.nextInt(2))
                .address("四川省成都市" + addrs[random.nextInt(addrs.length)])
                .createUser(names[random.nextInt(names.length)]).build();
        return person;
    }

5、orm层用的mybatis

  <insert id="insertList" parameterType="com.example.demos.entity.Person">
        insert into person (name, phone, salary, company, if_single, sex, address, create_time, create_user)
        values
        <foreach collection="list" item="item" separator=",">
            (#{item.name}, #{item.phone}, #{item.salary}, #{item.company}, #{item.ifSingle}, #{item.sex},
            #{item.address}, now(), #{item.createUser})
        </foreach>
    </insert>

准备工作完成，开始写核心逻辑

思路：
1、想要拉高插入效率，肯定不能够一条一条插了，必须得foreach批量插入，经测试，单次批量3w条以下时性价比最高，并且不用修改mysql配置
2、文章开头说了，得开多个线程异步插入，我们先把应用层效率拉满，mysql顶不顶得住
3、我们不可能单次提交一亿次insert，这谁顶得住，而且大量插入操作会很耗时，短时间内完不成，我们不可能一直守着，我的方案是用定时任务

算了屁话不多说，直接上demo

@Component
public class PersonService {
    private static final int THREAD_COUNT = 10;
    @Autowired
    private PersonMapper personMapper;
    @Autowired
    private ThreadPoolExecutor executor;
    private AtomicInteger integer = new AtomicInteger();
    private Random random = new Random();
    private String[] names = {"黄某人", "负债程序猿", "谭sir", "郭德纲", "蔡徐鸡", "蔡徐母鸡", "李狗蛋", "铁蛋", "赵铁柱"};
    private String[] addrs = {"二仙桥", "成华大道", "春熙路", "锦里", "宽窄巷子", "双子塔", "天府大道", "软件园", "熊猫大道", "交子大道"};
    private String[] companys = {"京东", "腾讯", "百度", "小米", "米哈游", "网易", "字节跳动", "美团", "蚂蚁", "完美世界"};

    @Scheduled(cron = "0/15 * * * * ?")
    public void insertList() {
        System.out.println("本轮任务开始，总任务数：" + THREAD_COUNT);
        long start = System.currentTimeMillis();
        AtomicLong end = new AtomicLong();
        for (int i = 0; i < THREAD_COUNT; i++) {
            Thread thread = new Thread(() -> {
                try {
                    for (int j = 0; j < 20; j++) {
                        personMapper.insertList(getPersonList(5000));
                    }
                    end.set(System.currentTimeMillis());
                    System.out.println("本轮任务耗时：" + (end.get() - start) + "____已执行" + integer.addAndGet(1) + "个任务" + "____当前队列任务数" + executor.getQueue().size());
                } catch (Exception e) {
                    e.printStackTrace();
                }
            });
            try {
                executor.execute(thread);
            } catch (Exception e) {
                System.out.println(e.getMessage());
            }
        }
    }

    private ArrayList<Person> getPersonList(int count) {
        ArrayList<Person> persons = new ArrayList<>(count);
        for (int i = 0; i < count; i++) {
            persons.add(getPerson());
        }
        return persons;
    }

    private Person getPerson() {
        Person person = Person.builder()
                .name(names[random.nextInt(names.length)])
                .phone(18800000000L + random.nextInt(88888888))
                .salary(new BigDecimal(random.nextInt(99999)))
                .company(companys[random.nextInt(companys.length)])
                .ifSingle(random.nextInt(2))
                .sex(random.nextInt(2))
                .address("四川省成都市" + addrs[random.nextInt(addrs.length)])
                .createUser(names[random.nextInt(names.length)]).build();
        return person;
    }
}

我的线程池配置，我电脑配置比较拉跨，只有12个线程…

@Configuration
public class ThreadPoolExecutorConfig {
    @Bean
    public ThreadPoolExecutor threadPoolExecutor() {
        ThreadPoolExecutor executor = new ThreadPoolExecutor(10, 12, 5, TimeUnit.SECONDS, new ArrayBlockingQueue<>(100));
        executor.allowCoreThreadTimeOut(true);
        return executor;
    }
}

测试

现在表是空的

项目跑起来

已经在开始插了，挂在后台让它自己跑！

25 minutes later ，看下数据库

已经插入了1.04亿条数据，需求完成

第一条数据是15:54:15开始的，耗时大概25min

再来从数据库中看下一秒插入多少条，直接count某秒即可

一秒8.5w，嘎嘎快

来说下demo中核心的几个点：

关于线程：我的cpu只有十二个线程，所以核心线程设置的10，留两个线程打杂；
关于线程中的逻辑：每个线程有20次循环，每次循环插入5000条；
关于获取随机对象：我没有统计创建对象的耗时，因为即使是创建100w个对象，但是这都是内存操作，跟insert这种io操作比起来，耗时几乎可以忽略，我就不测试了，你可以自己试试；
关于效率：你们看到的版本（10 * 20 * 5000）是我只优化过几次的半成品，这种搭配最终的效率是100w条耗时12.5s，效率肯定不是最高的，但基本够用！！

可以看看之前的测试效率记录

10 * 100 * 1000：22-23s
10 * 50 * 2000：19-20s
10 * 10 * 10000 ：18-20s

可以参考记录进行深度调优

哦对了，想效率更快的话，表不要建索引，insert时维护索引也是一笔不小的开销！

微信关注我们

原文链接：https://my.oschina.net/u/3613013/blog/5346695

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Grafana 任意文件读取漏洞通告

报告编号：B6-2021-120701 报告来源：360CERT 报告作者：360CERT 更新日期：2021-12-07 1漏洞简述 2021年12月07日，360CERT监测发现网上存在Grafana 任意文件读取漏洞，该漏洞目前为0day漏洞，漏洞编号：暂无，漏洞等级：高危，漏洞评分：7.5。目前该漏洞POC已公开对此，360CERT建议广大用户做好资产自查以及预防工作，以免遭受黑客攻击。 2风险等级 360CERT对该漏洞的评定结果如下评定方式等级威胁等级高危影响面广泛攻击者价值高利用难度低 360CERT评分 7.5 3漏洞详情 Grafana 任意文件读取漏洞 CVE: 暂无组件: Grafana 漏洞类型: 文件读取影响: 获取敏感信息简述: 未授权的攻击者利用该漏洞，能够获取服务器敏感文件。 4影响版本组件影响版本安全版本 Grafana 8.x 暂无 5修复建议通用修补建议目前暂无相关补丁，即使关注官方动态，获取最新版本。 https://github.com/grafana/grafana/releases https://g...

2021-12-07

1571

每年的re:invent简直就是一场亚马逊云技术的大型展销会。一系列产品总能击中你的兴奋点，让你隐隐预感某些技术将迎来新的时代革命。 2021 re:Invent 全球大会期间，在拉斯维加斯，新任亚马逊云科技首席执行官 Adam Selipsky 对亚马逊过去十五年的发展历程进行了回顾总结，并同时一如既往发布了数十款新功能和服务。从最早的S3存储、EC2弹性计算等汇集了云基础能力的旗帜性产品，到如今，亚马逊云已经拥有475+不同产品实例，涵盖通用型、计算优化型、内存优化型、存储优化型、硬件加速型等工作负载。从产品功能上讲，亚马逊云现在提供超过200项全功能服务，涵盖计算、存储、数据库、数据分析、机器学习与人工智能。援引分析师的估计，目前云上支出只占整个IT支出的5%到15%。对于云产业而言，未来将有大量工作负载迁移上云，仍有巨大增长空间。尽管过去两年，re:Invent大会都因为疫情的影响无法面向全球参会人员进行线下交流，但中国市场的客户、伙伴、开发者们是亚马逊云无法忽视的一部分。本次大会“探路者”一词贯穿始终，亚马逊全球副总裁、亚马逊云科技大中华区执行董事张文翊表示： “大家...

2021-12-07

465

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。