java多线程——并发测试

Wesley13
• 阅读 593

这是多线程系列第六篇,其他请关注以下:

java 多线程—线程怎么来的?

java多线程-内存模型

java多线程——volatile

java多线程——锁

java多线程——CAS

编写并发程序时候,可以采取和串行程序相同的编程方式。唯一的难点在于,并发程序存在不确定性,这种不确定性会令程序出错的地方远比串行程序多,出现的方式也没有固定规则。这对程序的应用会造成一些困难,那么如何在测试中,尽可能的暴露出这些问题,并且了解其性能瓶颈,这也是对开发者带来新的挑战。

本篇基于多线程知识,梳理一些多线程测试需要掌握的方法和原则,以期望可能的在开发阶段,就暴露出并发程序的安全性和性能问题,为多线程能够高效安全的运行提供帮助。

本篇主要包含以下内容:

1. 并发测试分类

2. 正确性测试

3. 安全性测试

4. 性能测试

并发测试分类

测试流程

并发测试和串行测试有相同的部分,比如都需要线测试其在串行情况下的正确性,这个是保证后续测试的基础,当然了,正确性测试和我们的串行测试方没有什么不同,都是在保证其程序在单线程情况下执行和串行执行有相同的结果,这个我们不再陈述。 

一般的并发测试,我们按照以下流程来进行。

java多线程——并发测试

分类

并发测试大致可以分为两类:安全性测试与活跃性测试。

安全性测试我们可以定义为“不发生任何错误的行为”,也可以理解为保持一致性。比如i++操作,但单线程情况下,循环20次,i=20,可是在多线程情况下,如果总共循环20次,结果不为20,那么这个结果就是错误的,说明出现了错误的线程安全问题。我们在测试这种问题的时候,必须要增加一个”test point”保证其原子性同时又不影响程序的正确性。以此为判断条件执行测试代码,关于“test point”如何做,我们后续再讨论。

活跃性测试定义为“某个良好的行为终究会发生”,也可以为理解为程序运行有必然的结果,不会出现因某个方法阻塞,而运行缓慢,或者是发生了线程死锁,导致一直等待的状态等。

与活跃性测试相关的是性能测试。主要有以下几个方面进行衡量:吞吐量,响应性,可伸缩性。

  • 吞吐量:一组并发任务中已完成任务所占的比例。或者说是一定时间内完成任务的数量。
  • 响应性:请求从发出到完成之间的时间
  • 可伸缩性:在增加更多资源(CPU,IO,内存),吞吐量的提升情况。

安全性测试

安全性测试,如前面所说是“不发生任何错误的行为”,也是要对其数据竞争可能引发的错误进行测试。这也是我们需要找到一个功能中并发的的“test point”,并对其额外的构造一些测试。而且这些测试最好不需要任何同步机制。

我们通过一个例子来进行说明。

比如ArrayBlockingQueue,我们知道这个class是采用一个有界的阻塞队列来实现的生产-消费模式的。如果对其测试并发问题的,重要的就是对put和take方法进行测试,一种有效的方法就是检查被放入队列中和出队列中的各个元素是否相等。如果出现数据安全性的问题,那么必然入队列的值和出队列的值没有发生对应,结果也不尽相同。比如多线程情况下,我们把所有入列元素和出列元素的校检和进行比较,如果二者相等,那么表明测试成功。

为了保证其能够测试到所有要点,需要对入队的值进行随机生成,令每次测试得到的结果不尽相同。另外为了保证其公平性,要保证所有的线程一起开始运算,防止先进行的程序进行串行运算。

public class PutTakeTest {

    protected static final ExecutorService pool = Executors.newCachedThreadPool();



    //栅栏,通过它可以实现让一组线程等待至某个状态之后再全部同时执行

    protected CyclicBarrier barrier;

    protected final ArrayBlockingQueue<Integer> bb;

    protected final int nTrials, nPairs;

    //入列总和

    protected final AtomicInteger putSum = new AtomicInteger(0);

    //出列总和

    protected final AtomicInteger takeSum = new AtomicInteger(0);



    public static void main(String[] args) throws Exception {

        new PutTakeTest(10, 10, 100000).test(); // 10个承载因子,10个线程,运行100000

        pool.shutdown();

    }



    /**

     *

     * @param capacity 承载因子(缓存)

     * @param npairs 线程数量

     * @param ntrials 单个线程执行数量(吞吐量)

     */

    public PutTakeTest(int capacity, int npairs, int ntrials) {

        this.bb = new ArrayBlockingQueue<Integer>(capacity);

        this.nTrials = ntrials;

        this.nPairs = npairs;

        this.barrier = new CyclicBarrier(npairs * 2 + 1);

    }



    void test() {

        try {

            for (int i = 0; i < nPairs; i++) {

                pool.execute(new Producer());

                pool.execute(new Consumer());

            }

            barrier.await(); // 等待所有的线程就绪

            barrier.await(); // 等待所有的线程执行完成

            System.out.println("result,put==take :"+(putSum.get()==takeSum.get()));

        } catch (Exception e) {

            throw new RuntimeException(e);

        }

    }



    static int xorShift(int y) {

        y ^= (y << 6);

        y ^= (y >>> 21);

        y ^= (y << 7);

        return y;

    }



    //生产者

    class Producer implements Runnable {

        public void run() {

            try {

                int seed = (this.hashCode() ^ (int) System.nanoTime());

                int sum = 0;

                barrier.await();

                for (int i = nTrials; i > 0; --i) {

                    bb.put(seed);

                    sum += seed;

                    seed = xorShift(seed);

                }

                putSum.getAndAdd(sum);

                barrier.await();

            } catch (Exception e) {

                throw new RuntimeException(e);

            }

        }

    }



    //消费者

    class Consumer implements Runnable {

        public void run() {

            try {

                barrier.await();

                int sum = 0;

                for (int i = nTrials; i > 0; --i) {

                    sum += bb.take();

                }

                takeSum.getAndAdd(sum);

                barrier.await();

            } catch (Exception e) {

                throw new RuntimeException(e);

            }

        }

    }

}

以上程序中,我们增加putSum和takeSum变量,用来统计put和take数据的校检和。同时采用CyclicBarrier(回环栅栏)令所有的线程同一时间从相同的位置开始执行。每个线程的入列数据,为了保证其唯一性,都生成一个唯一的seed,在下列代码执行出,必然是多线程竞争的地方,

    for (int i = nTrials; i > 0; --i) {

         bb.put(seed);

                    sum += seed;

                    seed = xorShift(seed);

       }

如果此处出现线程安全问题,那么最终take出来的数据和put的数据必然是不相同的,最终putSum和takeSum的值必然不同,相反则相同。

由于并发代码中大多数错误都是一些低概率的事件,因此在测试的时候,还是需要反复测试多次,以提高发现错误的概率。

性能测试

性能测试通常是功能测试的延伸。虽然性能测试与功能测试之间会有重叠之处,但它们的目标是不同的。

首先性能测试需要反映出被测试对象在应用程序中的实际用法以及它的吞吐量。另外需要根据经验值来调整各种不同的限值,比如线程数,并发数等,从而令程序更好的在系统上运行。

我们对上述的PutTakeTest进行扩展,增加以下功能:

1、增加一个记录运行一次分组的运行时间,为了保证时间精确性。

采用BarrierTimer来维护,它implements Runnable,在计数达到栅栏(CyclicBarrier)指定的数量之后,会调用一次该回调,设置结束时间。

我们用它来记录,单个测试运行的时间。有总时间了,单次操作的时间就可以计算出来了。如此我们就可以计算出单个测试的吞吐量。

吞吐量=1ms/单次操作的时间=每秒可以执行的次数。

以下是基于栅栏的计时器。

public class BarrierTimer implements Runnable{

    private boolean started;

    private long startTime, endTime;



    public synchronized void run() {

        long t = System.nanoTime();

        if (!started) {

            started = true;

            startTime = t;

        } else

            endTime = t;

    }



    public synchronized void clear() {

        started = false;

    }



    public synchronized long getTime() {

        return endTime - startTime;

    }


}

2、性能测试需要针对不同参数组合进行测试。

通过不同参数来进行组合测试,以此来获得在不同参数下的吞吐率,以及不同线程数量下的可伸缩性。在putTakeTest里面,我们只只针对安全性测试。

我们看加强版本的TimedPutTakeTest,这里我们把ArrayBlockingQueue的容量分别设置为1、10、100、1000,令其在线程数量分别为1、2、4、8、16、32、64、128的情况下,看其链表的吞吐率。

public class TimedPutTakeTest extends PutTakeTest {

    private BarrierTimer timer = new BarrierTimer();



    public TimedPutTakeTest(int cap, int pairs, int trials) {

        super(cap, pairs, trials);

        barrier = new CyclicBarrier(nPairs * 2 + 1, timer);

    }



    public void test() {

        try {

            timer.clear();

            for (int i = 0; i < nPairs; i++) {

                pool.execute(new PutTakeTest.Producer());

                pool.execute(new PutTakeTest.Consumer());

            }

            barrier.await();

            barrier.await();

            long nsPerItem = timer.getTime() / (nPairs * (long) nTrials);

            System.out.print("Throughput: " + nsPerItem + " ns/item");

            System.out.println("result:"+(putSum.get()==takeSum.get()));

        } catch (Exception e) {

            throw new RuntimeException(e);

        }

    }



    public static void main(String[] args) throws Exception {

        int tpt = 100000; // trials per thread

        for (int cap = 1; cap <= 1000; cap *= 10) {

            System.out.println("Capacity: " + cap);

            for (int pairs = 1; pairs <= 128; pairs *= 2) {

                TimedPutTakeTest t = new TimedPutTakeTest(cap, pairs, tpt);

                System.out.print("Pairs: " + pairs + "\t");

                t.test();

                System.out.print("\t");

                Thread.sleep(1000);

                t.test();

                System.out.println();

                Thread.sleep(1000);

            }

        }

        PutTakeTest.pool.shutdown();

    }

}

以下是我们针对ArrayBlockingQueue的性能测试结果,我的电脑硬件环境是:

cpu i7 4核8线程

memory  16G

硬盘 SSD110G

jdk 环境

java version “1.8.0_45"

Java HotSpot(TM) 64-Bit Server VM (build 25.45-b02, mixed mode)

java多线程——并发测试

从上面可以看到以下几点情况

1、在ArrayBlockingQueue的缓存容量在1的情况下,无论线性并发数为多少,都不能显著的提升其吞吐率。这是因为每个线程在阻塞等待另外线程执行任务。

2、当尝试把缓存容量提升至10、100、1000的时候,吞吐率都得到了极大的提高,特别是在1000的时候,最高可达到900w次/s。

3、当线程增加到16个的时候,吞吐率会达到顶峰,然后再增加线程吞吐率不生反而下降,当然没有很大的下降,这是因为,当线程增多的时候,大部分时间耗费在阻塞和解除阻塞上面了。

其他阻塞队列的比较

以下是针对ArrayBlockingQueue、LinkedBlockingQueue、LinkedBlockingDeQue、PriorityBlockingQueue几种阻塞队列进行的横向测评。硬件环境还是和上述相同。jdk还是采用1.8的API。

每个队列的缓存容量是1000。然后分别在1、2、4、8、16、32、64、128的线程并发下,查看其吞吐率。

java多线程——并发测试

从上述数据中,我们可以看到:

1、ArrayBlockingQueue在jdk1.8的优化下性能高于LinkedBlockingQueue,虽然两者差别不是太大,这个是1.6之前,LinkedBlockingQueue是要优于ArrayBlockingQueue的。

2、PriorityBlockingQueue在达到290w的吞吐高峰之后,性能开始持续的下降,这是因为优先队列需要不断的优化优先列表,而需要一定的排序时间。

以上测试的主要目的是,测试生产者和消费者在通过有界put和take传送数据时,那些约束条件将对整个吞吐量产生影响。所以会忽略了许多实际的因素。另外由于jit的动态编译,会直接将编译后的代码直接编译为机器代码。所以以上测试需要经过预热处理,运行更多的次数,以保证所有的代码都是编译完成之后,才统计测试的运行时间。

最后

测试并发程序的正确性可能会特别困难的,因为并发程序的许多故障都是一些低概率的事情,并且它们对执行时序、负载情况以及其他难以重现的条件比较敏感。要想尽可能的发现这些错误,就需要我们做更多的工作来进行分析测试,期待今天的介绍能够帮助大家开阔一些思路。

引用:

以上测试代码,引用自《java Concurrency in Practice》

点赞
收藏
评论区
推荐文章
blmius blmius
2年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Wesley13 Wesley13
2年前
java多线程——volatile
这是java多线程第三篇:《java多线程—线程怎么来的》(https://my.oschina.net/u/1859679/blog/1517807)《java多线程内存模型》(https://my.oschina.net/u/1859679/blog/1525343)上一篇《java多线程—内存模型》已经讲解了java
Wesley13 Wesley13
2年前
java多线程——锁
这是多线程系列第四篇,其他请关注以下:java多线程—线程怎么来的?(https://my.oschina.net/u/1859679/blog/1517807)java多线程内存模型(https://my.oschina.net/u/1859679/blog/1525343)java多线程——volatile
Stella981 Stella981
2年前
KVM调整cpu和内存
一.修改kvm虚拟机的配置1、virsheditcentos7找到“memory”和“vcpu”标签,将<namecentos7</name<uuid2220a6d1a36a4fbb8523e078b3dfe795</uuid
Wesley13 Wesley13
2年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Wesley13 Wesley13
2年前
00:Java简单了解
浅谈Java之概述Java是SUN(StanfordUniversityNetwork),斯坦福大学网络公司)1995年推出的一门高级编程语言。Java是一种面向Internet的编程语言。随着Java技术在web方面的不断成熟,已经成为Web应用程序的首选开发语言。Java是简单易学,完全面向对象,安全可靠,与平台无关的编程语言。
Stella981 Stella981
2年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
Wesley13 Wesley13
2年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
京东云开发者 京东云开发者
6个月前
Java服务总在半夜挂,背后的真相竟然是... | 京东云技术团队
最近有用户反馈测试环境Java服务总在凌晨00:00左右挂掉,用户反馈Java服务没有定时任务,也没有流量突增的情况,Jvm配置也合理,莫名其妙就挂了
Python进阶者 Python进阶者
3个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这