在MongoDB里实现循环序列功能

MongoDB  /  houtizong 发布于 2年前   252

环境是这样的:服务器是用Java做的, 数据库是MongoDB

 

需求是这样的:我们的系统里要生成一个唯一ID,前面的部分有一定的格式,并和时间关联, 精确到微秒,考虑到同一微秒内有可能存在并发情况, 所以后面在加两位序列号, 系统需要定义为1毫秒内的并发小于100个,所以后面两位就够用了。 Java服务器端有多台机器都可以用来生成这个唯一ID,所以需要在不同的机器上不能生成相同的序列号,所以需要在某一点上做全局的范围同步来保存这序列号的唯一性。 其实如果不考虑需求里的唯一ID是有一定意义的格式的, 用UUID或MongoDB的ObjectId都是更好的选择,完全不需要在某一点上进行同步,性能会更好。

 

这个可以生成序列号的点, 我们可以做一个序列号生成服务器来对应, 也可以用数据库来对应。 单单为这个简单的功能准备一个服务器来做显然不合适。 但是我们用的MongoDB并没有类似于MySQL或Oracle中的SELECT FOR UPDATE这样的锁机制。 所以没有办法简单的对这个序列号做原子操作。 但是MongoDB的对单个document进行update操作中有很是具有原子性的, 例如

  • $set
  • $unset
  • $inc
  • $push
  • $pushAll
  • $pull
  • $pullAll

我们可以利用这些原子操作,在数据库层以乐观锁的形式来实现循环序列字段。为了方便调用我把这段逻辑做成数据库中的Javascript函数。 类似与MySQL中的存储过程。

 

首先我们需要一个collection来存放序列号,并对需要的需要的序列号进行初始化。我们叫它counters。

db.counters.save({_id:"SerialNo1", val:0, maxval:99})

 

然后我们想system.js里添加一个Javascript函数

db.system.js.save({_id:"getNextUniqueSeq",value:function (keyName) {    var seqObj = db.counters.findOne({_id:keyName});    if (seqObj == null) {print("can not find record with key: " + keyName);        return -1;    }    // the max value of sequence    var maxVal = seqObj.maxval;    // the current value of sequence    var curVal = seqObj.val;while(true){// if curVal reach max, reset itif(curVal >= maxVal){db.counters.update({_id : keyName, val : curVal}, { $set : { val : 0 }}, false, false);var err = db.getLastErrorObj();if( err && err.code ) {print( "unexpected error reset data: " + tojson( err ) );                return -2;        } else if (err.n == 0){// fail to reset value, may be reseted by othersprint("fail to reset value: ");} // get current value again.seqObj = db.counters.findOne({_id:keyName});maxVal = seqObj.maxval;curVal = seqObj.val;continue;} // if curVal not reach the max, inc it;// increase db.counters.update({_id : keyName, val : curVal}, { $inc : { val : 1 }}, false, false);var err = db.getLastErrorObj();if( err && err.code ) {print( "unexpected error inc val: " + tojson( err ) );               return -3;        } else if (err.n == 0){// fail to reset value, may be increased by othersprint("fail to inc value: ");// get current value again.seqObj = db.counters.findOne({_id:keyName});maxVal = seqObj.maxval;curVal = seqObj.val;continue;} else {var retVal = curVal + 1;print("success to get seq : " + retVal);// increase successfulreturn retVal;}}}});

上面这段会把指定的序列号的val值+1,如果val达到上限则从0开始。所以叫循环序列。

 

其实上面的实现在原理上和Java里的AtomicInteger系列的功能实现是类似的,利用循环重试和原子性的CAS来实现。这种实现方式在多线程的环境里由于锁(Monitor)的范围很小,所以并发性上比排他锁要好一些。

 

下面我们用Java来测试一下这个函数的正确性。 即在多线程的情况下会不会得到重复的序列号。

 

第一个测试,val=0, maxval=2000, Java端20个线程每个线程循环调用100次。 共2000次。 所以正确的情况下,从0到1999应该每个数字只出现一次。

 

    @Test    public void testGetNextUniqueSeq1() throws Exception {        final int THREAD_COUNT = 20;        final int LOOP_COUNT = 100;        Mongo mongoClient = new Mongo("172.17.2.100", 27017);        DB db = mongoClient.getDB("im");        db.authenticate("imadmin", "imadmin".toCharArray());        BasicDBObject q = new BasicDBObject();        q.put("_id", "UNIQUE_KEY");        BasicDBObject upd = new BasicDBObject();        BasicDBObject set = new BasicDBObject();        set.put("val", 0);        set.put("maxval", THREAD_COUNT * LOOP_COUNT);        upd.put("$set", set);        db.getCollection("counters").update(q, upd);        Thread[] threads = new Thread[THREAD_COUNT];        final int[][] results = new int[THREAD_COUNT][LOOP_COUNT];        for (int i = 0; i < THREAD_COUNT; i++) {            final int temp_i = i;            threads[i] = new Thread("" + i) {                @Override                public void run() {                    try {                        Mongo mongoClient = new Mongo("172.17.2.100", 27017);                        DB db = mongoClient.getDB("im");                        db.authenticate("imadmin", "imadmin".toCharArray());                        for (int j = 0; j < LOOP_COUNT; j++) {                            Object result = db.eval("getNextUniqueSeq(\"UNIQUE_KEY\")");                            System.out.printf("Thread %s, seq=%d\n", Thread.currentThread().getName(), ((Double) result).intValue());                            results[temp_i][j] = ((Double) result).intValue();                        }                    } catch (UnknownHostException e) {                        e.printStackTrace();                    }                }            };        }        for (Thread thread : threads) {            thread.start();        }        for (Thread thread : threads) {            thread.join();        }        for (int num = 1; num <= LOOP_COUNT * THREAD_COUNT; num++) {            // every number appear 1 times only!            int times = 0;            for (int j = 0; j < THREAD_COUNT; j++) {                for (int k = 0; k < LOOP_COUNT; k++) {                    if (results[j][k] == num)                        times++;                }            }            assertEquals(1, times);        }    }

 

然后我们再测试一下循环的情况。 val=0, maxval=99。 同样是Java端20个线程每个线程循环调用100次。 共2000次。这次从0到99的数字每个应该取得20次。

 

    @Test    public void testGetNextUniqueSeq2() throws Exception {        final int THREAD_COUNT = 20;        final int LOOP_COUNT = 100;        Mongo mongoClient = new Mongo("172.17.2.100", 27017);        DB db = mongoClient.getDB("im");        db.authenticate("imadmin", "imadmin".toCharArray());        BasicDBObject q = new BasicDBObject();        q.put("_id", "UNIQUE_KEY");        BasicDBObject upd = new BasicDBObject();        BasicDBObject set = new BasicDBObject();        set.put("val", 0);        set.put("maxval", LOOP_COUNT);        upd.put("$set", set);        db.getCollection("counters").update(q, upd);        Thread[] threads = new Thread[THREAD_COUNT];        final int[][] results = new int[THREAD_COUNT][LOOP_COUNT];        for (int i = 0; i < THREAD_COUNT; i++) {            final int temp_i = i;            threads[i] = new Thread("" + i) {                @Override                public void run() {                    try {                        Mongo mongoClient = new Mongo("172.17.2.100", 27017);                        DB db = mongoClient.getDB("im");                        db.authenticate("imadmin", "imadmin".toCharArray());                        for (int j = 0; j < LOOP_COUNT; j++) {                            Object result = db.eval("getNextUniqueSeq(\"UNIQUE_KEY\")");                            System.out.printf("Thread %s, seq=%d\n", Thread.currentThread().getName(), ((Double) result).intValue());                            results[temp_i][j] = ((Double) result).intValue();                        }                    } catch (UnknownHostException e) {                        e.printStackTrace();                    }                }            };        }        for (Thread thread : threads) {            thread.start();        }        for (Thread thread : threads) {            thread.join();        }        for (int num = 1; num <= LOOP_COUNT; num++) {            // every number appear 20 times only!            int times = 0;            for (int j = 0; j < THREAD_COUNT; j++) {                for (int k = 0; k < LOOP_COUNT; k++) {                    if (results[j][k] == num)                        times++;                }            }            assertEquals(20, times);        }    }

 

这个测试跑了几次都是正确的。

 

由于没有可以进行对比其他的实现方式(例如排他锁)所以没有做性能测试。

 

写在最后。 虽然MongoDB支持类似于存储过程的Stored Javascript,但是其实不建议使用这个来解决复杂问题。主要原因是没法调试,维护起来太不方便。而且在2.4之前MongoDB对服务端Javascript支持并不是很好, 一个mongod进程同时只能执行一段Javascript。如果能在应用层解决掉还是在应用层里实现逻辑比较好。

上一篇:JAVA解析JSON相关
下一篇:2500电脑配置

请勿发布不友善或者负能量的内容。与人为善,比聪明更重要!

留言需要登陆哦

技术博客集 - 网站简介:
前后端技术:
后端基于Hyperf2.1框架开发,前端使用Bootstrap可视化布局系统生成

网站主要作用:
1.编程技术分享及讨论交流,内置聊天系统;
2.测试交流框架问题,比如:Hyperf、Laravel、TP、beego;
3.本站数据是基于大数据采集等爬虫技术为基础助力分享知识,如有侵权请发邮件到站长邮箱,站长会尽快处理;
4.站长邮箱:[email protected];

      订阅博客周刊 去订阅

文章归档

文章标签

友情链接

Auther ·HouTiZong
侯体宗的博客
© 2020 zongscan.com
版权所有ICP证 : 粤ICP备20027696号
PHP交流群 也可以扫右边的二维码
侯体宗的博客