【NodeJs】用arrayObject.join,''处理粘包的错误原因

服务器测试代码如下:

var net = require('net');
var server = net.createServer(function(c){
    console.log('client connected: ' + c.remoteAddress);
    c.setNoDelay(true);
    var arr = [];
    c.on('data', function(data){
        arr.push(data);
    });
    c.on('end', function(){
        var str = arr.join('');//(1)
        console.log('all data: ' + str);
        console.log('disconnected from client');
    });
});
server.listen({port:6200}, function(){
    console.log('server bound');
});

黄色部分为处理粘包的测试用关键代码。经测试,这种方法是错误的。原因是在特定字符编码格式下,1个字符可能占用多个字节,而data是Buffer对象,是以字节为存储基本单元的。在传输的过程中,某一个字符很可能被截断到两次data事件回调中。而arr.join('')在连接各元素之前,先要把每个元素转换为字符串。而data中的被截断字符部分就不能正确的转换成字符串,造成部分数据转换错误。

改正:

方法1:可以使用Buffer.concat(list[, totalLenght])替换arr.join(separator),代码如下:

var str = Buffer.concat(arr).toString();

方法2:在server的连接事件中执行如下代码:

c.setEncoding('utf8'); //执行该代码后会将data事件中的data从Buffer对象改为String对象。参见官方API的Stream.Readable.setEndoding部分