`

【转】使用WebRTC搭建前端视频聊天室——信令篇

 
阅读更多

 

转:使用WebRTC搭建前端视频聊天室——信令篇

转自:http://www.tuicool.com/articles/eYJvee

建议看这篇之前先看一下 使用WebRTC搭建前端视频聊天室——入门篇

前面的话

这篇文章讲述了WebRTC中所涉及的信令交换以及聊天室中的信令交换,主要内容来自 WebRTC in the real world: STUN, TURN and signaling ,我在这里提取出的一些信息,并添加了自己在开发时的一些想法。

WebRTC的服务器

WebRTC提供了浏览器到浏览器(点对点)之间的通信,但并不意味着WebRTC不需要服务器。暂且不说基于服务器的一些扩展业务,WebRTC至少有两件事必须要用到服务器:
1. 浏览器之间交换建立通信的元数据(信令)必须通过服务器
2. 为了穿越NAT和防火墙

为什么需要信令?

我们需要通过一系列的信令来建立浏览器之间的通信。而具体需要通过信令交换哪些内容呢?这里大概列了一下:
1. 用来控制通信开启或者关闭的连接控制消息
2. 发生错误时用来彼此告知的消息
3. 媒体流元数据,比如像解码器、解码器的配置、带宽、媒体类型等等
4. 用来建立安全连接的关键数据
5. 外界所看到的的网络上的数据,比如IP地址、端口等

在建立连接之前,浏览器之间显然没有办法传递数据。所以我们需要通过服务器的中转,在浏览器之间传递这些数据,然后建立浏览器之间的点对点连接。但是WebRTC API中并没有实现这些。

为什么WebRTC不去实现信令交换?

不去由WebRTC实现信令交换的原因很简单:WebRTC标准的制定者们希望能够最大限度地兼容已有的成熟技术。具体的连接建立方式由一种叫 JSEP(JavaScript Session Establishment Protocol)的协议来规定,使用JSEP有两个好处:
1. 在JSEP中,需要交换的关键信息是多媒体会话描述(multimedia session description)。由于开发者在其所开发的应用程序中信令所使用的协议不同(SIP或是XMPP或是开发者自己定义的协议),WebRTC建立呼 叫的思想建立在媒体流控制层面上,从而与上层信令传输相分离,防止相互之间的信令污染。只要上层信令为其提供了多媒体会话描述符这样的关键信息就可以建立 连接,不管开发者用何种方式来传递。
2. JSEP的架构同时也避免了在浏览器上保存连接的状态,防止其像一个状态机一样工作。由于页面经常被频繁的刷新,如果连接的状态保存在浏览器中,每次刷新都会丢失。使用JSEP能使得状态被保存在服务器上

JSEP的架构图

会话描述协议(Session Description Protocol)

JSEP将客户端之间传递的信令分为两种:offer信令和answer信令。他们主要内容的格式都遵循会话描述协议(Session Description Protocal,简称SDP)。一个SDP的信令的内容大致上如下:

v=0
o=- 7806956 075423448571 2 IN IP4 127.0.0.1
s=-
t=0 0
a=group:BUNDLE audio video data
a=msid-semantic: WMS 5UhOcZZB1uXtVbYAU5thB0SpkXbzk9FHo30g
m=audio 1 RTP/SAVPF 111 103 104 0 8 106 105 13 126
c=IN IP4 0.0.0.0
a=rtcp:1 IN IP4 0.0.0.0
a=ice-ufrag:grnpQ0BSTSnBLroq
a=ice-pwd:N5i4DZKMM2L7FEYnhO8V7Kg5
a=ice-options:google-ice
a=fingerprint:sha-256 01:A3:18:0E:36:5E:EF:24:18:8C:8B:0C:9E:B0:84:F6:34:E9:42:E3:0F:43:64:ED:EC:46:2C:3C:23:E3:78:7B
a=setup:actpass
a=mid:audio
a=extmap:1 urn:ietf:params:rtp-hdrext:ssrc-audio-level
a=recvonly
a=rtcp-mux
a=crypto:1 AES_CM_128_HMAC_SHA1_80 inline:qzcKu22ar1+lYah6o8ggzGcQ5obCttoOO2IzXwFV
a=rtpmap:111 opus/48000/2
a=fmtp:111 minptime=10
a=rtpmap:103 ISAC/16000
a=rtpmap:104 ISAC/32000
a=rtpmap:0 PCMU/8000
a=rtpmap:8 PCMA/8000
a=rtpmap:106 CN/32000
a=rtpmap:105 CN/16000
a=rtpmap:13 CN/8000
a=rtpmap:126 telephone-event/8000
a=maxptime:60
m=video 1 RTP/SAVPF 100 116 117
c=IN IP4 0.0.0.0
a=rtcp:1 IN IP4 0.0.0.0
a=ice-ufrag:grnpQ0BSTSnBLroq
a=ice-pwd:N5i4DZKMM2L7FEYnhO8V7Kg5
a=ice-options:google-ice
a=fingerprint:sha-256 01:A3:18:0E:36:5E:EF:24:18:8C:8B:0C:9E:B0:84:F6:34:E9:42:E3:0F:43:64:ED:EC:46:2C:3C:23:E3:78:7B
a=setup:actpass
a=mid:video
a=extmap:2 urn:ietf:params:rtp-hdrext:toffset
a=extmap:3 http://www.webrtc.org/experiments/rtp-hdrext/abs-send-time
a=sendrecv
a=rtcp-mux
a=crypto:1 AES_CM_128_HMAC_SHA1_80 inline:qzcKu22ar1+lYah6o8ggzGcQ5obCttoOO2IzXwFV
a=rtpmap:100 VP8/90000
a=rtcp-fb:100 ccm fir
a=rtcp-fb:100 nack
a=rtcp-fb:100 goog-remb
a=rtpmap:116 red/90000
a=rtpmap:117 ulpfec/90000
a=ssrc:3162115896 cname:/nERF7Ern+udqf++
a=ssrc:3162115896 msid:5UhOcZZB1uXtVbYAU5thB0SpkXbzk9FHo30g 221b204e-c9a0-4b01-b361-e17e9bf8f639
a=ssrc:3162115896 mslabel:5UhOcZZB1uXtVbYAU5thB0SpkXbzk9FHo30g
a=ssrc:3162115896 label:221b204e-c9a0-4b01-b361-e17e9bf8f639
m=application 1 DTLS/SCTP 5000
c=IN IP40.0.0.0
a=ice-ufrag:grnpQ0BSTSnBLroq
a=ice-pwd:N5i4DZKMM2L7FEYnhO8V7Kg5
a=ice-options:google-ice
a=fingerprint:sha-256 01:A3:18:0E:36:5E:EF:24:18:8C:8B:0C:9E:B0:84:F6:34:E9:42:E3:0F:43:64:ED:EC:46:2C:3C:23:E3:78:7B
a=setup:actpass
a=mid:data
a=sctpmap:5000 webrtc-datachannel 1024

这些都什么玩意?说实话我不知道,我这里放这么一大段出来,只是为了让文章内容显得很多...如果想深入了解的话,可以参考 SDP for the WebRTC draft-nandakumar-rtcweb-sdp-04 自行进行解析

其实可以将其简化一下,它就是一个在点对点连接中描述自己的字符串,我们可以将其封装在JSON中进行传输,在PeerConnection建立后将其通过服务器中转后,将自己的SDP描述符和对方的SDP描述符交给PeerConnection就行了

信令与RTCPeerConnection建立

在前一篇文章中介绍过,WebRTC使用RTCPeerConnection来在浏览器之间传递流数据,在建立RTCPeerConnection实例之后,想要使用其建立一个点对点的信道,我们需要做两件事:
1. 确定本机上的媒体流的特性,比如分辨率、编解码能力啥的(SDP描述符)
2. 连接两端的主机的网络地址(ICE Candidate)

需要注意的是,由于连接两端的主机都可能在内网或是在防火墙之后,我们需要一种对所有联网的计算机都通用的定位方式。这其中就涉及NAT/防火墙穿越技术,以及WebRTC用来达到这个目的所ICE框架。这一部分在上一篇文章中有介绍,这里不再赘述。

通过offer和answer交换SDP描述符

大致上在两个用户(甲和乙)之间建立点对点连接流程应该是这个样子(这里不考虑错误的情况,RTCPeerConnection简称PC):
1. 甲和乙各自建立一个PC实例
2. 甲通过PC所提供的 createOffer() 方法建立一个包含甲的SDP描述符的offer信令
3. 甲通过PC所提供的 setLocalDescription() 方法,将甲的SDP描述符交给甲的PC实例
4. 甲将offer信令通过服务器发送给乙
5. 乙将甲的offer信令中所包含的的SDP描述符提取出来,通过PC所提供的 setRemoteDescription() 方法交给乙的PC实例
6. 乙通过PC所提供的 createAnswer() 方法建立一个包含乙的SDP描述符answer信令
7. 乙通过PC所提供的 setLocalDescription() 方法,将乙的SDP描述符交给乙的PC实例
8. 乙将answer信令通过服务器发送给甲
9. 甲接收到乙的answer信令后,将其中乙的SDP描述符提取出来,调用 setRemoteDescripttion() 方法交给甲自己的PC实例

通过在这一系列的信令交换之后,甲和乙所创建的PC实例都包含甲和乙的SDP描述符了,完成了两件事的第一件。我们还需要完成第二件事——获取连接两端主机的网络地址

通过ICE框架建立NAT/防火墙穿越的连接

这个网络地址应该是能从外界直接访问,WebRTC使用ICE框架来获得这个地址。RTCPeerConnection在创立的时候可以将ICE服务器的地址传递进去,如:

var iceServer = {
    "iceServers": [{
        "url": "stun:stun.l.google.com:19302"
    }]
};
var pc = new RTCPeerConnection(iceServer);

当然这个地址也需要交换,还是以甲乙两位为例,交换的流程如下(RTCPeerConnection简称PC):
1. 甲、乙各创建配置了ICE服务器的PC实例,并为其添加 onicecandidate 事件回调
2. 当网络候选可用时,将会调用 onicecandidate 函数
3. 在回调函数内部,甲或乙将网络候选的消息封装在ICE Candidate信令中,通过服务器中转,传递给对方
4. 甲或乙接收到对方通过服务器中转所发送过来ICE Candidate信令时,将其解析并获得网络候选,将其通过PC实例的 addIceCandidate() 方法加入到PC实例中

这样连接就创立完成了,可以向RTCPeerConnection中通过 addStream() 加入流来传输媒体流数据。将流加入到RTCPeerConnection实例中后,对方就可以通过 onaddstream 所绑定的回调函数监听到了。调用 addStream() 可以在连接完成之前,在连接建立之后,对方一样能监听到媒体流

聊天室中的信令

上面是两个用户之间的信令交换流程,但我们需要建立一个多用户在线视频聊天的聊天室。所以需要进行一些扩展,来达到这个要求

用户操作

首先需要确定一个用户在聊天室中的操作大致流程:
1. 打开页面连接到服务器上
2. 进入聊天室
3. 与其他所有已在聊天室的用户建立点对点的连接,并输出在页面上
4. 若有聊天室内的其他用户离开,应得到通知,关闭与其的连接并移除其在页面中的输出
5. 若又有其他用户加入,应得到通知,建立于新加入用户的连接,并输出在页面上
6. 离开页面,关闭所有连接

从上面可以看出来,除了点对点连接的建立,还需要服务器至少做如下几件事:
1. 新用户加入房间时,发送新用户的信息给房间内的其他用户
2. 新用户加入房间时,发送房间内的其他用户信息给新加入房间的用户
3. 用户离开房间时,发送离开用户的信息给房间内的其他用户

实现思路

以使用WebSocket为例,上面用户操作的流程可以进行以下修改:
1. 浏览器与服务器建立WebSocket连接
2. 发送一个加入聊天室的信令(join),信令中需要包含用户所进入的聊天室名称
3. 服务器根据用户所加入的房间,发送一个其他用户信令(peers),信令中包含聊天室中其他用户的信息,浏览器根据信息来逐个构建与其他用户的点对点连接
4. 若有用户离开,服务器发送一个用户离开信令(remove_peer),信令中包含离开的用户的信息,浏览器根据信息关闭与离开用户的信息,并作相应的清除操作
5. 若有新用户加入,服务器发送一个用户加入信令(new_peer),信令中包含新加入的用户的信息,浏览器根据信息来建立与这个新用户的点对点连接
6. 用户离开页面,关闭WebSocket连接

服务器实现

由于用户可以只是建立连接,可能还没有进入具体房间,所以首先我们需要一个容器来保存所有用户的连接,同时监听用户是否与服务器建立了WebSocket的连接:

var server = new WebSocketServer();
var sockets = [];

server.on('connection', function(socket){
socket.on('close', function(){
var i = sockets.indexOf(socket);
sockets.splice(i, 1);
//关闭连接后的其他操作
});
sockets.push(socket);
//连接建立后的其他操作
});

由于有房间的划分,所以我们需要在服务器上建立一个容器,用来保存房间内的用户信息。显然对象较为合适,键为房间名称,值为用户信息列表。

同时我们需要监听上面所说的用户加入房间的信令(join),新用户加入之后需要向新用户发送房间内其他用户信息(peers)和向房间内其他用户发送新用户信息(new_peer),以及用户离开时向其他用户发送离开用户的信息(remove_peer):

于是乎代码大致就变成这样:

var server = new WebSocketServer();
var sockets = [];
var rooms = {};

/*
join信令所接收的格式
{
"eventName": "join",
"data": {
"room": "roomName"
}
}
*/
var joinRoom = function(data, socket) {
var room = data.room || "__default";
var curRoomSockets; //当前房间的socket列表
var socketIds = []; //房间其他用户的id

curRoomSockets = rooms[room] = rooms[room] || [];

//给所有房间内的其他人发送新用户的id
for (var i = curRoomSockets.length; i--;) {
socketIds.push(curRoomSockets[i].id);
curRoomSockets[i].send(JSON.stringify({
"eventName": "new_peer",
"data": {
"socketId": socket.id
}
}));
}

//将新用户的连接加入到房间的连接列表中
curRoomSockets.push(socket);
socket.room = room;

//给新用户发送其他用户的信息,及服务器给新用户自己赋予的id
socket.send(JSON.stringify({
"eventName": "peers",
"data": {
"socketIds": socketIds,
"you": socket.id
}
}));
};

server.on('connection', function(socket) {
//为socket构建一个特有的id,用来作为区分用户的标记
socket.id = getRandomString();
//用户关闭连接后,应做的处理
socket.on('close', function() {
var i = sockets.indexOf(socket);
var room = socket.room;
var curRoomSockets = rooms[room];
sockets.splice(i, 1);
//通知房间内其他用户
if (curRoomSockets) {
for (i = curRoomSockets.length; i--;) {
curRoomSockets[i].send(JSON.stringify({
"eventName": "remove_peer",
"data": {
"socketId": socket.id
}
}));
}
}
//从room中删除socket
if (room) {
i = this.rooms[room].indexOf(socket);
this.rooms[room].splice(i, 1);
if (this.rooms[room].length === 0) {
delete this.rooms[room];
}
}
//关闭连接后的其他操作
});
//根据前台页面传递过来的信令进行解析,确定应该如何处理
socket.on('message', function(data) {
var json = JSON.parse(data);
if (json.eventName) {
if (json.eventName === "join") {
joinRoom(data, socket);
}
}
});
//将连接保存
sockets.push(socket);
//连接建立后的其他操作
});

最后再加上点对点的信令转发就行了,一份完整的代码可参照我写的 SkyRTC项目源码

参考资料

WebRTC in the real world: STUN, TURN and signaling

SDP for the WebRTC draft-nandakumar-rtcweb-sdp-04

分享到:
评论

相关推荐

    使用WebRTC搭建前端视频聊天室——入门篇1

    WebRTC(Web Real-Time Communication)是一项技术,旨在让浏览器具备实时通信的能力,无需依赖外部插件或服务器中转。这项技术由谷歌发起并开源,现在已被Chrome、Opera、Firefox等主流浏览器广泛支持。WebRTC的...

    使用WebRTC搭建前端视频聊天室——信令篇1

    1. 浏览器之间交换建立通信的元数据(信令)必须通过服务器 2. 为了穿越NAT和防火墙 1. 用来控制通信开启或者关闭的连接控制消息 2. 发生错误时用来彼此

    使用WebRTC搭建前端视频聊天室——点对点通信篇1

    一些背景:- 老刘和老姚都住在同一个小区但不同的片区,小区很破旧,没有电话- 片区相互隔离且片区门口有个保安,保安只认识自己片区的人,遇到不认识的人就需要查询凭

    WebRTC的Android视频聊天客户端+信令服务器

    在本项目中,我们探讨的是一个基于WebRTC的Android视频聊天客户端,以及配套的信令服务器,这对于开发P2P(点对点)视频通话应用至关重要。 1. **WebRTC核心技术**: - **PeerConnection**: 这是WebRTC的核心组件...

    webRTC搭建多人聊天室.zip

    在这个“webRTC搭建多人聊天室”的项目中,我们将探讨如何利用WebRTC构建一个支持多人视频聊天和文字交流的平台。 1. **WebRTC架构** WebRTC由一系列组件构成,包括getUserMedia用于访问用户的媒体设备(如摄像头...

    nodejs搭建的webrtc视频聊天室

    本项目是利用Node.js搭建的WebRTC视频聊天室,用户可以在网页上实现面对面的交流。服务的运行指南可参考README.md文件。 【知识点详解】: 1. WebRTC基础: - WebRTC是一种开源项目,由Google发起,旨在提供...

    5分钟搭建一个WebRTC视频聊天

    【WebRTC视频聊天搭建详解】 WebRTC(Web Real-Time Communication)是一种实时通信技术,它允许在浏览器之间进行音频、视频和数据的直接传输,无需插件或者额外的应用程序。本教程将详细介绍如何在5分钟内搭建一个...

    webRTC信令服务器实现音视频聊天

    在本文中,我们将探讨如何使用Node.js和Socket.IO构建一个WebRTC信令服务器,实现局域网内的音视频聊天功能。 首先,**信令**是WebRTC通信过程中的关键部分,用于协商和控制音视频通话的建立、管理和结束。在本Demo...

    java + webrtc 视频聊天室,一对一,多对多,文件传输

    java + webrtc 实现的 视频聊天室 , 多对多的这个资源没有实现,这个资源只实现了一对一,后续的代码会在 github上持续更新 地址为: https://github.com/js1688/cat 成果展示地址:https://www.tanjun.xyz webrtc 真正...

    基于C#和SuperWebSocket、WebRtc开发的网页视频聊天源码

    总的来说,这个项目提供了从后端到前端的完整视频聊天解决方案,对于学习C#、WebSocket以及WebRTC技术的开发者来说,是一个宝贵的实践资源。通过深入研究这个项目,不仅可以掌握实时通信的基本原理,还能了解到如何...

    前端使用kurento实现rtsp流转webRtc播放

    本文将详细介绍如何使用Kurento Media Server在后端实现RTSP流转WebRTC播放,并在前端进行相应的集成。 **一、Kurento Media Server** Kurento是基于开源项目OpenH264和WebRTC构建的媒体服务器,它提供了一套...

    WebRtc视频聊天demo包括多人聊天

    标题中的"WebRtc视频聊天demo包括多人聊天"指的是一个基于WebRTC技术的示例项目,它不仅实现了基本的视频聊天功能,而且还扩展到了多人聊天场景。在多人聊天中,每个参与者都可以与其他所有参与者进行双向通信,形成...

    《WebRTC音视频实时互动技术》大纲

    《WebRTC音视频实时互动技术》大纲覆盖了WebRTC的核心技术和实践应用,旨在帮助读者深入理解这一实时通信技术。以下是对大纲中重要知识点的详细解释: 1. 音视频服务质量: - 带宽管理:为了确保高质量的音视频...

    windows下webRTC服务器及测试环境搭建

    1. 单元测试:可以使用WebRTC测试工具如webrtc-internals或chrome://webrtc-internals来检查连接状态、音频视频流质量等。 2. 功能测试:邀请另一人加入同一会议室,进行音视频通话,观察是否能正常收发音视频。 ...

    LaravelVideoChat使用SocketIO和WebRTC实现Laravel视频聊天

    本教程将深入探讨如何使用Laravel、Socket.IO和WebRTC技术来创建一个实时的视频聊天应用。 首先,让我们了解Laravel。Laravel是由Taylor Otwell开发的一个开源的PHP框架,它遵循MVC(Model-View-Controller)架构...

    webrtc视频聊天

    综上所述,"webrtc视频聊天"项目是一个集成了WebRTC、Spring框架以及可能的自定义信令服务器(webstock)的复杂应用,涉及到了音视频通信、P2P连接、服务器端逻辑以及前端实现等多个技术领域。通过这样的项目,...

    vue+node(socket.io)+webRTC一对一视频通讯demo

    在本项目中,我们探索的是一个基于Vue.js前端框架、Node.js后端(利用socket.io进行信令传输)以及WebRTC技术实现的一对一视频通信的示例应用。这个demo涵盖了多个关键知识点,让我们逐一深入解析。 首先,**WebRTC...

    WebRTC:WebRTC高级主题:自定义信令与媒体处理.docx

    WebRTC:WebRTC高级主题:自定义信令与媒体处理.docx

    基于java开发环境的WebRTC 点对点视频通话系统

    总结来说,这个基于Java开发环境的WebRTC点对点视频通话系统是一个综合性的项目,涵盖了Java与WebRTC的集成、信令处理、媒体流管理等多个技术层面。开发者需要具备扎实的Java基础、良好的网络通信知识,以及对WebRTC...

    基于Chrome、Java、WebSocket、WebRTC实现浏览器视频通话

    【标题】"基于Chrome、Java、WebSocket、WebRTC实现浏览器视频通话" 描述了现代Web技术如何集成到一个实时通信应用中,使用户能够在浏览器上进行高质量的视频通话。这个项目利用了四个关键技术:Chrome浏览器、Java...

Global site tag (gtag.js) - Google Analytics