`
alyouge
  • 浏览: 193697 次
  • 性别: Icon_minigender_1
  • 来自: 大连
社区版块
存档分类
最新评论
阅读更多

 

一、引言    
    
    Java是一门适合于分布式计算环境、尤其是Internet程序设计的语言。这不仅仅在于java具有很好的安全性和可移植性,还在于java为Internet编程提供了丰富的网络类库的支持。利用这些网络类库,可以轻松编写多种类型的网络通信程序。然而由于某些限制,Java在传输多媒体信息方面的应用不是很广,大部分的应用都集中在网络上传输语音等音频信号的方面。传输音频信号应用方案一般有两种,一是应用于数据广播的多对一传输,例如音频数据服务器向数个客户端发送音频数据信号,其最广泛的应用则是某些网上的IP电话,大家经常可以看到不少这种提供在线IP电话服务的网站的客户端都是使用的嵌在网页上的Java   Applet程序,用来实现拨号、通话等等基本的网络电话功能;   第二种方案则是我们今天要涉及的部分,一对一的音频信号数据的传输。这种方案的应用范围更广。大家都去过语音聊天室,大部分的语音聊天室的语音聊天功能的实现就是使用的Java技术,大家对这样网页的源代码分析一下就可以发现这一点。  
    
    我曾开发一个项目,涉及使用java来实现在网络上传输语音数据。开发中遇到不少问题,而且在互联网上发现关于java语音传输的资料比较少,寻找了许多天,最终从一个开放源代码的一个简单的Answer   Machine   演示程序中获得了解决问题的方法。今天我就把我在点对点传输音频信号方面的一些经验拿出来,与大家共同探讨这方面的问题。  
    
    二、存在的问题  
    
    在网络上传输音频的方面存在的问题主要可以归纳为以下几点:    
    
    1   双方之间的网络连接  
    
    要进行频数据的传输,首先就是要建立数据连结。常用的通讯协议中,TCP较可靠,所以用在不允许数据丢失的应用上。而UDP则较多应用于处理速度要求较快、数据传输可靠性要求不是很高的应用上,如数据广播。通信协议的选择取决于我们所要做的应用的类型。怎样建立网络连接,稳定的接收和发送音频信号的数据流是关键。  
    
    2   音频信号的采集以及回放  
    
    在进行音频信号的采集中我们必须考虑到采样率的问题,声音信号的采样率有8Khz、16Khz、32Khz、44Khz等,每种数据采样虑产生的数据量都不一样,越高的采样率产生的数据量越大,所以我们要选择合适的采样率以适应网络的带宽。  
    
    3   音频数字信号的编码与解码。  
    
    如果把直接采集到的音频信号数据流在网络上进行传输,它所占有的带宽也是十分大的,以8Khz的采样率采集14位的音频数据那么就有以下这样的一个式子:    
    
  14   bit   *   8000/second=112,000   bits/second   or112kbps    
    
    从中我们可以看出以这样的方式传输音频数据,每秒需要向网络中发送112kb的数据。所以。从节省带宽的角度考虑,我们很有必要对这样的数据进行压缩。对多媒体信号的压缩我们有许多可以选择的格式,如mp2、mp3、GSM等等。同样,我们这里也存在一个对压缩格式进行选择的问题,考虑到音频数据传输的及时性,对传输的音频数据质量的要求,以及各种压缩格式的压缩比率以及进行压缩和解压缩所要耗费的系统资源等方面问题,选择合适的压缩格式就显得尤为重要。  
    
    
  三、解决的方法  
    
    下面就针对前面提出的问题讨论一下解决的办法。  
    
    1   双方之间的网络连接  
    
    Java在这方面有其独特的优势,Java提供了丰富的网络类库的支持,可以轻松编写多种类型的网络通信程序。在我下面的例子中我就使用了TCP/IP协议,通过Java的Socket类进行编程。  
    
    2   音频信号的采集和回放以及音频数字信号的编码与解码  
    
    在解决这两个问题的时候,在网上很幸运地通过一些文章的介绍,找到了Answer   Machine   演示程序的源代码(由of   jsresources.org的Florian   Bomers   和Matthias   Pfisterer编写,网址http://www.jsresources.org/apps/am.html)。在这个程序代码中,有几个解决我们问题所需要的类,而且作者将这些类封装的很好,我们基本不需要做什么改动,只需要屏蔽其中的调试信息的输出就行了,更可贵的是它还封装了几种常见的音频格式。其中的GSM格式(Global   System   for   Mobile   Telecommunications)就是我们下面例子中采用的压缩格式,GSM格式可以将128kbps   的音频数据流   (16bit通过8k   Hz的音频采样)   压缩为13kbps   的音频数据流,非常适合语音信号的传送,所以可谓是一石二鸟。  
    
    我分析过这几个类的源代码,不得不佩服它的作者,每个类的源代码都很精炼,大家可以自己分析一下。好了下面就给大家讲讲这几个类,并且将它们用到的Java   Sound   API中的类和函数等一并做个简单介绍,让大家对Java   Sound   API中常用的类也有个大致的了解。由于Java   Sound   API中的类比较多。限于篇幅无法对所有用到的类做详尽的解释,以下内容只是简单提及了各个类的用途和使用规范,有关Java   Sound   API中类的具体介绍请大家访问这里http://java.sun.com/j2se/1.4.2/docs/api/,   查找javax.sound.sampled的相关内容。  
    
    以下的提到几个文件是从Answer   Machine   演示程序的源代码中提取出来的,由于是开放源代码的程序,大家在使用的时候请注意相关的公共协议。  
    
    ①   AMAudioFormat类(封装在AMAudioFormat.java文件中)  
    
    AMAudioFormat类封装了CD、FM、TELEPHONE、GSM这四种质量的音频格式的参数,使用起来也非常简单,这样我们在使用Java   Sound   API时就不用自己去写那些复杂的代码了,但为了明白Java   Sound   API的原理,我们需要对它的代码做一下分析。它使用了Java   Sound   API中的AudioFormat这个类,这个类非常重要,在Java中对任何音频数据的使用都要实现通过它指定所需要使用的音频格式,AudioFormat类有一个嵌套的类AudioFormat.Encoding,实际上大部分对AudioFormat类的使用都是使用的这个嵌套的类。  
    
    AMAudioFormat类的重要方法:    
    
    名称:getLineAudioFormat  
    调用格式:getLineAudioFormat(整型音频格式代号)  
    返回值:   根据传递音频格式代号生成的AudioFormat对象。  
    
    说道这里大家可能要问了,那么通过Java   Sound   API可以直接使用GSM格式吗?答案是比较复杂,但同样有解决的办法,作者在这里使用了另外的开源程序的类库-tritonus的GSM编码解码库。大家需要在这里www.tritonus.org/plugins.html下载tritonous_share.jar和tritonus_gsm.jar两个文件,并在AMAudioFormat类中引用,这样就完成了GSM格式的设置。需要告诉大家的是在对AMAudioFormat.java这个类进行编译后,我们的程序运行的时候就可以不需要tritonous_share.jar和tritonus_gsm.jar这两个文件的支持了。  
    
    ②   AudioCapture类(封装在AudioCapture.java文件中)  
    
    AudioCapture类封装了从音频硬件捕获音频数据并自动编码为GSM音频压缩数据的过程,并且通过它的getAudioInputStream()方法提供给我们一个音频数据输入流,我们就可以直接将这个流发送到网络中。  
    
    AudioCapture   类的重要方法:    
    名称:getAudioInputStream  
    调用格式:getAudioInputStream()  
    返回值:AudioInputStream对象  
    
    AudioCapture   类使用了Java   Sound   API中的AudioInputStream、AudioFormat、AudioSystem这几个类和TargetDataLine、LineListener接口。除了AudioFormat类我再简单介绍一下其他的类:    
    
    AudioInputStream   类是带有特殊音频格式和长度的InputStream类,它有两个构造方法,分别是AudioInputStream(InputStream   stream,   AudioFormat   format,long   length)和AudioInputStream(TargetData   -Line   line)。  
    
    TargetDataLine   接口是DataLine接口的一种,通过它就可以直接从音频硬件获取数据了,它有几个常用的方法,分别是:open(AudioFormat   format)、void   open(AudioFormat   format,   int   bufferSize)、int   read(byte[]   b,   int   off,   int   len)。  
    
    AudioSystem   类是Java标准音频系统的入口点,在AudioSystem   类中使用他的getLine()   方法创建TargetDataLine对象。  
    
    LineListener接口用来对线路状态改变的时间进行监听,他的重要的方法是update(LineEvent   event)方法。  
    
    ③   AudioPlayStream类(封装在AudioPlayStream.java文件中)  
    
    AudioPlayStream类与AudioCapture类刚好相反,它封装了GSM压缩音频数据的解码和音频信号的回放过程,提供给我们一个音频信号输出流。AudioCapture类用到的Java   Sound   API中的类它也基本都用到了,只是它使用了SourceDataLine接口而不是TargetDataLine接口  
    
    ④   Debug类(封装在Debug.java文件中)  
    
    Debug类主要用来在调试时输出讯息,代码很少,后来我把其中输出信息的语句都屏蔽了,对程序运行没有影响。  
    
    为了方便使用以上的几个类,我们需要对它们进行编译和打包,编译时需要设置相关的编译环境,以下是我们需要用到的命令行  
    
  set   CLASSPATH=%CLASSPATH%;.;tritonus_gsm.jar;tritonus_share.jar    
  javac   am\*.java   am\audio\*.java    
  jar   cmf   packaging\manifest.mf   am.jar   am\*.class    
  am\audio\*.class    
    
    说明一下,我将以上提到的Java源码文件放在了am目录下,编译之后可以得到一个8k的am.jar文件,我们下一步所需要做的就是在我们的程序中引用这个包。  
四、实例介绍  
    
    有了以上的基本的介绍,我就可以通过对我写的一个极为简单的语音对讲软件代码的解释让大家更清楚地了解一下这几个模块的具体使用方法,大家可以从中获得开发具有诸如网络电话、自动应答等功能的软件的类似方法,用于语音数据的传输。  
    
    程序的结构:    
    
    整个程序分三层,作用分别如下:    
    
    .   顶层:   用户界面  
    
    .   中间层:   控制层  
    
    .   底层:   传输层  
    
    程序有两个主要的类:   (表)  
    
  类名   描述    
  CallLink   网络传输层,用于接收或发送音频数据。    
  VoiceSender   作为第二个启动的线程提供从音频硬件捕获并编码好的数据给网络传输层。    
    
    
    程序的主类jphone使用了Runnable和ActionListener接口,主类除了基本的几个方法之外,还具有方法initAudioHardware()、ShowMSG、startPhone分别用于初始化AudioCapture类与AudioPlayStream类、显示程序状态和开始程序。主类jphone具有两个子类VoiceSender和CallLink。  
    
    子类VoiceSender同样使用了Runnable接口,它在程序中作为第二个启动的线程负责发送捕获到的音频数据。CallLink子类就是负责建立scoket连接,并且负责接收或发送网络数据、监听网络连接等功能的实现。它具有主要的方法是getInputStream()、getOutputStream()、listen()、open()、close()等。  
    
    为了让大家更清楚的了解程序的结构请大家看下面的类图。  
    
    
    
    程序的基本工作流程:    
    
    当程序启动时首先执行建立当前主类的实例,当按下呼叫按钮的时候执行startPhone()方法,startPhone()方法通过调用initAudioHardware()方法建立AudioCapture对象和AudioPlayStream对象的实例PhoneMIC和PhoneSPK,   紧接着在建立CallLink子类的实例curCallLink来与具有目标IP地址的计算机进行scoket连接后,startPhone()方法又将子类VoiceSender作为secondThread线程启动,然后又调用run()方法。   run()方法通过已经建立的CallLink子类的实例curCallLink监听网络上的数据(也就是等待别人的呼叫),一旦有音频数据到来curCallLink   实例就为AudioPlayStream   对象PhoneSPK   提供网络传来的音频数据,而PhoneSPK在一个循环中不断的将音频数据转换为音频信号,完成类似电话听筒的功能。  
    
    子类VoiceSender   就作为第二线程启动的时候,startPhone()   方法传递给它的参数是实例化的CallLink   子类curCallLink   ,   子类VoiceSender   通过实例化的AudioCapture   对象PhoneMIC   将音频信号压缩成GSM数据,并通过curCallLink   将音频数据发送到具有目标IP   地址的计算机上,完成类似电话受话器的功能。  
    
    在这里实例化的CallLink   子类curCallLink   就相当于两个电话之间的电话线,这样通过我以上的解释大家对程序的原理就有一个大概的了解了吧。  
    
    其中的音频数据发送线程和音频数据接收线程是同步的,不过考虑到网络的因素,可能在声音的传输上有一些延迟,不过由于延迟比较小对及时听到对方的话语影响不大。  
    
    
    
    编写代码摘要:    
    
    在使用AudioCapture   类和AudioPlayStream   类的方法之前需要知道怎样初始化这两个类。在声明AudioCapture   对象的时候需要传递给它一个静态的整型值用于表达将音频信号压缩的方式,这个静态的整型常量可以是AMAudioFormat   类的以下四个值之一:   FORMAT_CODE_CD   、FORMAT_CODE_FM   、FORMAT    
  _CODE_TELEPHONE   、FORMAT_CODE_GSM   。所以声明AudioCapture   对象就要用一下的形式:    
    
    
  private   AudioCapture   PhoneMIC   null;    
  PhoneMIC   new   AudioCapture(AMAudioFormat.    
  FORMAT_CODE_GSM);      
    
    而声明AudioPlayStream   对象则不同,我们在初始化它的时候需要传递给它一个AudioFormat   对象,用于通知它我们所要播放音频的格式,这个AudioFormat   对象可以通过AMAudioFormat   类的getLineAudioFormat(格式参数值)方法获得,其中格式参数的取值和上面提到过的AMAudioFormat   的四个值相同,所以声明AudioPlayStream   对象就要用以下的形式:    
    
    
  private   AudioPlayStream   PhoneSPK   null;    
  AudioFormat   format   null;    
  format   AMAudioFormat.getLineAudioFormat    
  (AMAudioFormat.FORMAT_CODE_GSM);    
  PhoneSPK   new   AudioPlayStream(format);      
    
    在这之后就可以使用AudioCapture   和AudioPlayStream   对象的open()   方法打开音频捕获和音频回放通道完成它们的初始化了。如以下的形式:    
    
    
  PhoneMIC.open();    
  PhoneSPK.open();      
    
    初始化完成之后要使AudioPlayStream   对象播放声音还需要以下过程,首先建立一个缓冲区(字节数组)用于存放从网络传来的音频数据流,然后执行AudioPlayStream   对象的start()   方法使AudioPlayStream    
  对象开始声音的回放,这时执行一个while   循环,在循环中将音频流数据写入缓冲区,再使用AudioPlayStream对象的write()方法将缓冲区的数据还原成语音信号然后播放出来。如下面的例子:    
    
    
  boolean   complete   false;    
  byte[]   gsmdata   new   byte[bufSize];    
  int   numBytesRead   0;    
  ......    
  PhoneSPK.start();    
  ......    
  complete   false;    
  while((!Thread.currentThread().interrupted())   )    
  {  
   try    
   {    
    numBytesReadplaybackInputStream.read(gsmdata);  
    if(numBytesRead   ==   -1)    
    {    
     complete=true;    
     break;    
    }    
    PhoneSPK.write(gsmdata,   0,   numBytesRead);  
   }  
   catch   (IOException   e)    
   {  
    System.exit(1);    
   }    
  }      
    
    其中complete   的值用于标志终止声音播放的异常原因。  
    
    类似的,初始化完成之后要使AudioCapture   对象捕获和压缩声音数据还需要其他的操作,首先声明一个InputStream   对象,赋其值为AudioCapture   对象的getAudioInputStream()   方法的返回值,执行  
  AudioCapture   对象的start()   方法,然后在建立一个循环,将通过InputStream   的read()   方法得到的数据发送到网络上。例如以下代码:    
    
    
  InputStream   myIStream   null;    
  myIStream   PhoneMIC.getAudioInputStream();    
  ......    
  while((!Thread.currentThread().interrupted()))    
  b   =   myIStream.read(compressedVoice,0,   bufSize);    
  sendStream.write(compressedVoice,0,b);    
  ......    
      
    
    通过使用CallLink   的几个方法,我们可以方便的传输和接收音频数据流。以下是它的代码:    
    
    
  class   CallLink    
  //使用套接字进行连接  
  String   ipAddr   null;    
  Socket   outSock   =   null;    
  ServerSocket   inServSock   null;    
  Socket   inSock   null;    
  CallLink(String   inIP)    
  ipAddr   inIP;    
  void   open()   throws   IOException,   UnknownHostException    
  {//打开网路连接    
  if   (ipAddr   !=   null)    
  outSock=new   Socket(ipAddr,TALK_PORT);    
  }    
    
  void   listen()   throws   IOException    
  {//   监听,等候呼叫  
  inServSock   new   ServerSocket(TALK_PORT);    
  inSock   inServSock.accept();    
  }  
    
  public   InputStream   getInputStream()throws   IOException    
  {//返回音频数据输入流    
  if   (inSock   !=   null)    
  return   inSock.getInputStream();    
  else    
  return   null;    
  }  
  publicOutputStreamgetOutputStream()throwsIOException    
  {//返回音频数据输出流    
  if   (outSock   !=   null)    
  return   outSock.getOutputStream();    
  else    
  return   null;    
  }  
    
  void   close()   throws   IOException    
  {//关闭网络连接    
  inSock.close();    
  outSock.close();    
  }  
      
    
    程序的代码总体有366   行,限于篇幅,这里就不一一列举了。  
    
    编译以及程序的使用方法:  
    
    运行和编译本程序需要加上额外的环境参数,为了方便使用可以建立以下内容的批处理文件:(假设程序所需要的包均在程序所在目录下的lib   文件夹中)  
    
    用于编译的批处理程序c.bat   的内容  
    
  javac   -classpath   .;lib\am.jar   jphone.java    
    
    用于运行的批处理程序r.bat   的内容  
    
  java   -classpath   .;lib\am.jar   jphone    
    
    启动时在A   计算机的IP   地址框内输入要进行连接的计算机B   的IP   地址,在计算机B   的IP   地址框内输入要进行连接的计算机A   的IP   地址,让后分别点击“拨出电话”按钮就可以进行连接了。当然别忘了接上麦克风和打开音箱电源,呵呵。  
    
    提醒大家,这里的IP   地址栏里预先存在的地址是127.0.0.1,也就是说,程序也可以和自己进行连接,点击“拨出电话”按钮,等8   秒左右敲敲你的麦克风,听到没有,是不是也有“嘣、嘣、嘣”的声音?

 

分享到:
评论

相关推荐

    Java 即时通讯im源码 JAVAJSTXIM.rar

    Java 即时通讯im源码 源码描述: 一、源码介绍 Java开发的im即时通讯服务,即时通讯IM完整源码, 即时通讯(IM)模仿QQ这类即时通讯工具,项目包含所有源码,有数据库,im使用说明,技术文档,即时通讯系统ppt...

    JAVA即时通讯+P2P+socket

    总的来说,这个项目是一个基础的Java即时通讯系统实现,涵盖了Socket编程、P2P通信和简单的用户交互。它为学习和理解网络编程原理提供了一个实践平台,但实际的即时通讯系统会涉及到更多复杂的设计和安全考量。通过...

    AJax,java即时通讯 web qq

    【标题】"AJax,java即时通讯 web qq"揭示了一个基于Web技术实现的即时通讯系统,该系统利用Ajax和Java技术来模拟QQ的聊天功能。Ajax(Asynchronous JavaScript and XML)是一种在无需重新加载整个网页的情况下,...

    Java即时通讯与文件传输系统源码.zip

    Java即时通讯与文件传输系统是基于Java开发的一种通信平台,其核心目标是实现用户之间的实时信息交换和文件共享。这个源码项目可以帮助开发者深入理解Java编程语言在构建此类系统中的应用,同时也为学习和实践提供了...

    java即时通讯

    Java即时通讯技术主要涉及到网络编程、多线程、并发处理以及数据序列化等多个核心知识点。在本项目中,我们看到的“java即时通讯”描述了一个使用Java语言开发的简单即时聊天工具,类似于我们熟知的QQ。这个项目可能...

    java即时通讯客户端

    Java即时通讯客户端是一种基于Java编程语言实现的实时通信软件,用于在互联网上进行点对点或者多用户间的交互。在本项目中,我们不仅有Java即时通讯客户端,还有与其配合的服务端,共同构建了一个完整的通信系统。...

    java即时通讯系统

    Java即时通讯系统是一种基于Java技术构建的实时通信平台,它允许用户进行实时的单人聊天和多人群聊。在本文中,我们将深入探讨Java即时通讯系统的核心技术和实现原理。 首先,Java即时通讯系统通常依赖于Java ...

    Java即时通讯系统

    系统采用C/S结构,可以将任务合理分配到客户机端和服务器端,从而降低了系统的通讯开销。 1. 客户层 客户层也叫应用表示层,是应用程序地客户接口部分。给聊天工具设计一个客户层具用很多优点,这是因为客户层担负着...

    Java即时通讯聊天室

    【Java即时通讯聊天室】是一个基于Java开发的小型局域网通信应用,旨在提供一个集登录注册、单聊、群聊、窗口抖动以及强制下线等多功能于一体的聊天平台,为用户创造更丰富的互动体验。 在即时通讯系统中,基础架构...

    Java即时通讯客户端源码 毕业设计

    Java即时通讯客户端源码是基于Swing图形用户界面和XMPP协议实现的毕业设计项目,主要涉及以下几个核心知识点: 1. **Java编程语言**:Java是这个项目的基础,它是一种跨平台、面向对象的编程语言,具有丰富的类库和...

    java即时通讯工具(JICQ).rar_java 即时通讯_java 聊天_即时通讯_即时通讯 Java_通讯 java

    Java即时通讯工具(JICQ)是一款基于Java技术开发的实时通信系统,它允许用户进行文字聊天、文件传输等交互操作。JICQ是Java Instant Communication Tool的缩写,其设计目的是提供一个跨平台的解决方案,因为Java...

    java即时通讯源码

    Java即时通讯(Instant Messaging,IM)是网络通信领域的一个重要组成部分,它允许用户实时地交换消息,常见于各种社交软件、在线客服系统以及企业内部沟通工具。本源码提供了一个简单的实现,帮助开发者理解Java...

    ajax,java即时通讯web qq

    【Ajax与Java即时通讯在Web QQ中的应用】 Ajax(Asynchronous JavaScript and XML)是一种在无需刷新整个网页的情况下,能够更新部分网页的技术。它通过在后台与服务器进行少量数据交换,使得网页实现异步更新,...

    Java即时通讯源代码

    【Java即时通讯源代码】是基于Java编程语言开发的一款实时通信软件,主要利用了Java的Swing库来构建用户界面,提供了美观且功能完善的多用户在线聊天功能。在这个项目中,开发者利用Java的强大特性和Swing的图形用户...

    一个java即时通讯软件的雏形V1.1

    Java即时通讯软件是一种基于网络的通信工具,它允许用户实时发送和接收文本、语音、文件等数据。在本文中,我们将深入探讨一个基于Java实现的初级即时通讯软件雏形V1.1,它关注线程安全和局域网内的通信功能。 首先...

    java即时通讯工具的设计与实现.doc

    Java即时通讯工具的设计与实现 Java即时通讯工具是当前Internet上最为流行的通讯方式之一,可以提供实时的通讯服务。为了设计和实现一个高效、实用、安全的即时通讯工具,需要选择合适的开发语言和技术架构。本文...

    JAVA即时通讯系统

    Java即时通讯系统是一种基于Java技术实现的实时通信平台,它允许用户进行文本、语音、视频等多种形式的交互。本系统通常包含服务器端和客户端两部分,通过网络协议进行数据传输,实现了用户之间的即时消息传递。以下...

    java 即时通讯系统

    Java即时通讯系统是一种基于Java技术构建的实时通信平台,它允许用户进行文本、语音、视频等多种形式的在线交互。在本项目中,我们将探讨Java即时通讯系统的核心技术和关键组件。 1. **Java NIO(非阻塞I/O)**:...

    JAVA即时通讯系统软件

    本项目“JAVA即时通讯系统软件”是使用Java编程语言实现的一个类似功能的系统,它旨在提供一个平台,使用户能够进行文字聊天、文件传输等基本的即时通讯操作。 在Java中实现即时通讯系统,主要涉及到以下几个关键的...

    Java即时通讯QQ服务器端加客户端,带源码,可自行研究

    根据提供的文件信息,我们可以深入探讨Java即时通讯QQ服务器端加客户端的相关知识点,包括其实现原理、关键技术以及如何利用源码进行研究。 ### 实现原理 #### 即时通讯概述 即时通讯(Instant Messaging, IM)是...

Global site tag (gtag.js) - Google Analytics