`
su1216
  • 浏览: 671993 次
  • 性别: Icon_minigender_1
  • 来自: 北京
博客专栏
Group-logo
深入入门正则表达式(jav...
浏览量:72009
E60283d7-4822-3dfb-9de4-f2377e30189c
android手机的安全问...
浏览量:128921
社区版块
存档分类
最新评论

GSM 03.38 from Wikipedia

阅读更多

先说两个单词byte和octet

他们都可以翻译成字节,区别就是octet是指八位字节,而byte根据系统的不同,位数也可能会不同。

 

下面的内容翻译自Wikipedia,但并不完整

http://en.wikipedia.org/wiki/GSM_03.38

 

在移动技术中,GSM 03.38或者3GPP 23.038是一个基于蜂窝电话在GSM的短消息服务使用的字符集。

信息通过默认GSM7-bit字母表,8-bit数据字母表和16-bit UTF-16字母表编码方式发送

对于GSM手持设备和网络元素,GSM 7-bit字母表是被强制支持的

但是,像阿拉伯语、汉语、韩语或者日语中的字符,必须被编码成16-bit UTF-16字符编码或者扩展的国家语言转换表

 

GSM信息标准编码是在23.038中建议的7 bit 默认字母表

7-bit字符必须被编码成字节并遵循下面3中包装方式之一:

CBS:使用这种编码方式,小区广播服务中,一条SMS中最多可以发送93个字符(最多包装82字节)

SMS:使用这种编码方式,在GMS网络中,一条SMS中最多可以发送160个字符(最多包装140字节)

USSD:使用这种编码方式,非结构化补充数据业务的SMS信息中,最多可以发送182个字符(最多包装160字节)

 

GSM 8位数据编码

8-bit数据编码模式处理信息作为原始数据。根据标准,这是编码的字母表是用户特定的

 

UCS-2编码

这种编码允许用户使用更大范围的字符和语言

UCS-2可以表现最常用的拉丁语和西方字符

一个单一的使用这种编码的SMS GSM信息最多可以有70个字符(140字节)

很多GSM智能手机上,没有UCS-2编码的明确预设置。

默认情况下,使用7-bit编码,直到输入了一个不在GSM 7-bit表中的字符

这种情况下,整个信息使用UCS-2编码方式重新编码,并且一条信息的最大长度立即由160减少到70

 

编辑短信时,智能手机应该显示已经使用的字符数和最大字符数。当一条信息确实超出了最大限制,信息将被按着包含信息的各个部分的多条连续的SMS发送(在每一部分中使用开始的几个字符包含一个序列号)这些部分之后将在收件人那里重新组装。一些GSM智能手机当需要发送多条短消息时,对需要发送的信息数量将会警告用户。

 

 

 

国家语言转换表

根据将要写入文本语言的不同,这些表格允许使用不同的字符集

对于一个给定的信息,表格的选择是在一个SMS信息的用户数据头部分中选定的

并且可以指定整个文本或者单一字符

 

使用转换表,一个信息的字符仍然能使用7-bit编码,但是可以使用一个不同的集合来正确显示重音和语言特定的字符

编码到136个字节中(140字节减去用来指示转换表和语言代码的使用的用户数据头需要的4字节)

最多为155个字符(136 * 8 / 7)

 

对法语、希腊语、俄语、保加利亚语、阿拉伯语、希伯来语和大多数中部欧洲语言需要比默认7-bit标准字符集和默认7-bit扩展字符集更广的范围的语言来说,仍然没有定义国家语言转化表

如果有任何字符不能用默认的GSM 7-bit字符集表示,信息将会被自动使用UCS-2重新编码,代价是一条信息可能会被分成超过两条(当一条信息被分割成多个部分,用户数据头还需要一些字节用来指示每部分的序号)

 

虽然GSM 03.38的一个修订版中已经为德语、英语、意大利语、西班牙语、荷兰语、瑞典语、丹麦语、芬兰语、挪威语、希腊语和土耳其语的小区广播系统(CBS)定义了数据编码方案,之后的版本中又添加了匈牙利语、波兰语、捷克语、希伯来语、阿拉伯语、俄语和冰岛语,但是没有为这些语言定义编码表。目的是单纯的为了识别信息的语言

 

日语的基本假名、朝鲜朝鲜文字母或者中国的汉语也没有语言转换表

在日本这通常不是个问题,因为日本信息使用GSM和WAP之外的其他的标准

 

 

 

转贴请保留以下链接

本人blog地址

http://su1216.iteye.com/

http://blog.csdn.net/su1216/

1
0
分享到:
评论

相关推荐

    GSM 规范 含GSM03.38 GSM03.39 GSM03.40等

    在GSM网络中,为了支持多种语言的短信服务,GSM03.38定义了一种称为GSM 7位编码集(GSM 7-bit Alphabet)的编码方式。这种编码方式允许在一个7位字节中编码115个不同的字符,包括拉丁字母、数字和一些特殊符号。对于...

    GSM 03.38 协议

    GSM 03.38协议是全球移动通信系统(Global System for Mobile Communications,简称GSM)中的一个重要规范,主要用于定义GSM网络中文本消息(Short Message Service, SMS)的编码方式,确保短信在不同语言环境下的...

    GSM协议(gsm03.40 gsm03.38 gsm11.11)

    标题中提到的"GSM协议"是构成GSM系统核心的一系列技术规范,包括gsm03.40、gsm03.38和gsm11.11。这些文档详细定义了GSM网络中的不同通信协议和功能,对于理解GSM系统的运作至关重要。 1. **gsm03.40**:这个规范...

    最新GSM短消息规范03.38.rar

    03.38是GSM标准的一部分,专门涉及短消息服务(Short Message Service, SMS)。这个规范定义了如何在GSM网络中编码、传输和解码短信。 03.38规范详细阐述了GSM短信的编码格式,包括7位编码集(7-bit ASCII)和16位...

    GSM全球移动通信系统中文版

    GSM(Global System for Mobile Communications,全球移动通信系统)是一种广泛使用的数字蜂窝网络标准,为全球多数国家的移动通信提供了基础。这个压缩包文件包含了关于GSM系统的关键技术规范和文档,主要针对中文...

    GSM模块 SIM900x系列

    SIM900x系列是GSM模块的一种,广泛应用于物联网、工业控制、远程监控等领域,为设备提供无线通信能力。SIM900x家族主要包括SIM900A、SIM900D、SIM908等型号,这些模块支持GSM(Global System for Mobile ...

    GSM短消息协议 0338_401

    GSM03.38_401(又称为ETS300 628)是一份由欧洲电信标准协会(ETSI)发布的标准文档,主要定义了GSM系统中短信服务所涉及的数据编码方案、字符集以及语言特定信息等内容。 #### 标准范围与参考 根据文档内容,该...

    短信息收发有关的规范主要包括GSM_03

    在短信息收发的世界里,规范扮演着至关重要的角色,其中GSM 03.38、GSM 03.40和GSM 07.05是核心规范,它们定义了短信的技术实现、编码方式以及DTE-DCE接口标准。GSM 03.38主要涉及短信编码,包括7位、8位和16位编码...

    7bit编码和解码 短息编解码

    一个用c实现的7bit编码和解码,在短息编解码中比较有用。

    GSM 0338-720

    3. GSM 03.38版本:文档提到的GSM 03.38版本7.2.0,是GSM技术的一个具体组成部分,专门涉及字符集和语言特定信息。此版本号表示该文档已经经历了多次更新,每次更新都可能引入新的功能、改进或修正。本标准的发布...

    GSM PDU 中文短信相关资料

    2. **GSM03.38**:此文档定义了GSM 7-bit Default Alphabet,这是GSM系统中用于编码短信的基本字符集。虽然这个字符集不包含中文字符,但在处理中文短信时,GSM03.38规定了如何将中文字符转换为16位的Unicode编码,...

    有关GSM协议的文献

    GSM 03.38描述了语音编码和加密过程,而GSM 03.10规定了SIM卡与基站之间的通信协议。 6. **移动台(MS)与基站子系统(BSS)交互**:GSM系统中的移动台与基站通过空中接口进行通信,这部分由GSM 08.5x系列规范定义...

    GSM 03.40 短信规范

    - **GSM 03.38**:主要关注短信的编码和格式。 - **GSM 03.40**:重点在于技术实现层面,包括网络架构、服务元素和服务中心等功能。 - **GSM 07.05**:则侧重于用户设备(如手机)与网络之间的交互过程。 #### 三、...

    GSM短信协议

    GSM短信协议主要基于ETSI制定的标准,包括GSM 03.40、GSM 03.41、GSM 03.38等规范。这些协议定义了短信的编码、传输、存储和路由方式。短信可以分为两种类型:点对点(Point-to-Point,PPM)短信和细胞广播(Cell ...

    基于GPS/GSM短消息车载终端的设计与实现

    GSM通信服务的关键在于短消息的编码和解码,遵循GSM03.38、GSM03.40和GSM07.05规范。通常,短信服务有两种模式:“点对点”模式,即车载单元和监控中心通过短信服务中心(SMSC)进行通信;另一种是PDU(Protocol ...

    php检查字符串中是否包含7位GSM字符的方法

    GSM字符集指的是在GSM (全球移动通信系统) 短信中使用的一种字符编码标准,也被称为7位字符编码或GSM 03.38标准。它允许发送7位编码的字符,这意味着它可以编码160个不同的字符,主要包括拉丁字母、数字和一些特殊...

    Read-a-message-in-English.zip_I9FK_english_rathergfo_read sms c

    首先,我们要理解的是,手机接收到的短信是以数据包的形式通过网络传输的,这些数据通常遵循GSM 03.38字符编码标准,这是一种7位编码系统,可以表示128个不同的字符。在处理英文短信时,我们主要关注ASCII字符集,它...

    SMS and the PDU 格式说明

    The SMS message, as specified by the Etsi organization (documents GSM 03.40 and GSM 03.38), can be up to 160 characters long, where each character is 7 bits according to the 7-bit default alphabet....

    GSM模块PDU编码发送短信.rar

    短信分为两种编码方式:7位的ASCII编码(7-bit GSM 03.38 Alphabet)和16位的UCS2编码(Unicode)。7位编码可以容纳最多160个英文字符或140个二进制数据位,而UCS2编码则适用于非ASCII字符集,如中文,但每条短信...

    GSM短信模块开发及其应用

    开发短信接口程序时,需要熟悉AT指令集,如GSM03.38、GSM03.40和GSM07.05等标准,这些标准定义了SMS的编码方式和AT命令集,确保系统能正确处理短信的发送和接收。在实际应用中,GSM短信模块已证明具备良好的吞吐能力...

Global site tag (gtag.js) - Google Analytics