big5转unicode
------------------------------------------------------------------
ASP 如何實作 VB
的 StrConv
函數來進行 Unicode
轉換 (
vbFromUnicode / vbUnicode )
VB6 的StrConv
函數說明
:
傳回一特定轉換後的 Variant
(String)。
語法
StrConv(string,
conversion, LCID)
StrConv 函數的語法有以下的指名引數:
單元 說明
string 必要引數。為欲轉換的字串運算式。
conversion 必要引數:為Integer。其值的和決定轉換的型態。
LCID 選項的。如果與系統LocaleID不同,則為LocaleID(系統LocaleID為缺省值。)
vbUnicode (64)
據系統的預設字元碼對應頁將字串轉成
Unicode。
vbFromUnicode (128)
將字串由 Unicode
轉成系統的預設字元碼對應頁。
ASP 程式碼如下 :
<%
Response.Write ConvUnicode(FromUnicode("強力Power鎯頭Hammer"))
' FromUnicode
Function FromUnicode(strData)
Dim objStm
Set objStm = Server.CreateObject("ADODB.Stream")
objStm.Charset = "Big5"
objStm.Type = 2
objStm.Open
objStm.WriteText strData
objStm.Position = 0
objStm.Charset = "Unicode"
objStm.Type = 1
FromUnicode = MidB(objStm.Read, 1)
End Function
' Unicode
Function ConvUnicode(ByVal strData)
Dim rs, stm, bytAry, intLen
If Len(strData & "") > 0 Then
strData = MidB(strData, 1)
intLen = LenB(strData)
Set rs = Server.CreateObject("ADODB.Recordset")
Set stm = Server.CreateObject("ADODB.Stream")
rs.Fields.Append "X", 205, intLen
rs.Open
rs.AddNew
rs(0).AppendChunk strData & ChrB(0)
rs.Update
bytAry = rs(0).GetChunk(intLen)
stm.Type = 1
stm.Open
stm.Write bytAry
stm.Position = 0
stm.Type = 2
stm.Charset = "Big5"
ConvUnicode = stm.ReadText
End If
On Error Resume Next
stm.Close
Set stm = Nothing
rs.Close
Set rs = Nothing
End Function
%>
gb2312转unicode
------------------------------------------------------------------
<%
'Response.Write ConvUnicode(FromUnicode("強力Power鎯頭Hammer"))
Response.Write ConvUnicode(FromUnicode("我的电脑"))
' FromUnicode
Function FromUnicode(strData)
Dim objStm
Set objStm = Server.CreateObject("ADODB.Stream")
'objStm.Charset = "Unicode"
objStm.Charset = "gb2312"
objStm.Type = 2
objStm.Open
objStm.WriteText strData
objStm.Position = 0
objStm.Charset = "gb2312"
objStm.Type = 1
FromUnicode = MidB(objStm.Read, 1)
End Function
' Unicode
Function ConvUnicode(ByVal strData)
Dim rs, stm, bytAry, intLen
If Len(strData & "") > 0 Then
strData = MidB(strData, 1)
intLen = LenB(strData)
Set rs = Server.CreateObject("ADODB.Recordset")
Set stm = Server.CreateObject("ADODB.Stream")
rs.Fields.Append "X", 205, intLen
rs.Open
rs.AddNew
rs(0).AppendChunk strData & ChrB(0)
rs.Update
bytAry = rs(0).GetChunk(intLen)
stm.Type = 1
stm.Open
stm.Write bytAry
stm.Position = 0
stm.Type = 2
stm.Charset = "gb2312"
ConvUnicode = stm.ReadText
End If
On Error Resume Next
stm.Close
Set stm = Nothing
rs.Close
Set rs = Nothing
End Function
%>
分享到:
相关推荐
- big5.wh、gb2312.wh、big5gb2.wh、gb2big5.wh:这些可能是配置文件或者数据文件,用于存储转换规则或预编译的转换表,便于快速进行编码转换。 综上所述,这个压缩包提供了一套用于GB和BIG5编码与Unicode之间转换...
常见的编码包括UTF-8、GB2312、BIG5等,其中UTF-8因支持国际字符而被广泛使用。在IIS服务器中,codepage设置指定了服务器解析文件的编码方式。例如,如果设置为,则意味着服务器将使用UTF-8编码来读取和发送数据。 ...
3、支持多种编码:GBK、BIG5、UNICODE、UTF8,软件会自动转换 4、支持附件采集,包括图片、文档等附件 5、增量采集与自动更新 6、完全结构化抽取 7、采集结果自动排重 8、数据保存到本地,您可以随时查阅信息。 9、...
说塔文件编码转换器可以将文件(如:aspx文件|*.aspx|cs文件|*....2.可实现UTF-7、UTF-8、Unicode、ASII、Big5、GB2312之间任意互转。3.可实现多个文件的批量转换。4.可智能过滤文件格式。5.按原目录格式自动备份文档。
此外,此压缩包声称提供了更完整的字库,这意味着除了GB2312编码的基本汉字外,可能还包括GBK、Big5等其他编码中的汉字,以覆盖更多的字符,这对于需要处理非标准字符的应用场景尤其重要。 总之,“通用简体中文与...
这个文件可能包含处理Big5编码的代码,用于将繁体字转换为简体或者从GB2312转换为Big5。 4. `Chinese.dll`:这是一个动态链接库文件,通常包含可重复使用的函数或组件。在这个案例中,它很可能包含了实现简繁转换的...
- **解释**:这段配置指定了 ASP.NET 应用程序处理请求和响应时使用的编码格式为 GB2312。 - **扩展说明**:如果希望整个应用程序都遵循这些设置,可以在全局配置文件 `machine.config` 中进行类似的配置。该文件...
汉字通常以GB2312、GBK、Big5或Unicode等编码表示,而拼音则基于汉语拼音标准。转换过程通常包括以下步骤: 1. **汉字编码识别**:首先,程序需要识别输入的汉字所使用的编码格式,这一步对于正确解码至关重要。 2...
自动识别GB2312、BIG5、UTF-8、Unicode等网页编码; 文件类型证察防止非文本类型文件采集; 蜘蛛可以采集ASP、PHP、JSP等动态数据网页和HTML、SHTML、XHTML等静态网页; 支持续采功能,如果因系统、网络等故障
自动识别GB2312、BIG5、UTF-8、Unicode等网页编码;文件类型证察防止非文本类型文件采集;蜘蛛可以采集ASP、PHP、JSP等动态数据网页和HTML、SHTML、XHTML等静态网页;支持续采功能,如果因系统、网络等故障问题终止...
自动识别GB2312、BIG5、UTF-8、Unicode等网页编码; 文件类型证察防止非文本类型文件采集; 蜘蛛可以采集ASP、PHP、JSP等动态数据网页和HTML、SHTML、XHTML等静态网页; 支持续采功能,如果因系统、网络等故障...
不同国家和地区制定了自己的编码标准,如GB2312、BIG5等。每个字符占用1或多个字节。例如,“中文123”在中文Windows 95中的表示为D6 D0 CE C4 31 32 33 00。 - **UNICODE阶段**:为了解决不同编码标准之间的兼容性...
自动识别GB2312、BIG5、UTF-8、Unicode等网页编码; 文件类型证察防止非文本类型文件采集; 蜘蛛可以采集ASP、PHP、JSP等动态数据网页和HTML、SHTML、XHTML等静态网页; 整合sphinx,实现千万级别搜索。重新整理程序...
自动识别GB2312、BIG5、UTF-8、Unicode等网页编码; 文件类型证察防止非文本类型文件采集; 蜘蛛可以采集ASP、PHP、JSP等动态数据网页和HTML、SHTML、XHTML等静态网页; 支持续采功能,如果因系统、网络等故障...
原理:用stream对象预读文件的头两个字节,分析判断出utf-8,unicode,ANSI(简体中文操作系统,即gb2312)编码 相关资料: ANSI: 无格式定义; Unicode: 前两个字节为FFFE; Unicode big endian: 前两字节为...
简体中文主要使用GB2312或GBK编码,而繁体中文则通常采用Big5编码。然而,现代的Unicode编码如UTF-8已经能够涵盖简体和繁体字符,使得在编码层面的转换更为便捷。 在C#中,我们可以利用.NET Framework提供的System....
自动识别GB2312、BIG5、UTF-8、Unicode等网页编码;文件类型证察防止非文本类型文件采集;蜘蛛可以采集ASP、PHP、JSP等动态数据网页和HTML、SHTML、XHTML等静态网页;支持续采功能,如果因系统、网络等故障问题终止...
自动识别GB2312、BIG5、UTF-8、Unicode等网页编码; 文件类型证察防止非文本类型文件采集; 蜘蛛可以采集ASP、PHP、JSP等动态数据网页和HTML、SHTML、XHTML等静态网页; 支持续采功能,如果因系统、网络等故障...
自动识别GB2312、BIG5、UTF-8、Unicode等网页编码; 文件类型证察防止非文本类型文件采集; 蜘蛛可以采集ASP、PHP、JSP等动态数据网页和HTML、SHTML、XHTML等静态网页; 支持续采功能,如果因系统、网络等故障问题...
自动识别GB2312、BIG5、UTF-8、Unicode等网页编码;文件类型证察防止非文本类型文件采集;蜘蛛可以采集ASP、PHP、JSP等动态数据网页和HTML、SHTML、XHTML等静态网页;本程序完全高仿百度,谷歌,有自主开发的蜘蛛智能...