`
hanbaohong
  • 浏览: 407366 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

在ASP中UTF8与GB2312互转的代码

    博客分类:
  • ASP
阅读更多
<%
1、'UTF转GB---将UTF8编码文字转换为GB编码文字
function UTF2GB(UTFStr) 
for Dig=1 to len(UTFStr) 
  '如果UTF8编码文字以%开头则进行转换
  if mid(UTFStr,Dig,1)="%" then 
     'UTF8编码文字大于8则转换为汉字
    if len(UTFStr) >= Dig+8 then 
       GBStr=GBStr & ConvChinese(mid(UTFStr,Dig,9)) 
       Dig=Dig+8 
    else 
      GBStr=GBStr & mid(UTFStr,Dig,1) 
    end if 
  else 
     GBStr=GBStr & mid(UTFStr,Dig,1) 
  end if 
next 
UTF2GB=GBStr 
end function 

'UTF8编码文字将转换为汉字
function ConvChinese(x) 
   A=split(mid(x,2),"%") 
   i=0 
   j=0 
  for i=0 to ubound(A) 
     A(i)=c16to2(A(i)) 
  next 
  for i=0 to ubound(A)-1 
    DigS=instr(A(i),"0") 
    Unicode="" 
    for j=1 to DigS-1 
      if j=1 then 
        A(i)=right(A(i),len(A(i))-DigS) 
        Unicode=Unicode & A(i) 
      else 
         i=i+1 
         A(i)=right(A(i),len(A(i))-2) 
         Unicode=Unicode & A(i) 
      end if 
    next 

    if len(c2to16(Unicode))=4 then 
       ConvChinese=ConvChinese & chrw(int("&H" & c2to16(Unicode))) 
    else 
       ConvChinese=ConvChinese & chr(int("&H" & c2to16(Unicode))) 
    end if 
  next 
end function 

'二进制代码转换为十六进制代码
function c2to16(x)
   i=1 
   for i=1 to len(x) step 4 
      c2to16=c2to16 & hex(c2to10(mid(x,i,4))) 
   next 
end function 

'二进制代码转换为十进制代码
function c2to10(x)
   c2to10=0 
   if x="0" then exit function 
     i=0 
   for i= 0 to len(x) -1 
      if mid(x,len(x)-i,1)="1" then c2to10=c2to10+2^(i) 
   next 
end function 

'十六进制代码转换为二进制代码
function c16to2(x) 
    i=0 
    for i=1 to len(trim(x)) 
      tempstr= c10to2(cint(int("&h" & mid(x,i,1)))) 
      do while len(tempstr)<4 
         tempstr="0" & tempstr 
      loop 
      c16to2=c16to2 & tempstr 
   next 
end function 

'十进制代码转换为二进制代码
function c10to2(x) 
   mysign=sgn(x) 
   x=abs(x) 
   DigS=1 
   do 
      if x<2^DigS then 
        exit do 
      else 
        DigS=DigS+1 
      end if 
   loop 
   tempnum=x 

   i=0 
   for i=DigS to 1 step-1 
      if tempnum>=2^(i-1) then 
         tempnum=tempnum-2^(i-1) 
         c10to2=c10to2 & "1" 
      else 
         c10to2=c10to2 & "0" 
      end if 
   next 
   if mysign=-1 then c10to2="-" & c10to2 
end function

2、'GB转UTF8--将GB编码文字转换为UTF8编码文字

Function toUTF8(szInput)
    Dim wch, uch, szRet
    Dim x
    Dim nAsc, nAsc2, nAsc3
    '如果输入参数为空,则退出函数
    If szInput = "" Then
        toUTF8 = szInput
        Exit Function
    End If
    '开始转换
     For x = 1 To Len(szInput)
        '利用mid函数分拆GB编码文字
        wch = Mid(szInput, x, 1)
        '利用ascW函数返回每一个GB编码文字的Unicode字符代码
        '注:asc函数返回的是ANSI 字符代码,注意区别
        nAsc = AscW(wch)
        If nAsc < 0 Then nAsc = nAsc + 65536
    
        If (nAsc And &HFF80) = 0 Then
            szRet = szRet & wch
        Else
            If (nAsc And &HF000) = 0 Then
                uch = "%" & Hex(((nAsc \ 2 ^ 6)) Or &HC0) & Hex(nAsc And &H3F Or &H80)
                szRet = szRet & uch
            Else
               'GB编码文字的Unicode字符代码在0800 - FFFF之间采用三字节模版
                uch = "%" & Hex((nAsc \ 2 ^ 12) Or &HE0) & "%" & _
                            Hex((nAsc \ 2 ^ 6) And &H3F Or &H80) & "%" & _
                            Hex(nAsc And &H3F Or &H80)
                szRet = szRet & uch
            End If
        End If
    Next
        
    toUTF8 = szRet
End Function

3、'GB转unicode---将GB编码文字转换为unicode编码文字

function chinese2unicode(Str) 
  dim i 
  dim Str_one 
  dim Str_unicode 
  if(isnull(Str)) then
     exit function
  end if
  for i=1 to len(Str) 
    Str_one=Mid(Str,i,1) 
    Str_unicode=Str_unicode&chr(38) 
    Str_unicode=Str_unicode&chr(35) 
    Str_unicode=Str_unicode&chr(120) 
    Str_unicode=Str_unicode& Hex(ascw(Str_one)) 
    Str_unicode=Str_unicode&chr(59) 
  next 
  chinese2unicode=Str_unicode 
end function   

4、'URL解码
Function URLDecode(enStr)
dim deStr
dim c,i,v
deStr=""
for i=1 to len(enStr)
  c=Mid(enStr,i,1)
  if c="%" then
   v=eval("&h"+Mid(enStr,i+1,2))
   if v<128 then
    deStr=deStr&chr(v)
    i=i+2
   else
    if isvalidhex(mid(enstr,i,3)) then
     if isvalidhex(mid(enstr,i+3,3)) then
      v=eval("&h"+Mid(enStr,i+1,2)+Mid(enStr,i+4,2))
      deStr=deStr&chr(v)
      i=i+5
     else
      v=eval("&h"+Mid(enStr,i+1,2)+cstr(hex(asc(Mid(enStr,i+3,1)))))
      deStr=deStr&chr(v)
      i=i+3 
     end if 
    else 
     destr=destr&c
    end if
   end if
  else
   if c="+" then
    deStr=deStr&" "
   else
    deStr=deStr&c
   end if
  end if
next
URLDecode=deStr
end function

'判断是否为有效的十六进制代码
function isvalidhex(str)
dim c
isvalidhex=true
str=ucase(str)
if len(str)<>3 then isvalidhex=false:exit function
if left(str,1)<>"%" then isvalidhex=false:exit function
  c=mid(str,2,1)
if not (((c>="0") and (c<="9")) or ((c>="A") and (c<="Z"))) then isvalidhex=false:exit function
  c=mid(str,3,1)
if not (((c>="0") and (c<="9")) or ((c>="A") and (c<="Z"))) then isvalidhex=false:exit function
end function
%>

 

分享到:
评论

相关推荐

    asp下GB2312转UTF8编码

    在ASP(Active Server Pages)环境中,有时我们需要将GB2312编码的字符串或文件转换为UTF-8编码,以便在多语言环境下兼容性更强。本篇将详细介绍ASP中GB2312转UTF-8的原理和方法。 GB2312是中国大陆广泛使用的简体...

    gb2312编码转utf-8编码

    总之,GB2312和UTF-8是两种不同的字符编码方式,它们在处理中文文本时各有优势,而转换工具和编程技巧可以帮助我们在两者之间灵活切换,以适应不同场景的需求。在处理网页和源代码文件时,确保编码的一致性至关重要...

    Access数据库中UTF-8转GB2312的方法

    ### Access数据库中UTF-8转GB2312的方法 #### 概述 在实际工作中,我们经常会遇到不同编码格式的数据文件,特别是在处理中文字符时,由于不同的编码方式会导致显示异常,因此掌握如何进行编码转换是非常重要的技能...

    实现UTF8转换GB2312国标码的asp代码

    描述中的"ASP来实现UTF8转换GB2312国标码-GB2312转UTF-8"进一步明确了我们需要关注的是两个函数:`U2UTF8` 和 `GB2UTF`。这两个函数分别负责将一个数字(表示UTF-8编码的Unicode码点)转换成UTF-8字节序列,以及将一...

    ASP中Utf-8与Gb2312编码转换乱码问题的解决方法 页面编码声明

    出现这样的问题是当你浏览UTF-8编码的时候,服务器默认用UTF-8的引擎来输出html,当你用再浏览GB2312的页面时,它还是用UTF-8来输出本应是GB2312编码的页面所以会乱码。 为了这个问题烦了我一个早上,终于的蓝色理想...

    gb2312和utf-8文件编码互换工具

    UTF-8最大的优点是其与ASCII码兼容,且在网页和电子邮件中广泛使用。对于英文字符,UTF-8使用单字节,对于大多数中文字符,使用三个字节,对于一些特殊字符,可能需要四个或更多字节。 3. **编码转换工具**:这个名...

    gb2312和utf-8文件编码互换工具 v1.05.rar

    本程序实现utf-8和gb2312编码互换 特色: 1、可以自定义要转换的文件扩展名 2、可以自定义要转换的文件的路径(相对,绝对) 3、自动识别编码格式 4、转换时自动将结果输出到指定的文件夹。不会覆盖原因的...

    KindEditor ASP版后台编辑器UTF-8和GB2312均可用

    其核心优势在于既能适应UTF-8编码,也能应对GB2312编码,这意味着无论是在国际化的网站环境中,还是在中国国内的简体中文环境下,KindEditor都能无缝地工作。 1. **编辑器特性**: - **富文本功能**:KindEditor...

    asp.net下UTF-7转GB2312编码的代码(中文)

    在探讨ASP.NET环境下UTF-7转GB2312编码的具体实现之前,我们先来了解一下相关的背景知识。 ### 一、编码基础知识 #### 1. **字符编码简介** 字符编码是计算机用来表示文本的一种方式。不同的编码标准可以代表不同...

    ASP实例开发源码—gb2312和utf-8文件编码互换源码asp版 v1.05.zip

    这个实例开发源码——“ASP实例开发源码—gb2312和utf-8文件编码互换源码asp版 v1.05.zip”提供了一个功能,即在ASP环境中实现GBK(GB2312)编码与UTF-8编码之间的转换。这种转换对于处理不同编码格式的文本数据,...

    最好的汉字转换拼音utf-8 php版 权威

    在PHP中处理UTF-8编码的数据,需要确保所有涉及字符串操作的函数都支持多字节字符,比如使用mb_string扩展来处理,避免出现乱码问题。 在提供的文件列表中,"qq.php"可能是实现汉字转拼音功能的PHP源代码文件。...

    基于ASP的gb2312和utf-8文件编码互换源码 v1.05.zip

    在这个"基于ASP的gb2312和utf-8文件编码互换源码 v1.05.zip"压缩包中,提供的源码显然专注于解决一个常见的问题:在ASP环境中,如何在GB2312和UTF-8两种不同的字符编码之间进行转换。 GB2312是中国大陆广泛使用的...

    ASPCMS UTF-8版

    ASPCMS UTF-8版是一款基于ASP编程语言开发的网站内容管理系统(CMS),它是由官方原始的GB2312编码版本转化而来的,以适应更广泛的多语言环境,特别是支持中文简体和繁体以及其他Unicode编码的语言。UTF-8编码是一种...

    正版 eWebEditor V6.0 for ASP 简体中文版(GB2312)网页编辑

    在eWebEditor中采用GB2312编码,意味着它可以正确地显示和处理大部分中文字符,但可能无法支持繁体中文和其他语言的特殊字符,对于多语言网站可能需要其他编码方案如UTF-8。 在使用eWebEditor时,用户可以享受到...

    asp下解决UTF_8乱码问题

    例如,如果ASP文件是用UTF-8编码的,但在页面头部没有正确声明charset=utf-8,浏览器会按照默认的编码(如GB2312)解析,从而产生乱码。 2. **数据库编码问题**:数据库字段的编码与ASP读取数据时指定的编码不一致...

    selectersky gb2312和utf-8文件编码互换工具 v1.05

    本程序实现utf-8和gb2312编码互换 特色: 1、可以自定义要转换的文件扩展名 2、可以自定义要转换的文件的路径(相对,绝对) 3、自动识别编码格式 4、转换时自动将结果输出到指定的文件夹。不会覆盖原因的文件。...

    asp版百度关键字排名查询(gb2312)版

    在描述中提到的“解决某些情况下只能通过gb2312方式来获取排名”,这暗示了该程序可能针对的是早期的系统或服务器环境,这些环境可能不支持UTF-8等更现代的编码方式,而只能处理GB2312编码。在进行网络数据抓取或者...

Global site tag (gtag.js) - Google Analytics