`
wtb
  • 浏览: 105861 次
  • 性别: Icon_minigender_1
  • 来自: 南京
社区版块
存档分类
最新评论

截取中文

阅读更多

  def trc_utf8(text, length = 40, t_string = "...") 
      l=0 
      char_array=text.unpack("U*") 
      char_array.each_with_index do |c,i| 
        l = l+ (c<127 ? 0.5 : 1) 
        if l>=length 
          return char_array[0..i].pack("U*")+(i<char_array.length-1 ? t_string : "") 
        end 
      end 
     return text 
  end 

分享到:
评论

相关推荐

    impala中substr()截取中文字符串乱码的问题

    然而,当涉及到处理中文字符时,Impala的内置函数`substr()`和`substring()`可能会遇到一些挑战,尤其是在截取中文字符串时可能出现乱码问题。这是因为这两个函数在设计时可能没有充分考虑多字节字符集,如UTF-8,而...

    JavaScript截取中文字符串

    ### JavaScript截取中文字符串知识点详解 #### 一、引言 在进行文本处理时,我们经常需要对字符串进行截取操作。特别是在处理包含多种字符集(如英文与中文)的字符串时,考虑到不同字符编码长度的差异性,简单地...

    php截取汉字类

    在Web开发中,尤其是中文网站的开发过程中,经常需要对中文字符串进行截取处理。PHP作为一种常用的服务器端脚本语言,提供了多种方法来处理字符串,包括对中文字符的处理。本文将详细介绍一个专门用于PHP截取汉字的...

    delphi 实现截取字符串中中文+英文混合截取

    在Delphi编程环境中,处理中文和英文混合的字符串截取是一项常见的任务,特别是在涉及到文本处理、数据解析或者用户界面展示时。由于Unicode编码的存在,中文字符通常占据两个字节,而英文字符则占据一个字节,这就...

    PHP中如何截取中文字符串

    我们可以使用`mb_substr()`函数来截取中文字符串: ```php $ChineseString = "这是一个中文字符串"; $substring = mb_substr($ChineseString, 0, 3, 'utf-8'); ``` 在上面的代码中,`mb_substr()`函数的第三个参数...

    java中截取带汉字的字符串

    ### Java中截取带汉字的字符串 在Java编程语言中,处理包含中文字符的字符串时,经常遇到的一个问题是如何正确地截取这些字符串。如果直接按照字节(byte)来进行分割,很容易导致中文字符被截断一半,从而形成乱码。...

    解决php截取中文出现乱码

    这里的关键在于第四个参数 `"UTF-8"` 的设置,它告诉 `substr()` 函数按照 UTF-8 编码处理字符串,从而正确地截取中文字符。 #### 使用`mb_substr()`函数: 对于现代PHP项目而言,使用 `mb_substr()` 是更好的选择...

    Excel截取中文的综合函数应用举例.docx

    在Excel中,虽然没有直接提供专门用于截取中文字符的函数,但可以通过组合使用其他函数来实现这一目标。本文档提供了几个例子,演示了如何利用LEFT和RIGHT函数结合LEN和LENB函数,来分别截取中文字符以及非中文字符...

    smarty_用于截取中文不会破字的变量调节器

    为了解决这个问题,我们可以使用一个名为“modifier[1].cutstr”的自定义变量调节器,它专为正确截取中文字符串而设计。 这个自定义调节器扩展了Smarty的功能,确保在截取包含中文字符的字符串时,每个汉字都能完整...

    PHP 去HTML,截取指定汉字正则表达试

    PHP 去HTML,截取指定汉字正则表达试PHP 去HTML,截取指定汉字正则表达试PHP 去HTML,截取指定汉字正则表达试PHP 去HTML,截取指定汉字正则表达试PHP 去HTML,截取指定汉字正则表达试PHP 去HTML,截取指定汉字正则表达试...

    Python实现简单截取中文字符串的方法

    2. **字符完整性**:当截取中文字符串时,要确保不会在汉字中间进行截断,否则会导致乱码。 3. **性能考虑**:对于大数据量的字符串处理,需要注意性能优化,避免不必要的重复编码转换。 #### 六、拓展讨论 除了...

    C++中汉字字符串的截取

    C++中汉字字符串的截取 在 C++ 中处理汉字字符串时,一个重要的问题是如何正确地截取汉字字符串。下面将详细介绍相关的知识点。 一、GBK 编码简介 GBK 编码是一种中文字符编码标准,它是中国国家标准总局发布的...

    php自定义函数截取汉字长度

    特别地,在处理包含汉字的字符串时,传统的方法如substr()可能无法准确地按照汉字数量进行截取,因为汉字在计算机内部是以多字节字符形式存在的。针对这一问题,可以编写自定义函数来解决。 自定义函数的目的在于...

    php字符串截取中文截取2,单字节截取模式

    这里需要注意的是,这里的“单字节截取模式”并不是指中文字符被当作单字节处理,而是指在截取中文字符串时,要保证每个字符的完整性,即使在截取长度为单个字节的字符串时,也要保证不破坏中文字符的完整性。...

    java 截取字符串(判断汉字)

    ### Java截取字符串(判断汉字) #### 背景与目的 在开发Web应用程序时,尤其是在使用Java Server Pages (JSP) 进行开发时,经常需要处理包含中文字符的字符串。由于中文字符通常占用两个字节,而英文字符只占用一...

    php中截取中文字符串的代码小结

    php //截取中文字符串 function mysubstr($str, $start, $len) { $tmpstr = “”; $strlen = $start + $len; for($i = 0; $i &lt; $strlen; $i++) { if(ord(substr($str, $i, 1)) &gt; 0xa0) { $tmpstr .= substr

    php截取中文字符串不乱码的方法

    总结来说,要避免 PHP 截取中文字符串时的乱码问题,关键在于正确使用 `mb_substr` 函数并指定字符串的编码,同时确保 PHP 文件和网页的编码设置一致。在不确定字符串编码的情况下,可以通过 `mb_check_encoding` ...

    c++截取汉字和英文混合字符串代码实例

    C++截取汉字和英文混合字符串代码实例 C++截取汉字和英文混合字符串是一种非常常见的操作,在实际开发中,我们经常需要截取字符串中的汉字和英文部分。然而,C++的标准库函数string.substr()只能按英文截取,如果是...

    php 解决substr()截取中文字符乱码问题

    总之,解决PHP中`substr()`函数截取中文字符导致的乱码问题,关键在于使用支持多字节字符的函数,如`mb_substr()`,或者编写自定义函数来处理中文字符。同时,保持整个系统编码的一致性也是预防此类问题的重要措施。...

Global site tag (gtag.js) - Google Analytics