乱码的一些见解和解决思路

fengdao11

浏览: 14845 次
性别:
来自: 深圳

最近访客更多访客>>

hfut_jimi

woodding2008

719753987

webeasymail

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

乱码

java

Java中文问题一直困扰着很多初学者，如果了解了Java系统的中文问题原理，我们就可以对中文问题能够采取根本的解决之道。
　　最古老的解决方案是使用String的字节码转换，这种方案问题是不方便，我们需要破坏对象封装性，进行字节码转换。
　　还有一种方式是对J2EE容器进行编码设置，如果J2EE应用系统脱离该容器，则会发生乱码，而且指定容器配置不符合J2EE应用和容器分离的原则。
　　在Java内部运算中，涉及到的所有字符串都会被转化为UTF-8编码来进行运算。那么，在被Java转化之前，字符串是什么样的字符集？ Java总是根据操作系统的默认编码字符集来决定字符串的初始编码，而且Java系统的输入和输出的都是采取操作系统的默认编码。
　　因此，如果能统一Java系统的输入、输出和操作系统3者的编码字符集合，将能够使Java系统正确处理和显示汉字。这是处理Java系统汉字的一个原则，但是在实际项目中，能够正确抓住和控制住Java系统的输入和输出部分是比较难的。J2EE中，由于涉及到外部浏览器和数据库等，所以中文问题乱码显得非常突出。
　　J2EE应用程序是运行在J2EE容器中。在这个系统中，输入途径有很多种：一种是通过页面表单打包成请求（request）发往服务器的；第二种是通过数据库读入；还有第3种输入比较复杂，JSP在第一次运行时总是被编译成Servlet，JSP中常常包含中文字符，那么编译使用javac时，Java将根据默认的操作系统编码作为初始编码。除非特别指定，如在Jbuilder/eclipse中可以指定默认的字符集。
　　输出途径也有几种：第一种是JSP页面的输出。由于JSP页面已经被编译成Servlet，那么在输出时，也将根据操作系统的默认编码来选择输出编码，除非指定输出编码方式；还有输出途径是数据库，将字符串输出到数据库。
　　由此看来，一个J2EE系统的输入输出是非常复杂，而且是动态变化的，而Java是跨平台运行的，在实际编译和运行中，都可能涉及到不同的操作系统，如果任由Java自由根据操作系统来决定输入输出的编码字符集，这将不可控制地出现乱码。
　　正是由于Java的跨平台特性，使得字符集问题必须由具体系统来统一解决，所以在一个Java应用系统中，解决中文乱码的根本办法是明确指定整个应用系统统一字符集。
　　指定统一字符集时，到底是指定ISO8859_1 、GBK还是UTF-8呢？
　　（1）如统一指定为ISO8859_1，因为目前大多数软件都是西方人编制的，他们默认的字符集就是ISO8859_1，包括操作系统Linux和数据库MySQL等。这样，如果指定Jive统一编码为ISO8859_1，那么就有下面3个环节必须把握：
　　开发和编译代码时指定字符集为ISO8859_1。
　　运行操作系统的默认编码必须是ISO8859_1，如Linux。
　　在JSP头部声明：<%@ page c %>。
　　（2）如果统一指定为GBK中文字符集，上述3个环节同样需要做到，不同的是只能运行在默认编码为GBK的操作系统，如中文Windows。
　　统一编码为ISO8859_1和GBK虽然带来编制代码的方便，但是各自只能在相应的操作系统上运行。但是也破坏了Java跨平台运行的优越性，只在一定范围内行得通。例如，为了使得GBK编码在linux上运行，设置Linux编码为GBK。
　　那么有没有一种除了应用系统以外不需要进行任何附加设置的中文编码根本解决方案呢？
　　将Java/J2EE系统的统一编码定义为UTF-8。UTF-8编码是一种兼容所有语言的编码方式，惟一比较麻烦的就是要找到应用系统的所有出入口，然后使用UTF-8去“结扎”它。
　　一个J2EE应用系统需要做下列几步工作：

    开发和编译代码时指定字符集为UTF-8。JBuilder和Eclipse都可以在项目属性中设置。
    使用过滤器，如果所有请求都经过一个Servlet控制分配器，那么使用Servlet的filter执行语句，将所有来自浏览器的请求（request）转换为UTF-8，因为浏览器发过来的请求包根据浏览器所在的操作系统编码，可能是各种形式编码。关键一句：
    request.setCharacterEncoding("UTF-8")。
    网上有此filter的源码，Jdon框架源码中com.jdon.util.SetCharacterEncodingFilter
    需要配置web.xml 激活该Filter。
    在JSP头部声明：<%@ page c %>。
    在Jsp的html代码中，声明UTF-8:
    <meta http-equiv="Content-Type" c>
    设定数据库连接方式是UTF-8。例如连接MYSQL时配置URL如下：
    jdbc:mysql://localhost:3306/test?useUnicode=true&characterEncoding=UTF-8
    注意，上述写法是JBoss的mysql-ds.xml写法，多亏网友提示，在tomcat中&要写成&即可。一般其他数据库都可以通过管理设置设定UTF-8
    其他和外界交互时能够设定编码时就设定UTF-8，例如读取文件，操作XML等。

　　　　笔者以前在Jsp/Servlet时就采取这个原则，后来使用Struts、Tapestry、EJB、Hibernate、Jdon等框架时，从未被乱码困扰过，可以说适合各种架构。希望本方案供更多初学者分享，减少Java/J2EE的第一个拦路虎，也避免因为采取一些临时解决方案，导致中文问题一直出现在新的技术架构中。

分享到：

java gbk转utf-8乱码问题 | java 乱码问题-Dfile.encoding=UTF-8

2012-03-30 17:44
浏览 792
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

JAVA自学之路: 经常的进行知识难点的查询，如果一个问题牵扯的面比较广，就干脆到网上搜索一些相关的专题，比如“java 乱码 mysql” “oracle 创建用户”等等，如果有必要，不要犯懒，勤动手写一些小小的测试程序，来弄明白知识点...

spring-ai-bedrock-converse-1.0.0-M7.jar中文文档.zip: # 【spring-ai-bedrock-converse-1.0.0-M7.jar中文文档.zip】中包含：中文文档：【spring-ai-bedrock-converse-1.0.0-M7-javadoc-API文档-中文(简体)版.zip】 jar包下载地址：【spring-ai-bedrock-converse-1.0.0-M7.jar下载地址(官方地址+国内镜像地址).txt】 Maven依赖：【spring-ai-bedrock-converse-1.0.0-M7.jar Maven依赖信息(可用于项目pom.xml).txt】 Gradle依赖：【spring-ai-bedrock-converse-1.0.0-M7.jar Gradle依赖信息(可用于项目build.gradle).txt】源代码下载地址：【spring-ai-bedrock-converse-1.0.0-M7-sources.jar下载地址(官方地址+国内镜像地址).txt】 # 本文件关键字： spring-ai-bedrock-converse-1.0.0-M7.jar中文文档.zip,java,spring-ai-bedrock-converse-1.0.0-M7.jar,org.springframework.ai,spring-ai-bedrock-converse,1.0.0-M7,org.springframework.ai.bedrock.converse,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,springframework,spring,ai,bedrock,converse,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压【spring-ai-bedrock-converse-1

房地产 -可视化管理课件.ppt: 房地产 -可视化管理课件.ppt

tokenizers-0.18.0.jar中文-英文对照文档.zip: # 【tokenizers-***.jar***文档.zip】中包含： ***文档：【tokenizers-***-javadoc-API文档-中文(简体)版.zip】 jar包下载地址：【tokenizers-***.jar下载地址(官方地址+国内镜像地址).txt】 Maven依赖：【tokenizers-***.jar Maven依赖信息(可用于项目pom.xml).txt】 Gradle依赖：【tokenizers-***.jar Gradle依赖信息(可用于项目build.gradle).txt】源代码下载地址：【tokenizers-***-sources.jar下载地址(官方地址+国内镜像地址).txt】 # 本文件关键字： tokenizers-***.jar***文档.zip,java,tokenizers-***.jar,ai.djl.huggingface,tokenizers,***,ai.djl.engine.rust,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,djl,huggingface,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压【tokenizers-***.jar***文档.zip】，再解压其中的【tokenizers-***-javadoc-API文档-中文(简体)版.zip】，双击【index.html】文件，即可用浏览器打开、进行查看。 # 特殊说明： ·本文档为人性化翻译，精心制作，请放心使用。 ·只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等； ·不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 # 温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件； # Maven依赖： ``` <dependency> <groupId>ai.djl.huggingface</groupId> <artifactId>tokenizers</artifactId> <version>***</version> </dependency> ``` # Gradle依赖： ``` Gradle: implementation group: 'ai.djl.huggingface', name: 'tokenizers', version: '***' Gradle (Short): implementation 'ai.djl.huggingface:tokenizers:***' Gradle (Kotlin): implementation("ai.djl.huggingface:tokenizers:***") ``` # 含有的 Java package（包）： ``` ai.djl.engine.rust ai.djl.engine.rust.zoo ai.djl.huggingface.tokenizers ai.djl.huggingface.tokenizers.jni ai.djl.huggingface.translator ai.djl.huggingface.zoo ``` # 含有的 Java class（类）： ``` ai.djl.engine.rust.RsEngine ai.djl.engine.rust.RsEngineProvider ai.djl.engine.rust.RsModel ai.djl.engine.rust.RsNDArray ai.djl.engine.rust.RsNDArrayEx ai.djl.engine.rust.RsNDArrayIndexer ai.djl.engine.rust.RsNDManager ai.djl.engine.rust.RsSymbolBlock ai.djl.engine.rust.RustLibrary ai.djl.engine.rust.zoo.RsModelZoo ai.djl.engine.rust.zoo.RsZooProvider ai.djl.huggingface.tokenizers.Encoding ai.djl.huggingface.tokenizers.HuggingFaceTokenizer ai.djl.huggingface.tokenizers.HuggingFaceTokenizer.Builder ai.djl.hu

基于MATLAB的BP神经网络预测模型构建与应用: 内容概要：本文详细介绍了如何使用MATLAB构建和应用BP神经网络预测模型。首先，通过读取Excel数据并进行预处理，如归一化处理，确保数据的一致性和有效性。接着，配置网络结构，选择合适的训练算法（如SCG），设置训练参数（如最大迭代次数、目标误差等）。然后，进行模型训练，并通过可视化窗口实时监控训练过程。训练完成后，利用测试集评估模型性能，计算均方误差（MSE）和相关系数（R²），并通过图表展示预测效果。最后，将训练好的模型保存以便后续调用，并提供了一个简单的预测函数，确保新数据能够正确地进行归一化和预测。适合人群：具有一定MATLAB基础，从事数据分析、机器学习领域的研究人员和技术人员。使用场景及目标：适用于需要对多维数据进行预测的任务，如电力负荷预测、金融数据分析等。主要目标是帮助用户快速搭建一个可用的BP神经网络预测系统，提高预测准确性。其他说明：文中提供了完整的代码框架和详细的注释，便于理解和修改。同时，强调了数据预处理的重要性以及一些常见的注意事项，如数据量的要求、归一化的必要性等。

tokenizers-0.22.1.jar中文-英文对照文档.zip: # 【tokenizers-***.jar***文档.zip】中包含： ***文档：【tokenizers-***-javadoc-API文档-中文(简体)版.zip】 jar包下载地址：【tokenizers-***.jar下载地址(官方地址+国内镜像地址).txt】 Maven依赖：【tokenizers-***.jar Maven依赖信息(可用于项目pom.xml).txt】 Gradle依赖：【tokenizers-***.jar Gradle依赖信息(可用于项目build.gradle).txt】源代码下载地址：【tokenizers-***-sources.jar下载地址(官方地址+国内镜像地址).txt】 # 本文件关键字： tokenizers-***.jar***文档.zip,java,tokenizers-***.jar,ai.djl.huggingface,tokenizers,***,ai.djl.engine.rust,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,djl,huggingface,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压【tokenizers-***.jar***文档.zip】，再解压其中的【tokenizers-***-javadoc-API文档-中文(简体)版.zip】，双击【index.html】文件，即可用浏览器打开、进行查看。 # 特殊说明： ·本文档为人性化翻译，精心制作，请放心使用。 ·只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等； ·不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 # 温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件； # Maven依赖： ``` <dependency> <groupId>ai.djl.huggingface</groupId> <artifactId>tokenizers</artifactId> <version>***</version> </dependency> ``` # Gradle依赖： ``` Gradle: implementation group: 'ai.djl.huggingface', name: 'tokenizers', version: '***' Gradle (Short): implementation 'ai.djl.huggingface:tokenizers:***' Gradle (Kotlin): implementation("ai.djl.huggingface:tokenizers:***") ``` # 含有的 Java package（包）： ``` ai.djl.engine.rust ai.djl.engine.rust.zoo ai.djl.huggingface.tokenizers ai.djl.huggingface.tokenizers.jni ai.djl.huggingface.translator ai.djl.huggingface.zoo ``` # 含有的 Java class（类）： ``` ai.djl.engine.rust.RsEngine ai.djl.engine.rust.RsEngineProvider ai.djl.engine.rust.RsModel ai.djl.engine.rust.RsNDArray ai.djl.engine.rust.RsNDArrayEx ai.djl.engine.rust.RsNDArrayIndexer ai.djl.engine.rust.RsNDManager ai.djl.engine.rust.RsSymbolBlock ai.djl.engine.rust.RustLibrary ai.djl.engine.rust.zoo.RsModelZoo ai.djl.engine.rust.zoo.RsZooProvider ai.djl.huggingface.tokenizers.Encoding ai.djl.huggingface.tokenizers.HuggingFaceTokenizer ai.djl.huggingface.tokenizers.HuggingFaceTokenizer.Builder ai.djl.hu

基于蒙特卡洛算法的电动汽车对IEEE 33节点电网影响的研究及应用场景分析: 内容概要：本文探讨了电动汽车（EV）对IEEE 33节点电网的影响，特别是汽车负荷预测与节点潮流网损、压损计算。通过蒙特卡洛算法模拟电动汽车负荷的时空特性，研究了四种不同场景下电动汽车接入电网的影响。具体包括：负荷接入前后的网损与电压计算、不同节点接入时的变化、不同时段充电的影响以及不同负荷大小对电网的影响。通过这些分析，揭示了电动汽车充电行为对电网的具体影响机制，为未来的电网规划和优化提供了重要参考。适合人群：从事电力系统研究的专业人士、电网规划工程师、电动汽车行业从业者、能源政策制定者。使用场景及目标：①评估电动汽车大规模接入对现有电网基础设施的压力；②优化电动汽车充电设施的布局和运营策略；③为相关政策和技术标准的制定提供科学依据。其他说明：文中提供的Python代码片段用于辅助理解和验证理论分析，实际应用中需要更复杂的模型和详细的电网参数。

房地产 -【万科经典-第五园】第五园产品推介会.ppt: 房地产 -【万科经典-第五园】第五园产品推介会.ppt

稳压器件.SchLib: 稳压器件.SchLib

1.jpg: 1

模拟符号.SCHLIB: 模拟符号.SCHLIB

基于Simulink的三相电压型逆变器SPWM与电压单闭环控制仿真: 内容概要：本文详细介绍了如何在Simulink中构建并仿真三相电压型逆变器的SPWM调制和电压单闭环控制系统。首先，搭建了由六个IGBT组成的三相全桥逆变电路，并设置了LC滤波器和1000V直流电源。接着，利用PWM Generator模块生成SPWM波形，设置载波频率为2kHz，调制波为50Hz工频正弦波。为了实现精确的电压控制，采用了abc/dq变换将三相电压信号转换到旋转坐标系，并通过锁相环（PLL）进行同步角度跟踪。电压闭环控制使用了带有抗饱和处理的PI调节器，确保输出电压稳定。此外，文中还讨论了标幺值处理方法及其优势，以及如何通过FFT分析验证输出波形的质量。适用人群：电力电子工程师、自动化控制专业学生、从事逆变器研究的技术人员。使用场景及目标：适用于希望深入了解三相电压型逆变器控制原理和技术实现的研究人员和工程师。主要目标是掌握SPWM调制技术和电压单闭环控制的设计与调试方法，提高系统的稳定性和效率。其他说明：文中提供了详细的建模步骤和参数设置指南，帮助读者快速上手并在实践中不断优化模型性能。同时，强调了一些常见的调试技巧和注意事项，如载波频率的选择、积分器防饱和处理等。

【蓝桥杯EDA】客观题解析：第十三届立创EDA出品省赛模拟题一.pdf: 【蓝桥杯EDA】客观题解析

房地产 -物业苏州设备房管理标准.ppt: 房地产 -物业苏州设备房管理标准.ppt

3.png: 3

房地产 -2024H1房地产市场总结与展望（新房篇）.docx: 房地产 -2024H1房地产市场总结与展望（新房篇）.docx

LabVIEW与PLC基于TCP协议的自动化数据交互解决方案: 内容概要：本文详细介绍了利用LabVIEW与PLC进行自动化数据交互的技术方案，涵盖参数管理、TCP通信、串口扫描、数据转移等方面。首先，通过配置文件(INI)实现参数的自动加载与保存，确保参数修改不影响程序运行。其次，在TCP通信方面采用异步模式和心跳包设计，增强通信稳定性，并加入CRC16校验避免数据丢失。对于串口扫描，则通过VISA配置实现状态触发，确保进出站检测的准确性。最后，针对不同类型的数据转移提出具体方法，如TDMS文件存储策略，确保高效可靠的数据处理。适合人群：从事工业自动化领域的工程师和技术人员，尤其是熟悉LabVIEW和PLC编程的从业者。使用场景及目标：适用于需要将LabVIEW作为上位机与PLC进行数据交互的工业生产线环境，旨在提高系统的自动化程度、稳定性和易维护性。其他说明：文中提供了多个实用代码片段和注意事项，帮助读者更好地理解和应用相关技术。

d65689da7ed20e21882a634f8f5ce6c9_faad2735d293907fb32f7c5837f7302a.png: d65689da7ed20e21882a634f8f5ce6c9_faad2735d293907fb32f7c5837f7302a

信息安全管理和技术的综合练习题集（NISP&CISP）: 内容概要：本文档《NISP&CISP考试题库.pdf》汇集了大量关于信息安全专业领域的练习题，涵盖风险评估、安全策略、访问控制、恶意代码防范、加密技术、安全模型等多个方面。文档通过选择题的形式探讨了信息安全保障、风险管理和技术实施等核心内容，强调了信息安全保障的动态性和持续性，以及信息安全管理体系（ISMS）的重要性。文档还详细介绍了多种安全技术和标准，如ISO27001、GB/T 22080、SSE-CMM、CC标准等，并通过具体案例和场景分析，帮助读者理解如何在实际环境中应用这些标准和技术。适用人群：文档适用于信息安全领域的从业者，尤其是准备参加NISP（国家信息安全水平考试）和CISP（注册信息安全专业人员）认证考试的考生，以及从事信息安全管理工作、对信息安全有兴趣的技术人员。使用场景及目标：①帮助考生系统复习信息安全领域的基础知识和技能，为考试做准备；②为企业内部信息安全培训提供参考资料；③加深信息安全从业人员对安全标准和技术的理解，提升其在实际工作中的应用能力；④帮助信息安全管理者了解如何构建和维护有效的信息安全管理体系。其他说明：文档不仅提供了理论知识，还结合了实际案例，有助于读者理解信息安全的复杂性和多样性。文档强调了信息安全的多层次、多维度特性，指出信息安全不仅依赖于技术手段，还需要结合管理措施和人员培训。此外，文档中的题目设计贴近实际工作场景，能够有效提升读者应对信息安全挑战的能力。

3dmax插件K_Tools.v2.6.ms: 3dmax插件K_Tools.v2.6

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论