- 浏览: 3056553 次
- 性别:
- 来自: 海外
文章分类
- 全部博客 (430)
- Programming Languages (23)
- Compiler (20)
- Virtual Machine (57)
- Garbage Collection (4)
- HotSpot VM (26)
- Mono (2)
- SSCLI Rotor (1)
- Harmony (0)
- DLR (19)
- Ruby (28)
- C# (38)
- F# (3)
- Haskell (0)
- Scheme (1)
- Regular Expression (5)
- Python (4)
- ECMAScript (2)
- JavaScript (18)
- ActionScript (7)
- Squirrel (2)
- C (6)
- C++ (10)
- D (2)
- .NET (13)
- Java (86)
- Scala (1)
- Groovy (3)
- Optimization (6)
- Data Structure and Algorithm (3)
- Books (4)
- WPF (1)
- Game Engines (7)
- 吉里吉里 (12)
- UML (1)
- Reverse Engineering (11)
- NSIS (4)
- Utilities (3)
- Design Patterns (1)
- Visual Studio (9)
- Windows 7 (3)
- x86 Assembler (1)
- Android (2)
- School Assignment / Test (6)
- Anti-virus (1)
- REST (1)
- Profiling (1)
- misc (39)
- NetOA (12)
- rant (6)
- anime (5)
- Links (12)
- CLR (7)
- GC (1)
- OpenJDK (2)
- JVM (4)
- KVM (0)
- Rhino (1)
- LINQ (2)
- JScript (0)
- Nashorn (0)
- Dalvik (1)
- DTrace (0)
- LLVM (0)
- MSIL (0)
最新评论
-
mldxs:
虽然很多还是看不懂,写的很好!
虚拟机随谈(一):解释器,树遍历解释器,基于栈与基于寄存器,大杂烩 -
HanyuKing:
Java的多维数组 -
funnyone:
Java 8的default method与method resolution -
ljs_nogard:
Xamarin workbook - .Net Core 中不 ...
LINQ的恶搞…… -
txm119161336:
allocatestlye1 顺序为 // Fields o ...
最近做的两次Java/JVM分享的概要
听汉公的说明,看来LittleWitch所使用的FFD System在ver4之后解起来就有点麻烦。游戏里的资源归档文件里虽然还是有文件列表,但并没有保存原始的文件名而只是保存了文件名的MD5。这使得解出文件有困难,如果事先不知道想要解的文件的名字,即使把内容能解出来,其文件名也让人不知所云。
但总有办法的。在System.dat里有些定义界面元素用的*.def文件。例如这样:
Music.def
这些列表能提供足够信息解出相当多的资源,例如说背景音乐、CG等。但有些重要的资源文件名却不在*.def里,像是我们关心的脚本文件。
前一篇里介绍了如何将Quartett!的二进制脚本转变回到一般可读的形式,这里就稍微说明一下我是如何从解出来的脚本中得到一份脚本里引用过的文件列表。
从前一篇的分析可以知道,token类型为0x83的是字符串token。在FFD脚本里,好几种内容都可能会是字符串类型:1、剧情文本;2、一般参数,如图像渐变的模式"Fade",图像的形状"Rect"之类;3、资源文件路径;等等。不进行文法分析的话,没有办法准确判断这些字符串中到底哪些代表资源文件的路径。但有些偷懒的方式可以试试。
我浏览了一下Quartett!的脚本,假定其引用的资源文件路径中必然有分隔符“.”。但是有一些剧情文本里也有“.”,为了尽量排除掉它们,我写了这样的判断方法:
将前一篇里提到的“反编译器”稍微修改了一下,让它收集所有脚本中满足上面的判断的token,并输出到一个单一的文本文件中。
于是得到了类似这样的一个文件:
(片段)
使用UltraEdit打开该文件,并使用文件->排序->高级排序/选项。选择“升序”和“删除重复”,并开始排序。对这里的例子排序的话,结果是:
可以看到,如果有重复的资源文本,它们已经被UltraEdit清除掉了。而且有一些我们所不关心的内容也堆在了一起,可以方便的选取并删除。
这里我们对FONT和TYPE标签都没兴趣,但在实际删除它们之前,留意到有些行里有IMG标签,里面有我们感兴趣的src属性指向的是资源文件,得留下。这部分我是自己做了苦力,在UltraEdit里逐个搜索<IMG src并将与其在同一行上的非文件路径内容都删除掉。再做一个排序,确认所有IMG标签都处理好了,然后把FONT、TYPE等标签,以及排在后面的纯剧情文本都删除掉。
经过处理,提取出来的记录里就只剩下这样的内容了:
我把这样的文件列表给了汉公,但之后又得到了新的要求:要把这个列表按归档文件拆分开来。
这是件简单的事。首先得知道路径上什么是归档的文件名,什么是归档里内容的文件名。通过分析,发现路径上最后一个/之后的是归档里内容的文件名,而在那之前的都是归档自身的路径。于是写了个简短的程序来对文件列表做二次处理:
split.cs
完事。来看看其中一个分离出来的lst文件长什么样:
Face.lst
嗯,基本上满足要求了。
==========================================================
进一步的精确分析确实需要写出parser来做。我现在肯定是没时间做,不过计划以后做的时候用ANTLR来完成。难点是要设计出一个精确的上下文无关文法。到时候再说吧~
但总有办法的。在System.dat里有些定义界面元素用的*.def文件。例如这样:
Music.def
引用
# サウンド定義ファイル
# "条件式", "サウンドファイル名", "サムネイルファイル名", "見出し"
"1" ,"m/BGM_01.ogg" , "SAM/music_thumb.bmp", "Regret"
"1" ,"m/BGM_02.ogg" , "SAM/music_thumb.bmp", "夕影"
"1" ,"m/BGM_03.ogg" , "SAM/music_thumb.bmp", "Reminiscene"
"1" ,"m/BGM_04.ogg" , "SAM/music_thumb.bmp", "Introduction"instrument
"1" ,"m/BGM_05.ogg" , "SAM/music_thumb.bmp", "陽春"
"1" ,"m/BGM_06.ogg" , "SAM/music_thumb.bmp", "沙友"
"1" ,"m/BGM_07.ogg" , "SAM/music_thumb.bmp", "透花 op02"
"1" ,"m/BGM_08.ogg" , "SAM/music_thumb.bmp", "透花"
"1" ,"m/BGM_09.ogg" , "SAM/music_thumb.bmp", "エマ op02"
# "条件式", "サウンドファイル名", "サムネイルファイル名", "見出し"
"1" ,"m/BGM_01.ogg" , "SAM/music_thumb.bmp", "Regret"
"1" ,"m/BGM_02.ogg" , "SAM/music_thumb.bmp", "夕影"
"1" ,"m/BGM_03.ogg" , "SAM/music_thumb.bmp", "Reminiscene"
"1" ,"m/BGM_04.ogg" , "SAM/music_thumb.bmp", "Introduction"instrument
"1" ,"m/BGM_05.ogg" , "SAM/music_thumb.bmp", "陽春"
"1" ,"m/BGM_06.ogg" , "SAM/music_thumb.bmp", "沙友"
"1" ,"m/BGM_07.ogg" , "SAM/music_thumb.bmp", "透花 op02"
"1" ,"m/BGM_08.ogg" , "SAM/music_thumb.bmp", "透花"
"1" ,"m/BGM_09.ogg" , "SAM/music_thumb.bmp", "エマ op02"
这些列表能提供足够信息解出相当多的资源,例如说背景音乐、CG等。但有些重要的资源文件名却不在*.def里,像是我们关心的脚本文件。
前一篇里介绍了如何将Quartett!的二进制脚本转变回到一般可读的形式,这里就稍微说明一下我是如何从解出来的脚本中得到一份脚本里引用过的文件列表。
从前一篇的分析可以知道,token类型为0x83的是字符串token。在FFD脚本里,好几种内容都可能会是字符串类型:1、剧情文本;2、一般参数,如图像渐变的模式"Fade",图像的形状"Rect"之类;3、资源文件路径;等等。不进行文法分析的话,没有办法准确判断这些字符串中到底哪些代表资源文件的路径。但有些偷懒的方式可以试试。
我浏览了一下Quartett!的脚本,假定其引用的资源文件路径中必然有分隔符“.”。但是有一些剧情文本里也有“.”,为了尽量排除掉它们,我写了这样的判断方法:
static bool Match( string tokenString ) { return ( tokenString.Contains( "." ) && !tokenString.Contains( "..." ) && !tokenString.Contains( ">.." ) && !tokenString.Contains( ",.." ) && !tokenString.Contains( "..<" ) && !tokenString.Contains( "\u3000.." ) ) || tokenString.Contains( "<IMG" ); }
将前一篇里提到的“反编译器”稍微修改了一下,让它收集所有脚本中满足上面的判断的token,并输出到一个单一的文本文件中。
于是得到了类似这样的一个文件:
(片段)
../ Script/BaseInstruction.txt Back/Lesson01.bmp <FONT size=18 face='G'>フィル君.<BR>まだ<TYPE interval=500 speed=500 style='Spring'>~ I/100221/0221-#03b-02-2.bmp BGM/B02_Juni.ogg I/100221/0221-#03b-02-3.bmp I/100221/0221-#03b-02-4.bmp I/100221/0221-#03b-03-1.bmp Face/Juni11R.png <TYPE interval=55 style='Fade'>なっ ..なんて<BR>わかりやすい<BR>ゴマカシを・・・・・・ <TYPE style='Fade'><IMG src='Em/Ase18.png'>
使用UltraEdit打开该文件,并使用文件->排序->高级排序/选项。选择“升序”和“删除重复”,并开始排序。对这里的例子排序的话,结果是:
../ <FONT size=18 face='G'>フィル君.<BR>まだ<TYPE interval=500 speed=500 style='Spring'>~ <TYPE interval=55 style='Fade'>なっ ..なんて<BR>わかりやすい<BR>ゴマカシを・・・・・・ <TYPE style='Fade'><IMG src='Em/Ase18.png'> BGM/B02_Juni.ogg Back/Lesson01.bmp Face/Juni11R.png I/100221/0221-#03b-02-2.bmp I/100221/0221-#03b-02-3.bmp I/100221/0221-#03b-02-4.bmp I/100221/0221-#03b-03-1.bmp Script/BaseInstruction.txt
可以看到,如果有重复的资源文本,它们已经被UltraEdit清除掉了。而且有一些我们所不关心的内容也堆在了一起,可以方便的选取并删除。
这里我们对FONT和TYPE标签都没兴趣,但在实际删除它们之前,留意到有些行里有IMG标签,里面有我们感兴趣的src属性指向的是资源文件,得留下。这部分我是自己做了苦力,在UltraEdit里逐个搜索<IMG src并将与其在同一行上的非文件路径内容都删除掉。再做一个排序,确认所有IMG标签都处理好了,然后把FONT、TYPE等标签,以及排在后面的纯剧情文本都删除掉。
经过处理,提取出来的记录里就只剩下这样的内容了:
BGM/B01_Charlotte.ogg BGM/B02_Juni.ogg BGM/B03_Shuhua.ogg BGM/B04_MyHome.ogg BGM/B05_Serious.ogg BGM/B07_AcademiaMusicae1.ogg BGM/B08_AcademiaMusicae2.ogg BGM/B09_AcademiaMusicae3.ogg BGM/B10a_Bar1.ogg BGM/B10b_Bar2.ogg BGM/B11a_Title.ogg
我把这样的文件列表给了汉公,但之后又得到了新的要求:要把这个列表按归档文件拆分开来。
这是件简单的事。首先得知道路径上什么是归档的文件名,什么是归档里内容的文件名。通过分析,发现路径上最后一个/之后的是归档里内容的文件名,而在那之前的都是归档自身的路径。于是写了个简短的程序来对文件列表做二次处理:
split.cs
// split.cs, 2007/12/21 // by RednaxelaFX /* * Copyright (c) 2007 着作权由RednaxelaFX所有。着作权人保留一切权利。 * * 这份授权条款,在使用者符合以下三条件的情形下,授予使用者使用及再散播本 * 软件包装原始码及二进位可执行形式的权利,无论此包装是否经改作皆然: * * * 对于本软件源代码的再散播,必须保留上述的版权宣告、此三条件表列,以 * 及下述的免责声明。 * * 对于本套件二进位可执行形式的再散播,必须连带以文件以及/或者其他附 * 于散播包装中的媒介方式,重制上述之版权宣告、此三条件表列,以及下述 * 的免责声明。 * * 未获事前取得书面许可,不得使用RednaxelaFX之名称, * 来为本软件之衍生物做任何表示支持、认可或推广、促销之行为。 * * 免责声明:本软件是由RednaxelaFX以现状("as is")提供, * 本软件包装不负任何明示或默示之担保责任,包括但不限于就适售性以及特定目 * 的的适用性为默示性担保。RednaxelaFX无论任何条件、 * 无论成因或任何责任主义、无论此责任为因合约关系、无过失责任主义或因非违 * 约之侵权(包括过失或其他原因等)而起,对于任何因使用本软件包装所产生的 * 任何直接性、间接性、偶发性、特殊性、惩罚性或任何结果的损害(包括但不限 * 于替代商品或劳务之购用、使用损失、资料损失、利益损失、业务中断等等), * 不负任何责任,即在该种使用已获事前告知可能会造成此类损害的情形下亦然。 */ using System; using System.Collections.Generic; using System.IO; using System.Text; sealed class Splitter { static void Main( string[ ] args ) { if ( !File.Exists( args[ 0 ] ) ) return; string infilelist = args[ 0 ]; // get the file names and sort them out by the archive they belong to // paths that doesn't seem to be in an archive are ignored Dictionary<string, List<string>> dic = new Dictionary<string, List<string>>( ); using ( StreamReader reader = new StreamReader( File.OpenRead( infilelist ), Encoding.GetEncoding( "utf-16le" ), true ) ) { string line = null; while ( ( line = reader.ReadLine( ) ) != null ) { int seperateIndex = line.LastIndexOf( "/" ); if ( -1 == seperateIndex ) continue; string path = line.Substring( 0, seperateIndex ); string filename = line.Substring( seperateIndex + 1 ); if ( dic.ContainsKey( path ) ) { List<string> list = dic[ path ]; list.Add( filename ); } else { List<string> list = new List<string>( ); list.Add( filename ); dic.Add( path, list ); } } // while } // using // write the file lists out foreach ( string path in dic.Keys ) { int seperateIndex = path.LastIndexOf( "/" ); if ( -1 != seperateIndex ) { Directory.CreateDirectory( path.Substring( 0, seperateIndex ) ); } using ( StreamWriter writer = new StreamWriter( File.Create( path + ".lst" ), Encoding.GetEncoding( 932 ) ) ) { foreach( string filename in dic[ path ] ) { writer.WriteLine( filename ); } // foreach } // using } // foreach } }
完事。来看看其中一个分离出来的lst文件长什么样:
Face.lst
Char01L.png Char04L.png Char04R.png Char15L.png Gise12R.png Gise17R.png Hans03L.png Hans03R.png Juni05R.png Juni10L.png Juni10R.png Juni11R.png Lina02L.png Lina06L.png Lina06R.png May15L.png May16R.png Phil00L.png Phil00R.png Phil02L.png Phil02R.png Phil03L.png Phil03R.png Phil04L.png Phil04R.png Phil05R.png Phil07L.png Phil07R.png Phil12L.png Shuh00R.png Shuh11R.png Sign09R.png Sign10R.png
嗯,基本上满足要求了。
==========================================================
进一步的精确分析确实需要写出parser来做。我现在肯定是没时间做,不过计划以后做的时候用ANTLR来完成。难点是要设计出一个精确的上下文无关文法。到时候再说吧~
发表评论
-
IDA Pro Free笔记
2013-05-19 08:59 0IDA把数据都存哪里了? Windows 7 D:\tem ... -
加密算法收集
2011-01-23 16:10 0加密算法,OTP http://en.wikipedia.or ... -
BattleMoonWars 归档解压/压缩程序(砍掉重炼版)
2010-05-03 21:40 2286以前写过BattleMoonWars的 ... -
Quartett!文本插入程序
2008-06-21 20:38 1577年初写的Quartett!的文本 ... -
BattleMoonWars 归档解压/压缩程序 (Java)
2008-04-08 16:44 2464呼,这个也是一年多之 ... -
ケータイ少女 script.arc的解压缩程序 (Java)
2008-04-08 14:02 4661嗯,这个也是快一年前写的了。当时在澄空看到有人想要解手机少女的 ... -
桃華月憚体験版的解压缩程序 (Java)
2008-04-08 13:38 3120这是差不多一年前写的程序了……有人说想看于是发出来。 当时也是 ... -
Quartett!的文本提取程序
2008-03-05 23:31 1885诶,之前写了这个程序 ... -
Fortune Arterial Tools
2008-02-28 13:34 2450using System; using System.IO; ... -
さくらシュトラッセ literal record
2008-01-28 14:53 1818脚本在scenario.sc里。无 ... -
Borland的库的一个小特征?
2008-01-06 00:22 2512最近弄了下KAMIPANI相关 ... -
[脚本分析] Quartett!的二进制脚本分析
2007-12-20 22:17 3330我前两天在NetOA方面确 ...
相关推荐
"Quartett!文本插入程序"是一个用于在特定文件中插入文本的工具,它主要处理tkn格式的文件。这个程序可能对程序员或系统管理员非常有用,因为它允许他们自动化一些文本处理任务,例如批量添加注释、修改配置文件或者...
此外,项目的版本控制可能采用了Git,这可以从"quartett-app-master"这个文件名推断出来,"master"通常指的是Git仓库中的主分支,意味着这是项目的主要代码版本。 开发者可能还使用了Maven或Gradle作为构建工具,...
MATLAB数字滤波器设计及其在语音信号去噪中的应用:源码详解与报告分享,MATLAB 数字滤波器设计 及其语音信号去噪应用。 (供学习交流)带源码,带注释。 有代码和报告。 ,核心关键词:MATLAB; 数字滤波器设计; 语音信号去噪应用; 源码; 注释; 代码与报告。,"MATLAB数字滤波器设计及其在语音信号去噪中的应用:带源码注释与报告"
COMSOL软件模拟三维电化学腐蚀过程的研究分析,comsol三维电化学腐蚀。 ,核心关键词:Comsol;三维电化学;腐蚀;模型模拟;电化学腐蚀过程。,"Comsol模拟:三维电化学腐蚀过程解析"
基于COMSOL的降雨入渗模型:边坡与渗流边界下的强度折减塑性形变研究,comsol降雨入渗模型,边坡降雨边界与渗流边界 强度折减塑性形变 ,comsol降雨入渗模型; 降雨边界; 渗流边界; 强度折减; 塑性形变,"COMSOL降雨入渗模型:边坡渗流与强度折减塑性形变分析"
2025员工安全意识培训试题及答案.docx
Python自动化办公源码-06在Word表格中将上下行相同内容的单元格自动合并
基于深度学习的神经网络技术在信息通信领域的应用研究.pdf
1.内容概要 通过KNN实现鸢尾花分类,即将新的数据点分配给已知类别中的某一类。该算法的核心思想是通过比较距离来确定最近邻的数据点,然后利用这些邻居的类别信息来决定待分类数据点的类别。 2.KNN算法的伪代码 对未知类别属性的数据集中的每个点依次执行以下操作: (1)计算已知类别数据集中的点与当前点之间的距离; (2)按照距离递增次序排序; (3)选取与当前点距离最小的k个点; (4)确定前k个点所在类别的出现频率; (5)返回前k个点出现频率最高的类别作为当前点的预测分类。 3.数据集说明 代码使用`pandas`库加载了一个名为`iris.arff.csv`的数据集 4.学习到的知识 通过鸢尾花分类学习了KNN算法,选择样本数据集中前k个最相似的数据,就是KNN算法中k的出处。k值过大,会出现分类结果模糊的情况;k值较小,那么预测的标签比较容易受到样本的影响。在实验过程中,不同的k值也会导致分类器的错误率不同。KNN算法精度高、无数据输入的假定,可以免去训练过程。但是对于数据量较多的训练样本,KNN必须保存全部数据集,可能会存在计算的时间复杂度、空间复杂度高的情况,存在维数灾难问
感应电机控制与矢量控制仿真:磁链闭环、转速闭环与电流闭环的综合应用研究,感应电机控制仿真,矢量控制,异步电机仿真,磁链闭环,转速闭环,电流闭环 ,核心关键词:感应电机控制仿真; 矢量控制; 异步电机仿真; 磁链闭环; 转速闭环; 电流闭环,"感应电机矢量控制仿真:磁链、转速、电流三闭环异步电机模拟"
威纶通TK6071IP触摸屏锁屏宏指令程序详解:注释清晰,便于理解与学习,威纶通触摸屏锁屏宏指令程序 ~ 威纶通触摸屏锁屏宏指令程序,TK6071IP触摸屏 利用宏指令程序来控制,宏指令注释清晰,方便理解程序。 具有很好的学习意义和借鉴价值。 ,关键词:威纶通触摸屏;锁屏宏指令程序;TK6071IP触摸屏;宏指令控制;注释清晰;学习借鉴。,威纶通触摸屏宏指令程序:清晰注释,学习借鉴之利器
2025输血相关法律法规试题考核试题及答案.docx
Python游戏编程源码-2048小游戏
2025最新康复医学概论考试题库(含答案).doc
Python自动化办公源码-09用Python批量往Word文档中指定位置添加图片
高品质车载充电器技术解决方案:含原理图、PCB图、C源代码及DSP控制器资料,附赠CDCDC模块资料,车载充电器 3Kw OBC 车载充电器 含原理图、PCB图、C源代码、变压器参数等生产资料。 附赠15kwdcdc模块资料 1、这款产品的方案采用的是dsp2803x系列。 2、原理图和Pcb采用AD绘制。 此方案仅供学习 ,车载充电器; 3Kw OBC; 原理图; PCB图; C源代码; 变压器参数; 生产资料; dsp2803x系列; AD绘制; 15kwdcdc模块资料,3Kw车载充电器方案:DSP2803x系列原理图、PCB图及C源学习包
2025最新康复医学考试题及答案.docx
内容概要:本文介绍了一种用于视频处理的新型卷积神经网络(CNN)加速器。主要创新点在于引入了混合精度计算、跨帧数据重用控制器及引擎,以及混合位宽差帧数据编码解码器。这些特性有效解决了视频帧间的时空相关性和稀疏性带来的挑战,提高了处理速度并降低了功耗和带宽需求。具体来说,通过对连续帧的数据相似度利用,可以在保持高精度的同时减少计算量和内存访问次数;通过多类型稀疏卷积聚类数组实现了对现代稀疏神经网络的支持;并通过混合位宽度编码减少了离芯片外的数据传输量,最高达到68%。 适用人群:从事深度学习硬件加速设计的研究人员和技术爱好者;关注AI边缘计算领域的从业者。 使用场景及目标:适用于自动驾驶汽车摄像头、监控系统等实时视频流应用场景。旨在为开发者提供高效的低能耗解决方案,在有限的时间和资源下完成大量的图像信号处理任务,如跟踪、分类等。 其他说明:文中还详细描述了芯片的设计细节,测试平台构建,以及不同模型(如MobileNet)在网络上的实际性能表现。
COMSOL电化学喷射腐蚀模拟与解析:技术原理及应用实践,comsol电化学喷射腐蚀 ,核心关键词:comsol; 电化学; 喷射腐蚀; 电化学腐蚀。,"电化学喷射腐蚀研究:comsol模拟与解析"
项目已获导师指导并通过的高分毕业设计项目,可作为课程设计和期末大作业,下载即用无需修改,项目完整确保可以运行。 包含:项目源码、数据库脚本、软件工具等,该项目可以作为毕设、课程设计使用,前后端代码都在里面。 该系统功能完善、界面美观、操作简单、功能齐全、管理便捷,具有很高的实际应用价值。 项目都经过严格调试,确保可以运行!可以放心下载 技术组成 语言:java 开发环境:idea 数据库:MySql8.0 部署环境:Tomcat(建议用 7.x 或者 8.x 版本),maven 数据库工具:navicat