`
RednaxelaFX
  • 浏览: 3047934 次
  • 性别: Icon_minigender_1
  • 来自: 海外
社区版块
存档分类
最新评论

Quartett!的文本提取程序

阅读更多
诶,之前写了这个程序却没有发出来,结果自己差点找不到了。幸好在笔记本的某个不起眼的角落里又见到了它啊 T T

这个程序用于从*.tkn脚本文件中提取“文本”(text=之后的项)。对应的ScriptInserter那时没写……

提取出来的文本像这样:
引用
135
<FONT size=22 face='G'><TYPE interval=100% speed=700 style='Wave'>心配だな~
167
<TYPE interval=60>お兄ちゃん<BR>...<TYPE interval=55>ほんとに大丈夫なの?
170
<FONT size=16><TYPE interval=60>今日のクリスマス・ミサには...<BR>毎年..たくさんの人が来るんだよ


一行原始行号,一行文本。行号是用于校验用的。

ScriptExtractor.cs
// ScriptExtracter.cs, 2008/01/13
// by RednaxelaFX

/*
 * Copyright (c) 2008 著作权由RednaxelaFX所有。著作权人保留一切权利。
 * 
 * 这份授权条款,在使用者符合以下三条件的情形下,授予使用者使用及再散播本
 * 软件包装原始码及二进位可执行形式的权利,无论此包装是否经改作皆然:
 * 
 * * 对于本软件源代码的再散播,必须保留上述的版权宣告、此三条件表列,以
 *   及下述的免责声明。
 * * 对于本套件二进位可执行形式的再散播,必须连带以文件以及/或者其他附
 *   于散播包装中的媒介方式,重制上述之版权宣告、此三条件表列,以及下述
 *   的免责声明。
 * * 未获事前取得书面许可,不得使用RednaxelaFX之名称,
 *   来为本软件之衍生物做任何表示支持、认可或推广、促销之行为。
 * 
 * 免责声明:本软件是由RednaxelaFX以现状("as is")提供,
 * 本软件包装不负任何明示或默示之担保责任,包括但不限于就适售性以及特定目
 * 的的适用性为默示性担保。RednaxelaFX无论任何条件、
 * 无论成因或任何责任主义、无论此责任为因合约关系、无过失责任主义或因非违
 * 约之侵权(包括过失或其他原因等)而起,对于任何因使用本软件包装所产生的
 * 任何直接性、间接性、偶发性、特殊性、惩罚性或任何结果的损害(包括但不限
 * 于替代商品或劳务之购用、使用损失、资料损失、利益损失、业务中断等等),
 * 不负任何责任,即在该种使用已获事前告知可能会造成此类损害的情形下亦然。
 */

using System;
using System.Collections.Generic;
using System.IO;
using System.Text;

namespace FFDSystemAnalysis
{
    enum TokenType
    {
        Decimal = 0x080,
        Identifier = 0x081,
        Hexadecimal = 0x082,
        String = 0x083,
        Operator = 0x085
    }
    
    enum OutputState
    {
    	Searching,
    	FoundText,
    	FoundEqual
    }

    sealed class ScriptExtractor
    {
        private static readonly byte[ ] SIGNATURE = {
		    ( byte )0x54, ( byte )0x4F, ( byte )0x4B, ( byte )0x45,
		    ( byte )0x4E, ( byte )0x53, ( byte )0x45, ( byte )0x54,
		    ( byte )0x64, ( byte )0x0,  ( byte )0x0,  ( byte )0x0
        };

        static void Main( string[ ] args ) {
            if ( !args[ 0 ].EndsWith( ".tkn" ) ) return;
            if ( !File.Exists( args[ 0 ] ) ) return;

            string infile = args[ 0 ];
            string outfile = Path.GetFileNameWithoutExtension( infile ) + ".txt";

            Encoding utf16le = new UnicodeEncoding( false, true );
            Encoding jis = Encoding.GetEncoding( 932 );

            using ( BinaryReader reader = new BinaryReader( File.OpenRead( infile ), jis ) ) {
                using ( BinaryWriter writer = new BinaryWriter( File.Create( outfile ), utf16le ) ) {
                    byte[ ] sig = reader.ReadBytes( SIGNATURE.Length );
                    if ( !Equals( sig, SIGNATURE ) ) {
                        Console.WriteLine( "Wrong signature" );
                        return;
                    }

                    // write UTF-16LE BOM
                    writer.Write( ( ushort ) 0xFEFF );

                    // process each token
                    int lineNum = 1;
                    TokenType tokenType = TokenType.Operator;
                    OutputState state = OutputState.Searching;
                    int tokenCount = reader.ReadInt32( );
                    for ( int tokenNum = 0; tokenNum < tokenCount; ++tokenNum ) {
                        // get line numbers
                        lineNum = reader.ReadInt32( );

                        // get token tokenType
                        tokenType = ( TokenType ) ( reader.ReadByte( ) & 0x0FF );

                        // get token value
                        string tokenString = ReadCString( reader );

                        switch ( tokenType ) {
                        
                        case TokenType.Identifier:
                            if ( tokenString.Equals("text") ) {
                            	state = OutputState.FoundText;
                            } else {
                            	state = OutputState.Searching;
                            }
                            break;

                        case TokenType.String:
                            if (OutputState.FoundEqual == state)
                            {
                            	writer.Write( utf16le.GetBytes( lineNum.ToString( ) ) );
                            	writer.Write( utf16le.GetBytes( Environment.NewLine ) );
                            	writer.Write( utf16le.GetBytes( tokenString ) );
                            	writer.Write( utf16le.GetBytes( Environment.NewLine ) );
                            	state = OutputState.Searching;
                            }
                            break;

                        case TokenType.Operator:
                            if ((OutputState.FoundText == state)
                                && tokenString.Equals("=")) {
                            	state = OutputState.FoundEqual;
                            } else {
                            	state = OutputState.Searching;
                            }
                            break;
                        
                        case TokenType.Decimal:
                        case TokenType.Hexadecimal:
                            // do nothing
                            break;
                            
                        default:
                            Console.WriteLine( "Unexpected token type {0} at 0x{1}.",
                                tokenType.ToString( "X" ),
                                reader.BaseStream.Position.ToString( "X" ) );
                            return;
                        } // switch tokenType
                    } // for
                }
            }
        }

        static bool Equals( byte[ ] a, byte[ ] b ) {
            int len = a.Length;
            if ( len != b.Length ) return false;
            for ( int i = 0; i < len; i++ ) {
                if ( a[ i ] != b[ i ] ) return false;
            }
            return true;
        }

        static string ReadCString( BinaryReader reader ) {
            StringBuilder builder = new StringBuilder( );
            char c = '\0';

            while ( ( c = reader.ReadChar( ) ) != '\0' ) {
                builder.Append( c );
            }

            return builder.ToString( );
        }
    }
}
分享到:
评论

相关推荐

    Quartett!文本插入程序

    "Quartett!文本插入程序"是一个用于在特定文件中插入文本的工具,它主要处理tkn格式的文件。这个程序可能对程序员或系统管理员非常有用,因为它允许他们自动化一些文本处理任务,例如批量添加注释、修改配置文件或者...

    quartett-app

    "quartett-app" 是一个基于Java开发的项目,它是一个响应式的网页游戏,灵感来源于经典的超级Trumpf游戏。这个游戏的特色在于它结合了蒂罗尔地区城市的文化元素,为玩家提供了一种新颖且富有地方特色的卡牌游戏体验...

    地级市GDP及产业结构数据-最新.zip

    地级市GDP及产业结构数据-最新.zip

    2006-2023年上市公司资产误定价Misp数据集(4.9万样本,含原始数据、代码及结果,最新).zip

    2006-2023年上市公司资产误定价Misp数据集(4.9万样本,含原始数据、代码及结果,最新).zip

    Altera和Xilinx FPGA的从串配置模式比较

    本文对两大主流FPGA厂商的从串配置模式(Altera:Passive Serial Mode;Xilinx:Slave Serial Mode)进行了描述,并指出了主要的不同之处。

    Spring Boot 教程源码项目:含多种功能示例.zip

    1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。

    R语言高级建模课程全集-最新整理.zip

    R语言高级建模课程全集-最新整理.zip

    Python绘制三维心形图案的技术方法

    内容概要:本文档展示了使用 Python绘制一个三维爱心的具体方法与步骤。 适用人群:适合对Python编程语言有一定了解,并且希望学习如何完成复杂图像渲染的研究者或开发者。 使用场景及目标:本项目适用于教学环境或是个人兴趣爱好,能够帮助读者更好地掌握三维图形编程技巧以及了解隐函数作图的基本原理。

    2024年下半年软考中级网络工程GRE与IPSEC的联动配置思路文档

    该文档为核心配置实验思路,在实验中有不懂的请参考该思路

    四大政策效应评价方法全集-最新.zip

    四大政策效应评价方法全集-最新.zip

    2024年下半年软考中级网络工程GRE与IPSEC的联动配置

    该实验为核心配置实验,与下一个采用其不同的方法进行配置,其核心思路一样,顺序略有差异,请大家进行对比反复琢磨

    Spring Microservices in Action 第二版代码示例.zip

    1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。

    单基因生物信息学分析视频教程-完整版最新.zip

    单基因生物信息学分析视频教程-完整版最新.zip

    驾驭未来:Simulink中PMSM永磁同步电机控制深度解析

    在现代工业自动化和电动汽车领域,永磁同步电机(PMSM)因其高效率、高性能和紧凑设计而备受青睐。本文将详细介绍如何在Simulink中实现PMSM的控制,包括矢量控制(FOC)策略的实现,以及必要的代码示例,旨在为工程师和研究者提供实用的指导。 一、PMSM控制概述 永磁同步电机(PMSM)以其高功率密度、高效率和优异的动态响应而广泛应用于工业和汽车领域。在Simulink中实现PMSM控制,通常采用矢量控制(Field-Oriented Control, FOC)策略,该策略通过磁场定向控制实现电机转矩和速度的精确控制。 二、PMSM数学模型与Simulink实现 PMSM的数学模型包括电压方程、磁链方程和转矩方程。在Simulink中,我们可以通过构建相应的模块来实现这些方程。 1. PMSM数学模型 电压方程: u d = R s i d − ω e L q i q + L d d i d d t + ω e ψ f u d ​ =Rsid−ω e ​ L q ​ iq+

    2000-2020年中国海洋统计年鉴-最新数据发布.zip

    2000-2020年中国海洋统计年鉴-最新数据发布.zip

    图书《Spring Batch 批处理框架》配套源代码项目.zip

    1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。

    安慰剂检验代码与数据文章-最新研究成果.zip

    安慰剂检验代码与数据文章-最新研究成果.zip

    VB+ACCESS学生公寓管理系统(源代码+系统).rar

    VB+ACCESS学生公寓管理系统(源代码+系统)

    职业规划(1).zip

    职业规划(1).zip

    网络办公系统 SSM毕业设计 附带论文.zip

    网络办公系统 SSM毕业设计 附带论文 启动教程:https://www.bilibili.com/video/BV1GK1iYyE2B

Global site tag (gtag.js) - Google Analytics