`
RednaxelaFX
  • 浏览: 3048110 次
  • 性别: Icon_minigender_1
  • 来自: 海外
社区版块
存档分类
最新评论

将Comiket物的文件名格式统一化的脚本

    博客分类:
  • Ruby
阅读更多
又到了Comiket大潮,抓下来的文件的名字总是格式不统一,按照文件名排序来查看很不方便。于是又到了出动Ruby的时间~
(每次到批量重命名文件的时候我的第一反应就是打开irb……)
这次的脚本在好几个类别的目录下都能用,所以顺便记下来。

脚本作用:将类似"(Cxx)(item_type)[circle_name] item_name"的文件名中开头部分的空格调整到:前缀标签间不包括空格,标签整体与后面的文件名之间留一个空格。普通文件和目录都是重命名的目标。不符合这种带有两组圆括号和一组方括号为前缀标签的文件则不在重命名目标范围内。我一般是用另外的脚本来把顺序都倒到这个顺序上然后再一起抽掉空格。
限制:如果文件名中出现了在当前系统locale下无法显示出来的字符,那么那个文件的重命名会失败;重命名失败不会影响后续循环,失败的文件名会显示到stderr。反正有特殊字符的文件/目录不会很多,暂时就手工修改算了 OTL
Ruby 1.8自身的编码是有点问题,而Ruby 1.9的字符串虽然能用UNICODE,但在执行这种操作的时候似乎还是处理不了。怪哉,可能我没写对还是怎样。回头再试试看。

#!/usr/bin/env ruby

def reformat_comiket_folder(dir='.')
  Dir.entries(dir).each do |p|
    begin
      if p =~ /^\(([^)]+)\)\s*\(([^)]+)\)\s*\[([^\]]+)\]\s*(.+)$/
        File.rename p, "(#{$1})(#{$2})[#{$3}] #{$4}"
      end
    rescue SystemCallError
      $stderr.puts 'IO failed: ' + $!
    end
  end
end

if __FILE__ == $0
  reformat_comiket_folder ARGV[0] || '.'
end


其实用这脚本心里有点痒……又想起之前在写的重命名工具了。找个时间把它写完就好了 T T

========================================================================

当然咯,用C#来写这个程序就不会出现编码问题。采用跟上面相似的逻辑,重写为:

using System;
using System.IO;
using System.Linq;
using System.Text.RegularExpressions;

sealed class ReformatComiketFiles {
    static bool TryGetRenameName(
        Regex pattern,
        string input,
        string format, // format items in this param correspond to match.Groups[1..$]
        out string result ) {

        var match = pattern.Match( input );
        if ( match.Success ) {
            var str = string.Format( format,
                                     match.Groups
                                         .Cast<Group>( )
                                         .Skip( 1 )
                                         .Select( g => g.Value )
                                         .ToArray( ) );
            result = str;
            return str != src; // using a local variable here saves an indirect read
        } else {
            result = input;
            return false;
        }
    }

    static void Main( string[ ] args ) {
        DirectoryInfo root;
        if ( 0 < args.Length ) {
            root = new DirectoryInfo( args[ 0 ] );
        } else {
            root = new DirectoryInfo( Environment.CurrentDirectory );
        }
        var pattern = new Regex( @"^\(([^)]+)\)\s*\(([^)]+)\)\s*\[([^\]]+)\]\s*(.+)$" );

        foreach ( var dir in root.GetDirectories( ) ) {
            string dest = null;
            if ( TryGetRenameName(
                    pattern,
                    dir.Name,
                    "({0})({1})[{2}] {3}",
                    out dest ) ) {
                Console.WriteLine(dest);
                dir.MoveTo( Path.Combine( dir.Parent.FullName, dest ) );
            }
        }

        foreach ( var file in root.GetFiles( ) ) {
            string dest = null;
            if ( TryGetRenameName(
                    pattern,
                    file.Name,
                    "({0})({1})[{2}] {3}",
                    out dest ) ) {
                Console.WriteLine( dest );
                file.MoveTo( Path.Combine( file.DirectoryName, dest ) );
            }
        }
    }
}


试了下,似乎都能行。运行环境是.NET Framework 3.5 SP1。
于是把编译出来的exe发到附件里。有需要的拿~
分享到:
评论
3 楼 RednaxelaFX 2009-01-07  
CloudiDust 写道
好想法……去用Groovy或者F#写一个……

觉得值得对比一下,用F#也写了一个版本:http://rednaxelafx.iteye.com/blog/311741
有兴趣的话讨论一下~~我写F#代码还不是特别顺手……

2 楼 RednaxelaFX 2009-01-07  
CloudiDust 写道
好想法……去用Groovy或者F#写一个……
其实我没有收Comiket物的习惯啊似乎……我真是没有娱乐的人啊……(望天)

呃呵呵,这次已经没有很积极的去收了,但资源不断的涌入这也就收下了 OTL

用Groovy来写这样的脚本是不错,出来的代码跟Ruby的也差不了多少。
但是用F#/OCaml来写我看不出有什么优势,因为整个脚本并没有多少纯计算的,几乎都是需要产生副作用的一些操作。除非不用正则表达式来匹配,但是手工匹配要多写那么多代码,就失去脚本快捷方便的意义了。不过如果有什么我没想到的办法来通过F#完成这功能,我很有兴趣知道~~
1 楼 CloudiDust 2009-01-07  
好想法……去用Groovy或者F#写一个……

其实我没有收Comiket物的习惯啊似乎……我真是没有娱乐的人啊……(望天)

相关推荐

    Doujin-Release-Tracker:已弃用

    同人发布追踪器最初以跟踪我在Comiket上期待的内容的方式开始,但现在... 希望他们将是适当的文档,但是通常端点是: /[comiket, vocamas, m3] -显示我们记录的所有活动的数据,其ID,日期和论坛链接/[comiket, vocama

    Search Extension For Comike Web Catalog-crx插件

    函数中添加右键单击菜单以搜索在浏览器上选择的字符串Comiket Web目录它是一个扩展名。 圆形名称,yomigana和作者姓名是针对性的。 如果有1个搜索结果,请自动移动到圆圈详细信息页面。 Comiket Web目录帐户并登录是...

    2000-2021年中国科技统计年鉴(分省年度)面板数据集-最新更新.zip

    2000-2021年中国科技统计年鉴(分省年度)面板数据集-最新更新.zip

    PPT保护工具PDFeditor专业版-精心整理.zip

    PPT保护工具PDFeditor专业版-精心整理.zip

    Spring Boot Docker 项目:含项目构建、镜像创建、应用部署及相关配置文件,容器化部署.zip

    1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。

    考研英语真题及详解-精心整理.zip

    考研英语真题及详解-精心整理.zip

    Jupyter_AI 人工智慧開發入門.zip

    Jupyter-Notebook

    全国电子地图行政区划道路水系数据-最新shp.zip

    全国电子地图行政区划道路水系数据-最新shp.zip

    Spring Cloud Function RCE 漏洞的 POC 项目,含漏洞利用及相关测试内容.zip

    1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。

    地级市进出口贸易及外资利用数据(297城)-最新.zip

    地级市进出口贸易及外资利用数据(297城)-最新.zip

    HengCe-18900-2024-2030中国皮革制品市场现状研究分析与发展前景预测报告-样本.docx

    HengCe-18900-2024-2030中国皮革制品市场现状研究分析与发展前景预测报告-样本.docx

    java制作的小游戏,作为巩固java知识之用.zip

    猪脚饭超好吃 java制作的小游戏,作为巩固java知识之用.zip

    基于python的大麦网自动抢票工具的设计与实现(1) - 副本.zip

    【基于Python的大麦网自动抢票工具的设计与实现】 随着互联网技术的发展,网络购票已经成为人们生活中不可或缺的一部分。尤其是在文化娱乐领域,如音乐会、演唱会、戏剧等活动中,热门演出的门票往往在开售后瞬间就被抢购一空。为了解决这个问题,本论文探讨了一种基于Python的自动抢票工具的设计与实现,旨在提高购票的成功率,减轻用户手动抢票的压力。 Python作为一种高级编程语言,因其简洁明了的语法和丰富的第三方库,成为了开发自动化工具的理想选择。Python的特性使得开发过程高效且易于维护。本论文深入介绍了Python语言的基础知识,包括数据类型、控制结构、函数以及模块化编程思想,这些都是构建抢票工具的基础。 自动化工具在现代社会中广泛应用,尤其在网络爬虫、自动化测试等领域。在抢票工具的设计中,主要利用了自动化工具的模拟用户行为、数据解析和定时任务等功能。本论文详细阐述了如何使用Python中的Selenium库来模拟浏览器操作,通过识别网页元素、触发事件,实现对大麦网购票流程的自动化控制。同时,还讨论了BeautifulSoup和requests库在抓取和解析网页数据中的应用。 大麦网作为国内知名的票务平台,其网站结构和购票流程对于抢票工具的实现至关重要。论文中介绍了大麦网的基本情况,包括其业务模式、用户界面特点以及购票流程,为工具的设计提供了实际背景。 在系统需求分析部分,功能需求主要集中在自动登录、监控余票、自动下单和异常处理等方面。抢票工具需要能够自动填充用户信息,实时监控目标演出的票务状态,并在有票时立即下单。此外,为了应对可能出现的网络延迟或服务器错误,工具还需要具备一定的错误恢复能力。性能需求则关注工具的响应速度和稳定性,要求在大量用户同时使用时仍能保持高效运行。 在系统设计阶段,论文详细描述了整体架构,包括前端用户界面、后端逻辑处理以及与大麦网交互的部分。在实现过程中,采用了多线程技术以提高并发性,确保在抢票关键环节的快速响应。此外,还引入了异常处理机制,以应对网络故障或程序错误。 测试与优化是确保抢票工具质量的关键步骤。论文中提到了不同场景下的测试策略,如压力测试、功能测试和性能测试,以验证工具的有效性和稳定性。同时,通过对抢票算法的不断优化,提高工具的成功率。 论文讨论了该工具可能带来的社会影响,包括对消费者体验的改善、对黄牛现象的抑制以及可能引发的公平性问题。此外,还提出了未来的研究方向,如增加多平台支持、优化抢票策略以及考虑云服务的集成,以进一步提升抢票工具的实用性。 本论文全面介绍了基于Python的大麦网自动抢票工具的设计与实现,从理论到实践,从需求分析到系统优化,为读者提供了一个完整的开发案例,对于学习Python编程、自动化工具设计以及理解网络购票市场的运作具有重要的参考价值。

    校园驿站全天候辅助取货管理系统 SSM毕业设计 附带论文.zip

    校园驿站全天候辅助取货管理系统 SSM毕业设计 附带论文 启动教程:https://www.bilibili.com/video/BV1GK1iYyE2B

    1970年至2010年美国所有乳制品的供应和利用情况

    1970年至2010年美国所有乳制品的供应和利用情况

    java-leetcode题解之Possible Bipartition.java

    java基础 java_leetcode题解之Possible Bipartition.java

    基于Java开发的阿里巴巴数据库事业部druid连接池设计源码

    该开源项目为阿里巴巴数据库事业部精心打造的druid连接池设计源码,包含4689个文件,涵盖4069个Java源文件、297个SQL脚本、102个文本文件以及其他多种文件类型。druid连接池以其独特的监控功能,旨在为数据库连接管理提供高效、可靠的解决方案。项目文件类型丰富,包括HTML、JavaScript、CSS和Shell脚本等,适用于多种开发需求。

    Jupyter_一个不会自学的人是没有前途的.zip

    Jupyter-Notebook

    金融风险管理计算手册(CoVaR)最新版.zip

    金融风险管理计算手册(CoVaR)最新版.zip

Global site tag (gtag.js) - Google Analytics