`
RednaxelaFX
  • 浏览: 3048094 次
  • 性别: Icon_minigender_1
  • 来自: 海外
社区版块
存档分类
最新评论

将Comiket物的文件名格式统一化的脚本(F#版)

    博客分类:
  • F#
阅读更多
在前一篇日志,将Comiket物的文件名格式统一化的脚本,有这样的回复:
CloudiDust 写道
好想法……去用Groovy或者F#写一个……
其实我没有收Comiket物的习惯啊似乎……我真是没有娱乐的人啊……(望天)


既然Ruby的简单版和C#的版本都写了,写个F#版来对比一下也不错。
下面的程序逻辑基本上与前一篇的C#版类似,只是在如何抽取出文件名中的各部分的实现用了不同的划分方式:C#版的TryGetRenameName()方法更倾向于直接支持不同的pattern和format;F#版则是直接把pattern和format硬编码到parseFilename和getReformattedFilename函数里了。到底该怎么划分好我也不太肯定,不过在这么小的程序里划分方式好不好体现不出来,或许也不值得多想吧?

ReformatComiketFilenames.fsx
#light

open System
open System.IO
open System.Text.RegularExpressions

let parseFilename name =
  let result = Regex.Match(name, @"^\(([^)]+)\)\s*\(([^)]+)\)\s*\[([^\]]+)\]\s*(.+)$")
  let success = result.Success
  let comiketNum = result.Groups.Item(1).Value
  let contentType = result.Groups.Item(2).Value
  let circleName = result.Groups.Item(3).Value
  let itemName = result.Groups.Item(4).Value
  success, comiketNum, contentType, circleName, itemName

let getReformattedFilename name =
  let success, comiketNum, contentType, circleName, itemName = parseFilename name
  if success then
    sprintf "(%s)(%s)[%s] %s" comiketNum contentType circleName itemName
  else name

let reformatAndRenameDir (dirInfo : DirectoryInfo) =
  let name = dirInfo.Name
  let destName = getReformattedFilename name
  if name <> destName then
    printfn "%s" destName
    dirInfo.MoveTo(Path.Combine(dirInfo.Parent.FullName, destName))
    true
  else false

let reformatAndRenameFile (fileInfo : FileInfo) =
  let name = fileInfo.Name
  let destName = getReformattedFilename name
  if name <> destName then
    printfn "%s" destName
    fileInfo.MoveTo(Path.Combine(fileInfo.DirectoryName, destName))
    true
  else false

let getRootDir = fun () ->
#if COMPILED
  let args = Environment.GetCommandLineArgs ()
#else
  let args = fsi.CommandLineArgs
#endif
  let rootPath =
    match args with
    | [| _ |] -> new DirectoryInfo(Environment.CurrentDirectory);
    | _ -> new DirectoryInfo(args.[1])
  rootPath

let main = fun () ->
  let root = getRootDir ()
  Array.iter (fun dir -> (reformatAndRenameDir dir; ())) (root.GetDirectories())
  Array.iter (fun file -> (reformatAndRenameFile file; ())) (root.GetFiles())

main ()


F#的类型推导对.NET类型的支持还不是很好。let绑定的话,总是能从等号右手边的表达式判断出类型,这跟C#的var的实现其实是相似的。问题主要是函数的参数类型的推导。C#也有方法参数的类型推导问题(特别是在使用lambda表达式的时候),但C#的类型推导相对ML的弱很多。F#对内置类型能做比较好的推导,主要是因为内置类型的信息比较容易获取吧?.NET类型要用同样的推导方式太难实现了。
例如说看到
let succ x = x + 1

的时候,因为F#/OCaml默认+的的参数是int,所以很容易推导出x的类型是int,返回值类型也是int,于是succ的类型就是int -> int。
但如果是一个.NET类型:
let printName (fileInfo : FileInfo) =
  printfn "%s" fileInfo.Name

光凭fileInfo.Name这个属性访问,不足以提供fileInfo的类型信息。.NET类型不支持结构等价,结构相同的两个类在是不会被认为是同一个类型的:
class Foo { public string Name { get; set; } }
class Bar { public string Name { get; set; } }

这样的Foo与Bar虽然结构相同,但类型并不相等价。所以很明显,只有一个属性访问为条件,只能告诉F#的类型推导器“哪些类型肯定不满足条件”,却很难说明“哪个类型就是我们要找的类型”。F#的小组似乎在改进F#的类型推导器来改善对.NET类型的支持,不知道他们是怎么做的呢。

话说上面的代码里有这么一小段:
Array.iter (fun dir -> (reformatAndRenameDir dir; ())) (root.GetDirectories())

这里的括号其实挺无奈的……
我本来是想reformatAndRename*这两个函数应该返回些什么值,假如调用方想知道到底有没有做重命名,应该有办法知道。但最后我调用这两个函数的时候没有用到它们的返回值。Array.iter(和List.iter等)函数却对此不高兴了,非要第一个参数返回unit类型而不能是其它类型。所以这里的匿名函数只能写成(fun dir -> (reformatAndRenameDir dir; ()))了。写成这样能正确运行,不过F#的解释器会扔出一个警告说前一个子表达式应该返回unit类型而这里返回的是bool类型。嘛,警告就警告,不管了……

不过后来发觉括号多是我自己的问题而不是F#的问题……T T
这样写就好了:
Array.iter (fun dir -> reformatAndRenameDir dir |> ignore) (root.GetDirectories())

其中ignore是标准库里的函数,内容跟CloudiDust提到的fun x -> ()是一样的。
1
0
分享到:
评论
4 楼 CloudiDust 2009-01-08  
话说暂时也没想到更好的方法……这个不单和语言的风格有关,和API的风格也是有关系的吧。
3 楼 RednaxelaFX 2009-01-08  
CloudiDust 写道
那个警告可以用一个“只进不出”的函数处理掉……

是可以用pipeline operator消掉,但挺没意义的……反正我知道这里我就是要忽略掉那个值,就让它警告呗。这种地方我没洁癖 =v=

hmm,要是在reformatAndRenameDir里再调用reformatAndRename*的话就是要实现递归的重命名了,不过我原本就只想重命名一层而已,所以没这么写。

.NET把Directory和File分隔开有时候很方便,但这里用起来就很罗嗦(可恶啊……
Ruby里明明一句File.rename就大功告成了 T T

还有什么更简洁的方式来实现这个功能么,用F#的话?
照我这么写那是挺overkill的……
2 楼 CloudiDust 2009-01-08  
……晕~把File和Directory写混了……

话说.Net里FileInfo和DirectoryInfo有这么多共同的方法为什么没有提升到基类里去……
1 楼 CloudiDust 2009-01-08  
谢谢。 xD

那个警告可以用一个“只进不出”的函数处理掉……(Haskell不是老干这种事情么 = =+)

Array.iter (fun dir -> (reformatAndRenameDir dir |> (fun x -> ())))(root.GetDirectories())
 

另外似乎在reformatAndRenameDir函数里面返回前应该调用一下:

reformatAndRenameFile (dirInfo.getDirectories())


用F#确实有些overkill的感觉……

相关推荐

    将Comiket物的文件名格式统一化的脚本

    标题中的“将Comiket物的文件名格式统一化的脚本”指的是一个专门用于整理Comiket(同人志活动)相关文件的程序。Comiket是日本最大的同人文化盛会,参与者会发布大量自制的漫画、音乐和其他作品。由于众多创作者...

    Doujin-Release-Tracker:已弃用

    我还想尝试引入一个管理区域,以更好的方式添加发行版,也许用户支持将发行版标记(甚至添加)作为最终游戏。 我想做的另一件事是确保其背后有一个不错的API,如果任何人想要访问数据,任何人都可以使用。原料药...

    Search Extension For Comike Web Catalog-crx插件

    函数中添加右键单击菜单以搜索在浏览器上选择的字符串Comiket Web目录它是一个扩展名。 圆形名称,yomigana和作者姓名是针对性的。 如果有1个搜索结果,请自动移动到圆圈详细信息页面。 Comiket Web目录帐户并登录是...

    2000-2021年中国科技统计年鉴(分省年度)面板数据集-最新更新.zip

    2000-2021年中国科技统计年鉴(分省年度)面板数据集-最新更新.zip

    PPT保护工具PDFeditor专业版-精心整理.zip

    PPT保护工具PDFeditor专业版-精心整理.zip

    Spring Boot Docker 项目:含项目构建、镜像创建、应用部署及相关配置文件,容器化部署.zip

    1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。

    考研英语真题及详解-精心整理.zip

    考研英语真题及详解-精心整理.zip

    Jupyter_AI 人工智慧開發入門.zip

    Jupyter-Notebook

    全国电子地图行政区划道路水系数据-最新shp.zip

    全国电子地图行政区划道路水系数据-最新shp.zip

    Spring Cloud Function RCE 漏洞的 POC 项目,含漏洞利用及相关测试内容.zip

    1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。

    地级市进出口贸易及外资利用数据(297城)-最新.zip

    地级市进出口贸易及外资利用数据(297城)-最新.zip

    HengCe-18900-2024-2030中国皮革制品市场现状研究分析与发展前景预测报告-样本.docx

    HengCe-18900-2024-2030中国皮革制品市场现状研究分析与发展前景预测报告-样本.docx

    java制作的小游戏,作为巩固java知识之用.zip

    猪脚饭超好吃 java制作的小游戏,作为巩固java知识之用.zip

    基于python的大麦网自动抢票工具的设计与实现(1) - 副本.zip

    【基于Python的大麦网自动抢票工具的设计与实现】 随着互联网技术的发展,网络购票已经成为人们生活中不可或缺的一部分。尤其是在文化娱乐领域,如音乐会、演唱会、戏剧等活动中,热门演出的门票往往在开售后瞬间就被抢购一空。为了解决这个问题,本论文探讨了一种基于Python的自动抢票工具的设计与实现,旨在提高购票的成功率,减轻用户手动抢票的压力。 Python作为一种高级编程语言,因其简洁明了的语法和丰富的第三方库,成为了开发自动化工具的理想选择。Python的特性使得开发过程高效且易于维护。本论文深入介绍了Python语言的基础知识,包括数据类型、控制结构、函数以及模块化编程思想,这些都是构建抢票工具的基础。 自动化工具在现代社会中广泛应用,尤其在网络爬虫、自动化测试等领域。在抢票工具的设计中,主要利用了自动化工具的模拟用户行为、数据解析和定时任务等功能。本论文详细阐述了如何使用Python中的Selenium库来模拟浏览器操作,通过识别网页元素、触发事件,实现对大麦网购票流程的自动化控制。同时,还讨论了BeautifulSoup和requests库在抓取和解析网页数据中的应用。 大麦网作为国内知名的票务平台,其网站结构和购票流程对于抢票工具的实现至关重要。论文中介绍了大麦网的基本情况,包括其业务模式、用户界面特点以及购票流程,为工具的设计提供了实际背景。 在系统需求分析部分,功能需求主要集中在自动登录、监控余票、自动下单和异常处理等方面。抢票工具需要能够自动填充用户信息,实时监控目标演出的票务状态,并在有票时立即下单。此外,为了应对可能出现的网络延迟或服务器错误,工具还需要具备一定的错误恢复能力。性能需求则关注工具的响应速度和稳定性,要求在大量用户同时使用时仍能保持高效运行。 在系统设计阶段,论文详细描述了整体架构,包括前端用户界面、后端逻辑处理以及与大麦网交互的部分。在实现过程中,采用了多线程技术以提高并发性,确保在抢票关键环节的快速响应。此外,还引入了异常处理机制,以应对网络故障或程序错误。 测试与优化是确保抢票工具质量的关键步骤。论文中提到了不同场景下的测试策略,如压力测试、功能测试和性能测试,以验证工具的有效性和稳定性。同时,通过对抢票算法的不断优化,提高工具的成功率。 论文讨论了该工具可能带来的社会影响,包括对消费者体验的改善、对黄牛现象的抑制以及可能引发的公平性问题。此外,还提出了未来的研究方向,如增加多平台支持、优化抢票策略以及考虑云服务的集成,以进一步提升抢票工具的实用性。 本论文全面介绍了基于Python的大麦网自动抢票工具的设计与实现,从理论到实践,从需求分析到系统优化,为读者提供了一个完整的开发案例,对于学习Python编程、自动化工具设计以及理解网络购票市场的运作具有重要的参考价值。

    校园驿站全天候辅助取货管理系统 SSM毕业设计 附带论文.zip

    校园驿站全天候辅助取货管理系统 SSM毕业设计 附带论文 启动教程:https://www.bilibili.com/video/BV1GK1iYyE2B

    1970年至2010年美国所有乳制品的供应和利用情况

    1970年至2010年美国所有乳制品的供应和利用情况

    java-leetcode题解之Possible Bipartition.java

    java基础 java_leetcode题解之Possible Bipartition.java

    基于Java开发的阿里巴巴数据库事业部druid连接池设计源码

    该开源项目为阿里巴巴数据库事业部精心打造的druid连接池设计源码,包含4689个文件,涵盖4069个Java源文件、297个SQL脚本、102个文本文件以及其他多种文件类型。druid连接池以其独特的监控功能,旨在为数据库连接管理提供高效、可靠的解决方案。项目文件类型丰富,包括HTML、JavaScript、CSS和Shell脚本等,适用于多种开发需求。

    Jupyter_一个不会自学的人是没有前途的.zip

    Jupyter-Notebook

    金融风险管理计算手册(CoVaR)最新版.zip

    金融风险管理计算手册(CoVaR)最新版.zip

Global site tag (gtag.js) - Google Analytics