先说这名字好长,我也觉得长,只是没办法,本体的名字就有13字之多!上简称吧:嫦三月车征名辅,再简之:嫦车辅...唔...如何?
说正经的,写这个小程序的起因在于自己提交作品时,不知道是否已经有重复的作品,也没地方去检索。而这次活动的官网
腾讯网和
新华网都只提供登录和一览,只能一页一页翻。特别初期每天都上万的新数据,哪里翻得过来,于是自己想搞个检索和统计的辅助程序。这样有一搭没一搭的搞到现在...马上都快到截至日了...我这效率...
最终完成的辅助程序放在GAE上 ——
嫦三月车辅。因为是appspot,请自备云梯。
截至20日的部分统计信息:
其实这篇博文原打算叫“奋斗记”的,实在是有够折腾的。
- GAE数据存储的配额太低了!Datastore Write Operations 0.05 Million Ops,5万次写。我当时收集到的原始数据就13万,根本就不敢想。整理后的数据倒是只有3万,一试之下,毫无悬念的崩!减半,分两次如何?崩!好吧好吧,减到1万,再来过,崩!不高兴再试了!再少也没什么意义。
- 打算转Google Cloud SQL。必须缴费,作罢。
- 转其他Online DB。急切间没有合适的,最终作罢。
于是放弃存储,一切都On The Fly,全部走内存!话说GAE这点不错,内存倒是足够,不崩!且快!哈。除了每次启动后重新上传数据...
再就是数据,真够劲!
★
腾讯网 最初从列表页面取,可以一次多条,效率会高,毕竟有十几万(至10月17日)的数据,但是此路不通。一是没有作者,日期等信息,二是名字过长时用...代替。最终改成从详细页面取,十几万的数据,又不敢开多线程(不能去添乱啊),每次都得6,7个小时...
★
新华网 好些,因为本身就用论坛做的活动页面。加上数据量不大,几万(至10月17日)的数据,每页20楼,半个小时就搞定。但是,新华网的问题是把作者提交的作品和描述等都合并在一处显示,用<br>分割。还自动为每个名称加上“号”字,这处理就比较多余了。因为作者本身就会以“Xx号”命名,于是满眼的”Xxx号号”,我整个人都“号号”了。
★
最后是作品 真够劲!正常是每人限5件作品,名称和描述分开。无论腾讯还是新华都是有输入框的,名称有名称的输入框,描述有描述的输入框。应该说绝大多数作品都是按规矩来的,但还有那许多的作者“勇于打破条条框框”!
- 名称和描述都写在名称里的。
- 多个名称用标点符号或文字分割写在一次提交里的。这是我处理分隔符的正则表达式。
半角空白|全角空白|,|,|》|《|】|【|、|;|/|/|;|:|:|。|(|)|\"|”|“||\\(|\\)|\\*|&|’|‘|[|]|\\d{1}\\.|简称|或(者){0,1}(叫){0,1}
- 上面这些分割符的用途也各不相同,有的是分割多个名字的,有的是标注读音的,有的则是名称描述的...我选择数据量最大的“分割”来处理。
- 然后是后缀。由于设计上打算去除重复的数据,比如“玉兔”和“玉兔号”或“玉兔号月球车”,这些都算做“玉兔”。但是这些个后缀也太“丰富”了。这是我能分辨后缀的正则表达式。
(((?i)no)*(—|-|·|\\.)*(\\d|一|二|三|I|壹|X|1)*(号|號)*(月球|探月|探测)*(车|器)*)*$
(这么看来恐怕官网得上大量人工处理了吧...)
由于能力有限,太多例外,只能做最简处理。毕竟只是辅助程序,所以一定有好多漏洞。比如哪位的作品叫:“简称”,那么多半会被我的程序滤掉了。
- 大小: 38 KB
分享到:
相关推荐
标题中的“玉兔叫月球车3d打印模型免费下载”和描述中提到的“嫦娥三号月球登陆器slt文件3d模型3d打印技术网下载”都指向了一个主题,即关于中国航天工程嫦娥三号任务的月球车——玉兔号的3D打印模型。这个模型是以...
嫦娥三号是中国国家航天局实施的嫦娥工程二期中的一个重要任务,它的主要目标是对月球进行软着陆并部署月球车进行探测。软着陆过程被细致地分为六个阶段,每个阶段都有特定的任务和状态要求,确保嫦娥三号能够安全、...
2013 年12 月全程参加了嫦娥三号着陆器和月球车X 频段的VLBI 测定轨测定位任务. 在嫦娥三号中, 利用天马望远镜代替上海佘山25 m 射电望远镜, 使中国VLBI 观测网的灵敏度提高至1.67 倍. 同时, 利用2 比特采样代替...
1.此处主要探究的是嫦娥三号探测器在月球表面的软着陆问题。2.分析着陆轨道的特点,设计着陆轨道与各阶段的控制策略,对我国太空探测计划具有重要意义。3.此处主要采用微分动力学方程、最优控制策略等方法对问题进行...
嫦娥三号软着陆轨道设计与控制策略是航天领域中的一个重要课题,涉及到精确的轨道计算、动力学分析以及复杂的控制算法。这个课题的核心在于如何确保探测器在月球表面安全、有效地实施软着陆,这关系到整个任务的成功...
### 嫦娥三号软着陆轨道设计与控制策略 #### 概述 嫦娥三号是中国探月工程中的一个重要任务,旨在实现无人探测器在月球表面的软着陆。这一成就不仅标志着中国航天技术的重大突破,也为中国未来的深空探测任务奠定...
数学建模在这里的作用是通过数学公式和算法来模拟和预测嫦娥三号在月球着陆过程中的动态行为,包括轨道的规划、推进系统的控制策略以及着陆过程中的能量管理和安全评估。 描述中提到的“数学建模”是将现实世界的...
嫦娥三号是中国航天科技集团公司在2013年实施的月球探测任务,其中软着陆是整个任务的关键环节。软着陆轨道设计与控制策略对于确保探测器安全、准确地抵达月球表面至关重要。这篇优秀的论文深入探讨了这一主题,并...
1. 嫦娥三号着陆控制研究的主要内容包括对月观察、月面环境模拟、着陆程序设计和实验验证等方面。研究人员利用先进的计算机技术和仿真实验方法,对嫦娥三号的着陆过程进行模拟和预测,以优化着陆控制系统的设计和...
嫦娥三号是中国探月工程的重要任务之一,其软着陆轨道设计与控制策略的论文作为2014年全国大学生数学建模竞赛A题的优秀示范论文,涉及了大量的数学建模与计算方法。以下为该文档涉及的关键知识点的详尽说明。 **一...
轨道设计是整个任务的基础,它需要考虑到地球到月球的转移轨道,以及嫦娥三号进入月球轨道后的捕获、调整和近月点设定等多个环节。在这个过程中,科学家们必须精确计算出各个阶段的速度、位置和姿态,确保航天器能够...
通过最优化方法确定CE-3最佳软着陆轨迹
嫦娥三号是中国探月工程中的重要里程碑,它在2013年12月2日凌晨1时30分从西昌卫星...尽管面临巨大的技术挑战和风险,但嫦娥三号的成功表明中国已经成为全球航天大国之一,为后续的月球探索和深空探测奠定了坚实的基础。
### “嫦娥三号”月球探测器的轨道确定和月面定位 #### 摘要及背景 本文探讨了“嫦娥三号”(CE-3)月球探测器的轨道确定和月面定位技术,这是中国首次实现地外天体软着陆的重要航天项目。CE-3在月球正面的虹湾以...
在介绍了嫦娥三号地面验证需求及地面验证试验的要求之后, 重点介绍 了系统级的专项试验策划、实施情况, 以及试验的结果, 最后对嫦娥三号地面试验方法与试验技术进行了总结, 对未来深空探测器研制试验具有重要的参考...
通过对嫦娥三号的受力分析,太阳和地球对嫦娥三号的万有引力远小于月球对嫦娥三号的万有引力,因此嫦娥三号运动过程中只考虑二体作用。则由机械能守恒定律和开普勒定律,求解出嫦娥三号在近地点、远地点的速度的大小...