`

文章内容关键字或短语替换

阅读更多
分析的源文件内容:
  <fileNode access="" fileUuid="ac1eed02-eae9-11e7-9fd1-fa163e6dec89" metadata="" modifyTime="1513306994" name="All.DEG_final.clustered.data_subcluster_9.data" pid="abab9262-eae9-11e7-9fd1-fa163e6dec89" relativePath="Web_Report/BMK_5_DEG_Analysis/BMK_1_All_DEG/DEG_Cluster/BMK_2_Cluster_GO_enrichment/All.DEG_final.clustered.data_subcluster_9.data" tag="" type="folder"/>
<fileNode access="" dataUuid="ad041fb2-eae9-11e7-9fd1-fa163e6dec89" fileType="txt" fileUuid="ad041b52-eae9-11e7-9fd1-fa163e6dec89" metadata="[]" modifyTime="1513307016" name="jquery.ui.datepicker-uk.min.js" pid="acf9b73e-eae9-11e7-9fd1-fa163e6dec89" relativePath="Web_Report/BMK_5_DEG_Analysis/BMK_3_WTa_WTb_WTc_vs_M5a_M5b_M5c/BMK_2_DEG_Cluster/BMK_1_Heatmap_HTML/js/plugins/jquery-ui/i18n/jquery.ui.datepicker-uk.min.js" size="1039" tag="" type="file"/>

利用正则表达式处理:
 
  
String p1 = "^(<fileNode access=\"\" )(dataUuid=\")([a-z0-9-]{0,36})(.*)(fileUuid=\")([a-z0-9-]{0,36})(.*)(pid=\")([a-z0-9-]{0,36})(.*)(type=\"file\"/>)$";
        String p2 = "^(<fileNode access=\"\" )(fileUuid=\")([a-z0-9-]{0,36})(.*)(type=\"folder\"/>)$";
        String p3 = "^(<fileNode access=\"\" )(.*)(pid=\")([a-z0-9-]{0,36})";
        Pattern filePatter = Pattern.compile(p1);
        Pattern folderPatter = Pattern.compile(p2);
        Pattern pidPatter = Pattern.compile(p3);
try {
            List<String> list = Files.readAllLines(Paths.get("/home/bmk/testreport/report-files.xml"));
            if (list.size() > 0) {
                StringBuilder xmlString = new StringBuilder();
                Map<String, String> uuidMap = new HashMap<>();
                List<String> newContent = new ArrayList<>();
                list.stream().forEach(content -> {
                    Matcher fileMatcher = filePatter.matcher(content);
                    if (fileMatcher.lookingAt()) {
                        String dataUuid = fileMatcher.group(3);
                        String fileUuid = fileMatcher.group(6);
                        String newUuid = UUID.randomUUID().toString();
                        uuidMap.put(fileUuid, newUuid);
                        content = content.replace(dataUuid, UUID.randomUUID().toString());
                        content = content.replace(fileUuid, newUuid);
                        newContent.add(content);
                    }
                    Matcher folderMatcher = folderPatter.matcher(content);
                    if (folderMatcher.lookingAt()) {
                        String fileUuid = folderMatcher.group(3);
                        String newUuid = UUID.randomUUID().toString();
                        content = content.replace(fileUuid, newUuid);
                        uuidMap.put(fileUuid, newUuid);
                        newContent.add(content);
                    } else {
                        newContent.add(content);
                    }
                });
                newContent.stream().forEach(content -> {
                    Matcher pidMatcher = pidPatter.matcher(content);
                    if (pidMatcher.lookingAt()) {
                        String pid = pidMatcher.group(4);
                        if (uuidMap.containsKey(pid)) {
                            content = content.replace(pid, uuidMap.get(pid));
                        }
                    }
                    xmlString.append(content + "\r\n");
                });
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
分享到:
评论

相关推荐

    初学JS的的小例子 javascript replace高亮替换

    高亮显示是指在文本中将某些关键字或短语高亮显示,以便于阅读和理解。在本例中,我们使用 `&lt;font&gt;` 元素来实现高亮显示的效果。 ### 字符串操作 字符串操作是指对字符串进行各种操作,例如查找、替换、连接等。在...

    JQuery+JS实现仿百度搜索结果中关键字变色效果

    这是指在网页文本中,当某个词或短语被搜索时,这些词或短语在结果中高亮显示。这样用户可以更容易地从搜索结果中识别出他们所需要的信息。在百度等搜索引擎中,这个功能可以帮助用户快速定位到搜索词所在的句子或...

    InfoGlue - User Manual for version 2.6.0.pdf

    - **内容搜索替换**:全局搜索和替换特定关键字或短语。 - **执行任务**:执行特定的任务或命令。 #### 五、结构工具详解 **3.1 界面介绍** 结构工具同样提供了清晰的界面,便于用户理解和操作。 **3.2 结构树...

    绿色SEO工具大礼包

    此工具通过替换文章中的关键词和短语,生成具有不同表达但相同意思的版本,以增强内容的原创性。尽管这种方法可以在一定程度上欺骗搜索引擎,增加内容的独特性,但我们必须保持警惕,确保这些替换不会损害文章的质量...

    rare_text.rar_文本编辑器

    6. **搜索替换**:在整个文档或多个文件中批量替换特定内容,节省大量手动修改的时间。 压缩包内的www.pudn.com.txt文件可能是一个示例文本,展示了如何在编辑器中处理网页源代码或者记录网址。而rare_text文件名...

    语文备课资料苏教七年级上册幼时记趣PPT学习教案.pptx

    - 换:用现代词语替换古代词语,包括词类活用和通假字的替换。 5. **词句积累**: - 识别一词多义的词,即同一个词在不同语境下的不同含义。 - 识别文言文中的通假字,即用一个字代替另一个字的现象。 - 收集...

    C#调用Lucene方法-实现快速搜索

    Document包含多个Field,每个Field代表文档的一个属性或字段,如标题、内容等。例如: ```csharp var document = new Document(); document.Add(new TextField("content", "搜索内容", Field.Store.YES)); ...

    2010最新高效WORD排版教程(完整版

    首行缩进是文章格式化的重要元素,可以通过标尺或段落设置调整,使段落层次分明。 #### 4、文档网格 文档网格功能可以帮助用户在页面上创建规则的网格,便于精确布局。 #### 5、快速设置文字字体 使用“字体”...

Global site tag (gtag.js) - Google Analytics