`

C# 查找PDF页面指定区域中的文本并替换和高亮

阅读更多

对PDF文档中的内容进行查找时,可针对文档全篇内容获取查找结果,也可在PDF指定页面中的特定范围内(矩形框区域)进行查找,对获取的查找结果可执行文本高亮或替换等操作,本文将对此作相关介绍(附VB.NET代码,有需要可参考)。

关于工具使用

工具:需下载Spire.PDF for .NET Pack hotfix 6.12.20版本(注:hotfixt版本无需安装,若下载的是Pack版本则需要安装至本地路径,可在安装后,查看演示程序及API)。

引用:下载并解压到本地路径,将Bin文件夹下的Spire.Pdf.dll文件添加引用至VS程序。

using Spire.Pdf;
using Spire.Pdf.General.Find;
using Spire.Pdf.Graphics;
using System.Drawing;

namespace FindAndHighlightText2
{
    class Program
    {
        static void Main(string[] args)
        {
            //加载PDF测试文档
            PdfDocument pdf = new PdfDocument();
            pdf.LoadFromFile("咖啡豆.pdf", FileFormat.PDF);

            //指定需要查找的页面区域范围
            RectangleF pagerec = new RectangleF(0, 0, 500, 700);

            //在第一页的指定区域查找指定文本
            PdfTextFindCollection findCollection1 = pdf.Pages[0].FindText(pagerec, "咖啡豆", TextFindParameter.WholeWord);
            PdfTextFindCollection findCollection2 = pdf.Pages[0].FindText(pagerec, "洪都拉斯", TextFindParameter.WholeWord);         

            //替换查找结果
            PdfBrush brush = new PdfSolidBrush(Color.Red);
            PdfTrueTypeFont font = new PdfTrueTypeFont(new Font("Arial", 12f, FontStyle.Regular));

            RectangleF textrec;
            foreach (PdfTextFind find1 in findCollection1.Finds)
            {
                textrec = find1.Bounds;
                pdf.Pages[0].Canvas.DrawRectangle(PdfBrushes.White, textrec);
                pdf.Pages[0].Canvas.DrawString("NewText", font, brush, textrec);

            }

            //高亮查找结果
            foreach (PdfTextFind find2 in findCollection2.Finds)
            {
                find2.ApplyHighLight(Color.Yellow);
            }

            //保存文档
            pdf.SaveToFile("result.pdf", FileFormat.PDF);
            System.Diagnostics.Process.Start("result.pdf");
        }
    }
}

 

 

Imports Spire.Pdf
Imports Spire.Pdf.General.Find
Imports Spire.Pdf.Graphics
Imports System.Drawing

Namespace FindAndHighlightText2
	Class Program
		Private Shared Sub Main(args As String())
			'加载PDF测试文档
			Dim pdf As New PdfDocument()
			pdf.LoadFromFile("咖啡豆.pdf", FileFormat.PDF)

			'指定需要查找的页面区域范围
			Dim pagerec As New RectangleF(0, 0, 500, 700)

			'在第一页的指定区域查找指定文本
			Dim findCollection1 As PdfTextFindCollection = pdf.Pages(0).FindText(pagerec, "咖啡豆", TextFindParameter.WholeWord)
			Dim findCollection2 As PdfTextFindCollection = pdf.Pages(0).FindText(pagerec, "洪都拉斯", TextFindParameter.WholeWord)

			'替换查找结果
			Dim brush As PdfBrush = New PdfSolidBrush(Color.Red)
			Dim font As New PdfTrueTypeFont(New Font("Arial", 12F, FontStyle.Regular))

			Dim textrec As RectangleF
			For Each find1 As PdfTextFind In findCollection1.Finds
				textrec = find1.Bounds
				pdf.Pages(0).Canvas.DrawRectangle(PdfBrushes.White, textrec)

				pdf.Pages(0).Canvas.DrawString("NewText", font, brush, textrec)
			Next

			'高亮查找结果
			For Each find2 As PdfTextFind In findCollection2.Finds
				find2.ApplyHighLight(Color.Yellow)
			Next

			'保存文档
			pdf.SaveToFile("result.pdf", FileFormat.PDF)
			System.Diagnostics.Process.Start("result.pdf")
		End Sub
	End Class
End Namespace

 

 

 

0
1
分享到:
评论

相关推荐

    水泥袋检测系统源码和数据集:改进yolo11-DCNV4.zip

    水泥袋检测系统源码和数据集:改进yolo11-DCNV4

    德克萨斯扑克分析器Matlab代码.rar

    1.版本:matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。

    使用Plotly绘制散点图-柱状图-折线图-三维图-饼状图

    使用Plotly绘制散点图_柱状图_折线图_三维图_饼状图

    金银岛谜题Matlab源代码.rar

    1.版本:matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。

    光敏电阻接线图

    光敏电阻接线图

    MAX30102心率血样传感器原理图.pdf

    MAX30102心率血样传感器原理图

    测试两个多维分布之间的差异(2-d K-S检验,n-d能量检验)Matlab代码.rar

    1.版本:matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。

    胎儿脑部异常检测系统源码和数据集:改进yolo11-convnextv2.zip

    胎儿脑部异常检测系统源码和数据集:改进yolo11-convnextv2

    MATLAB版本的经典游戏,俄罗斯方块.rar

    1.版本:matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。

    基于Kotlin语言的安卓Camera2拍照录像设计源码

    本项目为基于Kotlin语言的安卓Camera2拍照录像设计源码,总计包含48个文件,涵盖17个XML配置文件、10个WEBP图片文件、5个Kotlin源代码文件、3个Git忽略文件、3个Gradle配置文件、2个Markdown文档、2个属性文件、1个Gradle脚本文件、1个APK安装包以及1个JSON文件。该源码适用于实现安卓设备的拍照和录像功能。

    【C#】设计模式大作业_pgj.zip

    【C#】设计模式大作业_pgj

    基于ruoyi框架的校园后勤Vue前端设计源码

    本项目是一款基于ruoyi框架开发的校园后勤Vue前端设计源码,包含358个文件,涵盖122个Vue组件、93个SVG图标、87个JavaScript脚本、25个PNG图片、10个SCSS样式表、3个批处理脚本、3个JPG图片、2个HTML页面、2个JSON配置文件、2个备份文件。该代码适用于校园后勤管理系统,旨在提升校园后勤服务效率。

    基于Spring Boot框架的校园外卖点餐系统设计源码

    该项目是基于Spring Boot框架的校园外卖点餐系统设计源码,包含162个文件,包括142个Java源文件、16个XML配置文件、2个YML配置文件、1个Git忽略文件和1个XLSX文件。系统采用前后端分离架构,结合Mybatis、Spring Cache、阿里云OSS、Swagger、POI和WebSocket等技术,支持菜品、套餐、订单管理、支付、报表统计及用户催单等功能。系统分为后台管理端和用户端,用户端通过微信小程序实现。我的主要工作包括管理端员工及菜品信息的增删改查功能。

    基于QT框架的OpenCV人脸识别.zip

    基于QT框架的OpenCV人脸识别

    使用赫斯顿模型和条件蒙特卡洛方法计算欧洲看涨期权价格Matlab代码.rar

    1.版本:matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。

    图像处理新思路:微生物菌落图像分割.zip

    图像处理新思路:微生物菌落图像分割

    基于Python核心的跨语言智能补全插件YouCompleteMe设计源码

    该项目是一款基于Python核心的跨语言智能补全插件YouCompleteMe的设计源码,包含131个文件,涵盖57个Python文件、23个Vim配置文件、6个Markdown文件、5个C/C++源文件、3个YAML配置文件、3个文本文件以及少量其他类型的文件。该插件支持Python、C++、Shell、C等多种编程语言,旨在为开发者提供高效的代码补全功能。

    数据集 + 英国MIDNORCO沉积物岩性数据集

    英国MIDNORCO沉积物岩性数据集 内容: Fyfe, RM (2014) 发布的数据集详细记录了位于英国的MIDNORCO沉积物岩心的岩性特征。此数据集共包含12个数据点,提供了关于该地区地质结构的重要信息。通过访问以下链接可获取完整数据集:"" ()。这些数据对于研究古环境变化、地质年代测定以及了解地球历史具有重要意义。

    数据集 + 威德尔海豹潜水时长数据集

    内容: 本数据集记录了来自Filchner Trough的威德尔海豹(标记为FIL2014_wed_a_m_03)的潜水时长信息,由Bornemann H、Oosthuizen WC、Schröder M等人于2014年发布。该数据集包含了2033个数据点,提供了对单只威德尔海豹潜水行为的详细观察。通过访问以下链接可以获取完整的数据集详情:"" ()。这项研究有助于我们更好地理解威德尔海豹在南极海域中的生活习性与行为模式。

    【光学】基于matlab GUI干涉条纹识别(干涉条纹数 条纹间距)【含Matlab源码 12018期】.zip

    Matlab领域上传的视频是由对应的完整代码运行得来的,完整代码皆可运行,亲测可用,适合小白; 1、从视频里可见完整代码的内容 主函数:main.m; 调用函数:其他m文件;无需运行 运行结果效果图; 2、代码运行版本 Matlab 2019b;若运行有误,根据提示修改;若不会,私信博主; 3、运行操作步骤 步骤一:将所有文件放到Matlab的当前文件夹中; 步骤二:双击打开main.m文件; 步骤三:点击运行,等程序运行完得到结果; 4、仿真咨询 如需其他服务,可私信博主; 4.1 博客或资源的完整代码提供 4.2 期刊或参考文献复现 4.3 Matlab程序定制 4.4 科研合作

Global site tag (gtag.js) - Google Analytics