`
android_madness
  • 浏览: 40851 次
  • 性别: Icon_minigender_1
  • 来自: 福州
社区版块
存档分类
最新评论

过滤未知字符 python

阅读更多
从网络上复制源代码的时候经常会一不小心复制回来一些看不见的怪异东西 我下面的这段代码就是专门用来过滤这些乱七八糟东西的 当中还需要用到win32con 这是第三方的python组件需要另外下载

#coding=utf-8

#This's a sample of operate the clipboard

import win32clipboard as wincb

import win32con


wincb.OpenClipboard()

oriString = wincb.GetClipboardData(win32con.CF_TEXT)


wincb.EmptyClipboard()

acceptable_char = """`1234567890-=][poiuytrewqasdfghjkl;'\/.,mnbvcxz~!@#$%^&*()_+\r\n<>? ":|[]{}"""

filteredString = ""
for char in oriString:

    if char.lower() in acceptable_char:
        filteredString+=char
    else:
        print char
        
wincb.SetClipboardData(win32con.CF_TEXT, filteredString)

wincb.CloseClipboard()


在这里我只保留的英文字符和一些常用标点符号 如果有需要可以自己添加到acceptable_char 中

- 具体使用方式
你只需要ctrl+c你所需要复制的文本,然后运行本script就可以自动过滤了 (当然你的电脑要有PYTHON和那个组件)
分享到:
评论

相关推荐

    字符串查找替换(超经典)

    例如,我们可能需要在一个文档中查找所有特定单词并将其替换为其他词汇,或者在处理用户输入时过滤掉非法字符。在大型文本数据处理中,这种操作的效率尤为重要,因此优化查找和替换算法对于提高程序性能至关重要。 ...

    HTML代码过滤技术

    - 使用白名单策略:只允许特定的HTML标签和属性存在,而不是试图过滤掉所有有害元素,这种方法可以更有效地防止未知漏洞。 - 实时更新:定期更新过滤规则,以应对新的攻击手法和漏洞。 - 防护XSS攻击:除了过滤外...

    微博用户评论情感分析python代码(数据规模20w)

    首先,**数据过滤**是整个流程的第一步,它涉及到去除无用的信息,如URL、特殊字符、停用词等。Python中常用的库如`re`(正则表达式)和`nltk`(自然语言工具包)可以帮助我们完成这个任务。 接下来是**数据清洗**...

    将字符串转换成lumbda

    5. **安全性和性能**:将字符串转化为 Lambda 表达式可能带来安全风险,因为执行未知的字符串代码可能导致意外的行为。因此,确保输入字符串的安全性至关重要。此外,动态解析和执行代码通常比直接编译和执行慢,...

    用户的协同过滤算法数据集及代码实现

    1. 用户ID:唯一标识每个用户的数字或字符串。 2. 物品ID:表示用户可以评价或消费的不同项目,如电影、书籍、音乐等。 3. 评分:用户对物品的评价,通常以1到5星或其他标度进行评分。 协同过滤算法主要分为两种...

    上传漏洞fuzz字典生成脚本python

    5. **Python脚本生成fuzz字典**:通过Python脚本可以自定义生成包含多种可能异常情况的字典,例如不同文件扩展名、编码、特殊字符等。 6. **自动化测试流程**:fuzz字典生成器可能包括自动化测试过程,自动执行上传...

    字符串任意提取.rar

    标题“字符串任意提取.rar”和描述中提到的“提取任意字符串,例如所有汉字,所有数字,所有字母,所有大写字母、小写字母,等等”,这涉及到的是字符串操作中的过滤和匹配技术。以下是对这些知识点的详细说明: 1....

    Python库 | gymnasdicts-0.1.1-py2.py3-none-any.whl

    `gymnasdicts-0.1.1-py2.py3-none-any.whl` 是一个针对Python开发的库,名为“gymnasdicts”的软件包。这个压缩包是用`.whl`...尽管具体功能未知,但其提供的便利性肯定能为使用Python进行后端开发的程序员带来帮助。

    Python库 | pytutils-0.0.4.tar.gz

    总的来说,`pytutils`作为一款Python库,尽管具体功能未知,但其目的显然是为了帮助开发者更高效地完成工作。通过了解和掌握这样的工具库,我们可以提升工作效率,更好地应对复杂的编程挑战。在使用过程中,遇到问题...

    计算机python编程试题,机器学习,深度学习试题及答案.pdf

    - Unicode编码:在Python 2.7中,`u'中文'` 是Unicode字符串的表示方式。 - 元组定义:选项A是不完整的元组,应加上逗号,选项B、C、D是正确的方式。 - 字符串操作:字符串比较遵循ASCII值,`'a' 结果为True。 -...

    python实现爬虫统计学校BBS男女比例之数据处理(三)

    这里提到的数据是以特定格式存储的文本文件,每条记录以某些固定的字符串开头,例如用户ID等信息。处理这类数据的第一步就是读取这些文件,并将其中的信息转化为程序可以理解和操作的格式。 具体来说,数据中的每一...

    数字图像课程设计-车牌识别.docx

    字符识别阶段,可以使用支持向量机(SVM)、深度学习模型如卷积神经网络(CNN)等进行训练,让模型学习大量车牌字符样本,实现对未知字符的识别。 7. 结论 本课程设计通过实现车牌识别系统,让学生深入理解了数字...

    Expletivedeleted

    例如,Python的`re`模块可用于正则表达式匹配,实现脏话过滤;JavaScript中的`replace()`函数可用于替换特定字符串。 综上所述,虽然“Expletivedeleted”本身不提供明确的IT技术信息,但它与“字体”标签结合,让...

    aaaa.rar_鏌ユ壘 璇剧▼璁捐

    标题中的“aaaa.rar_鏌ユ壘 璇剧▼璁捐”似乎是一种混合了中文字符和未知编码的表述,这可能是由于字符编码问题导致的乱码现象。在处理这样的文件时,我们需要了解不同的字符编码标准,如ASCII、UTF-8、GBK等,...

    提取文件名并保存至Excel

    同时,提取文件名而不是直接解压整个文件,可以避免潜在的安全风险,因为未知的压缩包可能包含恶意代码。 7. **错误处理**:编写程序时,应考虑异常处理,比如当压缩包损坏或者文件名含有特殊字符时,程序应该能够...

    未知攻焉知防——XXE漏洞攻防.pdf

    在Python中使用etree.parse时传入etree.XMLParser(resolve_entities=False)。 2. 过滤用户提交的XML数据:通过检测XML数据中的&lt;!DOCTYPE和&lt;!ENTITY关键字,或SYSTEM和PUBLIC关键字,防止恶意内容的注入。 3. 安全...

    第1章 赋予计算机从数据中学习的能力.pdf

    这类学习方法的目的在于预测未来的输出结果,例如垃圾邮件过滤和手写字符识别等二元分类和多元分类任务。在有监督学习中,还进一步区分了分类和回归问题。分类问题是指预测结果为离散变量的情况,而回归问题则是预测...

    解析csv文件,获取需要的信息

    4. **处理数据**:在获取到订单信息后,可能需要进行数据清洗和预处理,如去除空格、转换数据类型(如将字符串转换为日期或数值)、过滤无效或异常数据等。 5. **数据存储**:解析后的数据可能需要保存到数据库、...

Global site tag (gtag.js) - Google Analytics