Python的一些基础知识介绍:
windows环境下,python环境的安装很简单,只要从python官方网站下载python的exe安装包,直接进行安装,然后在环境变量path中添加python的安装路径即可。完成之后,CMD中,键入"python"命令验证下吧。
IDE工具,我使用的是PyDev,稍微吐槽一下,不知道为什么背景颜色都是黑色的,看得我眼睛有点不舒服。
关于python的一些语法知识,可以参考《简明Python教程》:http://sebug.net/paper/python/
,以及《Python文档》:http://docs.python.org/library/index.html#library-index
今天学习的一些情况总结:
今天使用python写了一个网页爬虫,在这个过程中,遇到的一些问题:
1.使用标准模块以外的lxml模块,需要安装这些模块,安装的过程参考:http://ccyl.iteye.com/admin/blogs/1616876
2.关于xpath,由于一知半解,一直以为"//"是相对路径的表示方式,导致今天在一个问题上纠结了近一个小时,最后看了下xpath的知识,才知道,"//"是表示找到某个标签,而不管它在文档中的哪个位置。如果想从当前节点开始找起的话应该是
HtmlElment.xpath("./xxx");
3.关于python操作中文字符串时,截取字符导致的乱码。在《简明Python教程》中,对于字符串的介绍有这么一段话:
书中写道:
Unicode字符串:
Unicode是书写国际文本的标准方法。如果你想要用你的母语如北印度语或阿拉伯语写文本,那么你需要有一个支持Unicode的编辑器。类似地,Python允许你处理Unicode文本——你只需要在字符串前加上前缀u或U。例如,u"This is a Unicode string."。
《python核心编程(第二版)》 写道
在使用unicode编码的时候,只要能遵循以下四个规则,能避免90%的有unicode字符引起的错误:
1)出现字符串的地方一定要加u或者U
2)不要用str()函数,改用unicode()函数代替
3)不用过时的string模块 -- 该模块只支持ASCII编码
4)不到必要时不要在程序里解码Unicode字符。在写文件或者数据库又或者输出到网络时,才使用encode()函数;相应的在你需要把数据读回来的时候才使用decode()函数
然后查找了一些资料,其实在做中文字符串处理的时候我们应该要先把源字符转为Unicode编码,进行字符截取等操作,然后再转为你先要的编码格式的字符。操作过程代码应该如下,以截取字符为例:
# encoding=utf-8
if __name__ =='__main__':
var = "中文字符串哦";
unicode_str = var.decode("utf-8");#decode的编码根据字符串的编码方式进行选择
print unicode_str[0:4];
输入的结果为:"中文字符"
学习一门语言,动手做点东西,写点东西才是最快上手的方法。之前我的想法一直是,先看书,等我都看到了这些知识了,学会了,再动手去做。这完全就是坑爹,其实动手做,遇到不懂的或者自己不肯定的再找相关的资料了解,才能更好的掌握并且记忆更加深刻。当然,如果能把遇到的问题都自己亲自记录下来就更好了。
Python才入门,继续加油,好好学习。
分享到:
相关推荐
看python做的一些小笔记,具体内容是自己的笔记,怎么办没话说了,为什么描述要那么多字,但是发射点发射点v反对豆腐干豆腐干发士大夫v倒是方便
14.6_None|Pythonic与Python杂记|Python3.8入门_&_进阶_&_原生爬虫实战完全解读
14.2_用字典映射代替switch_case语句|Pythonic与Python杂记|Python3.8入门_&_进阶_&_原
14.11_Python_3.8_新增海象运算符|Pythonic与Python杂记|Python3.8入门_&_进阶_&_原生
14.13_Python_3.7_新增数据类dataclass装饰器|Pythonic与Python杂记|Python3.8入门
14.1_导言|Pythonic与Python杂记|Python3.8入门_&_进阶_&_原生爬虫实战完全解读
14.5_iterator与generator|Pythonic与Python杂记|Python3.8入门_&_进阶_&_原生爬
14.10_论编程能力|Pythonic与Python杂记|Python3.8入门_&_进阶_&_原生爬虫实战完全解读
14.9_装饰器的副作用|Pythonic与Python杂记|Python3.8入门_&_进阶_&_原生爬虫实战完全解读
Python3是一种广泛应用于数据分析、机器学习、Web开发和自动化任务的高级编程语言。这个入门视频教程涵盖了从基础到进阶的各个重要知识点,适合初学者系统地学习Python3。 首先,第一章“Python入门导学”将引导你...
14.12_f关键字做字符串拼接|Pythonic与Python杂记|Python3.8入门_&_进阶_&_原生爬虫实战完全解读
14.4_字典如何编写列表推导式|Pythonic与Python杂记|Python3.8入门_&_进阶_&_原生爬虫实战完全解读
14.7_对象存在并不一定是True|Pythonic与Python杂记|Python3.8入门_&_进阶_&_原生爬虫实战完全
14.8___len__与__bool__内置方法|Pythonic与Python杂记|Python3.8入门_&_进阶_&_原
视频教程结合源代码学习,能帮助学习者更好地理解和应用所学知识,逐步成为一名熟练的Python开发者。无论你是希望从事Web开发、数据分析、自动化脚本编写,还是机器学习和人工智能,这个全面的教程都将为你打下坚实...
通过这一章节的学习,初学者可以对Python有一个大概的认识,并了解为什么学习Python。 ### 第2章 Python环境安装 此章节详细介绍了如何在不同的操作系统(如Windows、macOS、Linux)上安装Python运行环境。此外,...
在Python中,我们可以利用OpenCV库来处理图像和视频,包括调用摄像头、捕获视频帧、进行图像处理以及进行机器学习相关的图像识别任务。 【Python OpenCV调用摄像头】 在Python中使用OpenCV调用摄像头,首先需要...
在本项目中,"ddddocr杂记,使用ddddocr、flask" 主要涉及的是一个基于Python的OCR(Optical Character Recognition,光学字符识别)应用,利用ddddocr库进行文字识别,并结合Flask框架构建了一个后端服务。...
- Python杂记:学习过程中的笔记和心得。 2. **原生爬虫实战**: - 使用Python标准库实现网页抓取。 - 数据解析:使用BeautifulSoup、lxml等工具。 - 数据存储:CSV、JSON、数据库等。 通过以上知识点的学习,...
### 第14章 Pythonic与Python杂记 - **课程目标**:提高Python编程水平的小技巧与最佳实践。 - **核心知识点**: - Pythonic编程风格 - 常见问题解答 - 提高效率的编程技巧 - 实用工具与库的推荐 通过以上详细...