萧井陌知乎回答备份-iteye

: 萧井陌知乎回答备份 评分:

萧井陌知乎回答备份，很有用

知乎 2018-11-07 上传大小：121.00MB

所需: 50积分/C币立即下载

: Python知乎回答多线程爬虫
### 知乎回答多线程爬虫 **模式** 1. 单问题爬取模式 2. 相似问题爬取模式 **输出** **文件名** 问题题目 **文件内容** 1. 问题 2. 问题id 3. 回答者昵称 4. 回答者空间id 5. 回答者id 6. 回答者内容 **单问题爬取模式** **功能** 主要通过用户提供的问题id，爬取单个问题下的所有回答 **相似问题爬取模式** **功能** 通过用户提供的起始问题id，以及相关内容爬取数量，利用知乎的**相关问题**进行自动检索，并不断递归至用户提供的爬取数量（默认数量为20）。 **bug** 由于知乎具有一定的反爬，所以在相似问题检索时最大的检索量为400，如果到达500就会触发反爬机制，需要用户填写一个验证码才可以继续爬取。（也许未来有时间的话会把获取验证码的部分代码补全，但具体机器打码的实现还是太难了，所以还得自己手动输入验证码） **优点** 简单，明了，使用requests库进行爬取，利用递归实现迭代检索，代码量不大。 **缺点** 功能较少，对线程的把握不够好，可能会出现数据少量缺失的情况。 **技术栈：** 1. requests 2. re 3. json 4. time 5. threading **未来** 关于知乎的爬取，我这里还有一个存货——爬取知乎文章中的表情包（gif，png，jpg），这样就可以愉快的收集表情包了。同时我也尝试着去做了一下对知乎用户数据的爬取，但还为成功。
立即下载
上传者： weixin_44510615 时间： 2021-06-22

: Python爬取知乎回答中的文本及图片
可保存回答中的文本,图片到本地(先输入问题ID)，并保存用户id,主页网址信息，可设置下载数量，所需依赖包在requerments.txt中
立即下载
上传者： jiangqiao11 时间： 2019-09-26

: 小程序源码知乎 (代码+截图)
小程序源码知乎 (代码+截图)小程序源码知乎 (代码+截图)小程序源码知乎 (代码+截图)小程序源码知乎 (代码+截图)小程序源码知乎 (代码+截图)小程序源码知乎 (代码+截图)小程序源码知乎 (代码+截图)小程序源码知乎 (代码+截图)小程序源码知乎 (代码+截图)小程序源码知乎 (代码+截图)小程序源码知乎 (代码+截图)小程序源码知乎 (代码+截图)小程序源码知乎 (代码+截图)小程序源码知乎 (代码+截图)小程序源码知乎 (代码+截图)小程序源码知乎 (代码+截图)小程序源码知乎 (代码+截图)小程序源码知乎 (代码+截图)小程序源码知乎 (代码+截图)小程序源码知乎 (代码+截图)小程序源码知乎 (代码+截图)小程序源码知乎 (代码+截图)小程序源码知乎 (代码+截图)小程序源码知乎 (代码+截图)小程序源码知乎 (代码+截图)小程序源码知乎 (代码+截图)小程序源码知乎 (代码+截图)小程序源码知乎 (代码+截图)小程序源码知乎 (代码+截图)小程序源码知乎 (代码+截图)小程序源码知乎 (代码+截图)小程序源
立即下载
上传者： s13596191285 时间： 2022-06-19

: selenium爬取知乎回答摘要
根据指定关键字爬取知乎的回答内容摘要，爬虫速度不快，涉及技术selenium、mongodb，爬虫可部署到服务器上，使用定时任务每小时执行一次，具体参考文章https://blog.csdn.net/weixin_44018458/article/details/128567008 适用人群：爬虫初学者其他说明：爬虫具有时效性，适用于学习
立即下载
上传者： weixin_44018458 时间： 2023-01-07

: 知乎爬虫(知乎网站爬取工具,爬取知乎网页内容)
知乎爬虫(知乎网站爬取工具,爬取知乎网页内容)。大家下载试试吧。挺好用的，嘿嘿。
立即下载
上传者： huangyueranbbc 时间： 2016-01-08

: python知乎回答多线程爬虫
### 知乎回答多线程爬虫 **模式** 1. 单问题爬取模式 2. 相似问题爬取模式 **输出** **文件名** 问题题目 **文件内容** 1. 问题 2. 问题id 3. 回答者昵称 4. 回答者空间id 5. 回答者id 6. 回答者内容 **单问题爬取模式** **功能** 主要通过用户提供的问题id，爬取单个问题下的所有回答 **相似问题爬取模式** **功能** 通过用户提供的起始问题id，以及相关内容爬取数量，利用知乎的**相关问题**进行自动检索，并不断递归至用户提供的爬取数量（默认数量为20）。 **bug** 由于知乎具有一定的反爬，所以在相似问题检索时最大的检索量为400，如果到达500就会触发反爬机制，需要用户填写一个验证码才可以继续爬取。（也许未来有时间的话会把获取验证码的部分代码补全，但具体机器打码的实现还是太难了，所以还得自己手动输入验证码） **优点** 简单，明了，使用requests库进行爬取，利用递归实现迭代检索，代码量不大。 **缺点** 功能较少，对线程的把握不够好，可能会出现数据少量缺失的情况。 **技术栈：** 1. requests 2. re 3. json 4. time 5. threading **未来** 关于知乎的爬取，我这里还有一个存货——爬取知乎文章中的表情包（gif，png，jpg），这样就可以愉快的收集表情包了。同时我也尝试着去做了一下对知乎用户数据的爬取，但还为成功。
立即下载
上传者： Mrrunsen 时间： 2021-10-03

: 仿知乎问题系统php+html模版
问答知乎模版仿问答系统，安装即可在服务器运行php初学资源。
立即下载
上传者： alaoge 时间： 2017-10-23

: 知乎文章采集导出助手.zip
1、导出知乎网站上任意问答中的问题和回答内容，以及问题和回答的评论部分； 2、导出指定用户下所有文章，包括文章内容和文章评论部分； 3、导出格式以html格式为主，也可导出pdf和Word格式（推荐使用默认的html，html相当于本地的网页，可以永久的保存到你的电脑上）；
立即下载
上传者： u011223449 时间： 2024-11-12

: 知乎回答爬取-话题回答
在当今信息爆炸的时代，网络平台蕴含着海量的有价值信息，知乎便是其中一个知识汇聚且交流氛围浓厚的平台。许多用户会在知乎上围绕各种话题展开深入探讨，分享自己的见解、经验和专业知识，这些内容对于研究特定领域、解决实际问题或者获取新的思路都具有重要意义。本资源的构建正是基于这样的背景，其主要目的是针对知乎某一特定话题的回答进行爬取。这里所说的 “某一话题”，可以是科技前沿领域如人工智能的发展趋势，也可以是生活实用类如如何进行有效的时间管理，亦或是文化艺术范畴像某部经典文学作品的深度解读，涵盖范围极为广泛。爬取知乎话题的回答这一行为背后有着多方面的价值。从学术研究的角度来看，研究人员可以通过收集某一专业领域话题下的回答，分析不同观点和研究方向，为自己的学术研究提供参考和启示。对于企业而言，关注市场动态、用户需求等相关话题的回答，有助于了解消费者的喜好和痛点，从而优化产品和服务。而对于普通用户来说，爬取感兴趣话题的回答能够快速整合优质信息，节省自己在海量内容中筛选的时间。
立即下载
上传者： asknh 时间： 2025-02-15

: 编程入门指南 v1.5
知乎大佬萧井陌总结的编程入门指南，1.5版本。已经很多人转行CS。
立即下载
上传者： m0_37700926 时间： 2018-08-01

: 知乎爬虫：爬取知乎某一问题下的所有回答（回答数小于800左右）
知乎爬虫：爬取知乎某一问题下的所有回答（回答数小于800左右）基本思路将question id 进行遍历，存入文件，对问题进行过滤后爬取需要的回答目前项目爬取的机制是将滚动条拉取到页面底端，然后一次性抓取所有的回答元素，但由于目前知乎的缓冲加载机制，当回答数量过多时(大概800左右)，前面的回答信息就抓取不到了；拟解决思路：边滚动边抓取（但不方便进行元素定位以避免重复抓取）项目结构 │ config.py # 爬取链接及存储路径设置 │ README.md │ requirements.txt │ scanner.py # 获取有效的问题网址 | filter_links.py # 按照一定规则筛选问题 │ ZhihuSpider.py # 知乎爬虫主程序 │ ├─Driver │ chromedriver.exe # Chrome驱动 │ geckodriver.exe # gecko驱动 │ └─Results result-2022-07-28-深度神经网络DNN是否模拟了人类大脑皮层结构.csv # 抓取结果样例
立即下载
上传者： Mrrunsen 时间： 2023-01-05

: 知乎问题回答.md
知乎问题回答
立即下载
上传者： m0_50414588 时间： 2024-05-27

: Python-zhihuBackup知乎个人回答备份获取html并打印到pdf
zhihu_Backup 知乎个人回答备份，获取html并打印到pdf
立即下载
上传者： weixin_39841365 时间： 2019-08-10

: 知乎回答追踪器-crx插件
语言:中文 (简体) 轻松跟踪知乎回答的更新情况，你们给我搞的这个追踪器啊，一颗赛艇！！！在浏览知乎的时候经常遇到有的长篇回答没有一次性写完或者大V占坑等更新的情况，而且往往一转眼就忘记了再去阅读、不知道何时更新，或者当想阅读的时候已经找不到原来的链接了。这个插件就为有这种情况的Chrome用户所准备的（也包括我自己）。目前为初见的版本，可能出现一些Bug，请见谅，如果有建议或者意见请在Github中给我发Issues，谢谢你的支持。
立即下载
上传者： weixin_38618315 时间： 2021-04-02

: Introduction-to-programming-guide:知乎大神萧井陌的《编程入门指南学习》
Introduction-to-programming-guide 知乎大神萧井陌的《编程入门指南学习》
立即下载
上传者： weixin_42131367 时间： 2021-06-10

: zhihubackup:退乎前备份知乎回答
退乎前备份知乎回答：zhihubackup 每个知乎答主都有退乎的梦想，但退乎前如果删光回答，则十分可惜。因此，我用Python写了60行的脚本，可以在退乎前备份自己的所有回答和文章，以免事后后悔。安装 pip install git+https://github.com/njzjz/zhihubackup 使用假如你是@贱贱，你的id是splitter，那么可以编写Python脚本： from zhihubackup import backup_zhihu backup_zhihu("splitter") 静等一段时间。运行结束后，可以看到产生了名为splitter的文件夹： - splitter |- answer (842 files) |- article (101 files) |- pin (3214 files) |- question (57 files
立即下载
上传者： weixin_42101384 时间： 2021-05-08

: 全套视频课程：知乎大神萧井陌 Python Flask 24课全 + 萧井陌前端
全套视频课程：知乎大神萧井陌 Python Flask 24课全 + 萧井陌前端
立即下载
上传者： weixin_39461307 时间： 2019-04-25

: ChatGPT机器回答与知乎人工回答的比较-施亦龙.pdf
ChatGPT机器回答与知乎人工回答的比较-施亦龙.pdf
立即下载
上传者： m0_62488776 时间： 2023-06-13

: 知乎大神萧井陌web前端课程
------------------------课程介绍------------------------ 第1章 HTML、CSS、布局第2章 JavaScript 介绍第3章作业讲解、编程的选择结构和函数返回值和库、css初步、函数参数第4章数组和字符串、作业讲解、debug大法第5章作业讲解、如何方便地用测试写代码、break&continue;语句、object、读文档、递归第6章网页中引入JavaScript代码、DOM、事件第7章数据类型、多行字符串和转义符号、高阶函数、匿名函数第8章事件委托、时间操作、标签的可编辑属性、(本地存储) 和 JSON 格式第9章作业选讲、抽象化, 如何封装功能, 如何组织代码结构、变量命名的方法第10章 HTTP 协议和 AJAX、DOM 事件机制, 事件冒泡和事件捕获第11章面向对象、ajax、作业和代码思路第12章找工作基础、ajax作业、api封装第13章 jQuery 常见用法、课程重点、常用组件例如弹窗的制作第14章作业讲解第15章 log的要素、git和github、js的一些高级内容 bind apply call、前端CSS框架Bootstrap和Pure 第16章 JS的历史现状和未来、什么是ES6有什么新东西、CSS最基础的套路第17章前端工程师第1章网址组成、端口、HTTP协议、web服务器第2章作业讲解、服务器框架、html和getpost传递参数第3章基本框架、框架解释、model解释第4章 cookie讲解、session讲解、作业讲解和调试技巧第5章 todo程序、todo的更新和删除、带用户功能的todo程序第6章 jinja模板套路、类和其他、作业讲解第7章摘要算法、加盐保护密码-数据库索引原理、微博程序第8章传统数据库、sql注入和mongo安装使用、mongo日常使用第9章前端基础、dom和事件、js todo 第10章 ajax 第11章 css 第12章 linux基础第13章 flask框架第14章使用sshkey连接linux服务器、rsa原理和git软件使用、使用git软件同步本地和服务器代码第15章 flask的session和cookie、flask留言板&web;后端栈、flask博客套路第16章抓包&爬虫基础、爬虫精讲、编码&API; 第17章数据结构基础和算法分析原理、链表队列栈和四大结构、平衡二叉搜索树和哈希表第18章 bbs基础、bbs标题和回复、bbs其他第19章 web安全和应对、服务器的配置文件处理、开发论坛的板块功能第20章论坛收尾、迁移mongo、性能第21章操作系统、python高级第22章 python高级技巧、rpc实现和vagrant 第23章架构、分布式、性能、聊天室项目第24章简历和工作、工作后的计划、学习的计划
立即下载
上传者： weixin_43500602 时间： 2018-10-24

热门资源标签

上传资源赚钱

Global site tag (gtag.js) - Google Analytics