jishigou / thinksns
每天自动化批量获取weibo食堂----美食菜谱图片
下载固定微博页面文件index.php?mod=yugao008准备调试脚本,并展示文件名[root@localhost ~]# wget http://weibo.cns*****.com/index.php?mod=yugao008 | ls -l index.php\?mod\=yugao008
-rw-r--r-- 1 root root 135540 04-23 11:37 index.php?mod=yugao008
搜索图片文件含o.jpg关键词的行,并展示
[root@localhost ~]# grep 'o.jpg" class="artZoomAll"' index.php\?mod\=yugao008 | more
<li><a href="http://weibo.cns*****.com/images/topic/9/39/75512_o.jpg" class="artZoomAll" rel="http://weibo.cns*****.com/images/topic/9/39/75512_s.jpg" rev="1444907_lLhRjs"><img src="http://wei *.com/images/topic/9/39/75512_s.jpg" /></a></li> <li><a href="http://weibo.cns*****.com/images/topic/3/27/75505_o.jpg" class="artZoomAll" rel="http://weibo.cns*****.com/images/topic/3/27/75505_s.jpg" rev="1444805_LiCXAH"><img src="http://wei *.com/images/topic/3/27/75505_s.jpg" /></a></li> <li><a href="http://weibo.cns*****.com/images/topic/e/19/75506_o.jpg" class="artZoomAll" rel="http://weibo.cns*****.com/images/topic/e/19/75506_s.jpg" rev="1444805_LiCXAH"><img src="http://wei *.com/images/topic/e/19/75506_s.jpg" /></a></li>搜索图片文件含o.jpg关键词的行,以awk截取引号分割第二段url另存为$(hostname)_$(date +%Y%m%d%H%M%S).txt文件,并展示各文件名
[root@locahost ~]# grep 'o.jpg" class="artZoomAll"' index.php\?mod\=yugao008 | awk -F "\"" '{print $2}' > $(hostname)_$(date +%Y%m%d%H%M%S).txt | ls -l $(hostname)*.txt
-rw-r--r-- 1 root root 1286 04-23 12:59 lindows_20130423125938.txt
-rw-r--r-- 1 root root 1286 04-23 14:49 lindows_20130423144952.txt
-rw-r--r-- 1 root root 1286 04-23 14:49 lindows_20130423144957.txt
-rw-r--r-- 1 root root 1286 04-23 14:51 lindows_20130423145111.txt
-rw-r--r-- 1 root root 1286 04-23 14:51 lindows_20130423145149.txt
-rw-r--r-- 1 root root 1286 04-23 14:53 lindows_20130423145307.txt
、、、
搜索图片文件含o.jpg关键词的行,以awk截取引号分割第二段url另存为$(hostname)_$(date +%Y%m%d%H%M%S).txt文件,并展示各文件名及其内容
[root@localhost ~]# ls -l $(hostname)*.txt
[root@localhost ~]# more lindows_20130423125938.txt
http://weibo.cns*****.com/images/topic/9/39/75512_o.jpg
http://weibo.cns*****.com/images/topic/3/27/75505_o.jpg
http://weibo.cns*****.com/images/topic/e/19/75506_o.jpg
http://weibo.cns*****.com/images/topic/d/82/75500_o.jpg
http://weibo.cns*****.com/images/topic/9/45/75501_o.jpg
、、、
搜索所有$(hostname)*.txt文件里含http关键词的行并展示各文件名和内容
[root@localhost ~]# grep 'o.jpg" class="artZoomAll"' index.php\?mod\=yugao008 | awk -F "\"" '{print $2}' > $(hostname)_$(date +%Y%m%d%H%M%S).txt | grep http $(hostname)*.txt | more
lindows_20130423144952.txt:http://weibo.cns*****.com/images/topic/9/45/75501_o.jpg
lindows_20130423144952.txt:http://weibo.cns*****.com/images/topic/0/17/75458_o.jpg
lindows_20130423144952.txt:http://weibo.cns*****.com/images/topic/c/99/75459_o.jpg
lindows_20130423144952.txt:http://weibo.cns*****.com/images/topic/b/28/75454_o.jpg
、、、
搜索所有$(hostname)*.txt文件里含http关键词的行,删除lindows*.txt:的文字后,排序且删除重复项后并展示
[root@localhost ~]# grep 'o.jpg" class="artZoomAll"' index.php\?mod\=yugao008 | awk -F "\"" '{print $2}' > $(hostname)_$(date +%Y%m%d%H%M%S).txt | grep http $(hostname)*.txt | awk -F "txt:" '{print $2}' | sort | uniq | more
http://weibo.cns*****.com/images/topic/0/17/75458_o.jpg
http://weibo.cns*****.com/images/topic/0/20/75450_o.jpg
http://weibo.cns*****.com/images/topic/3/25/75423_o.jpg
http://weibo.cns*****.com/images/topic/3/27/75505_o.jpg
http://weibo.cns*****.com/images/topic/3/82/75455_o.jpg
http://weibo.cns*****.com/images/topic/4/27/75302_o.jpg
http://weibo.cns*****.com/images/topic/5/27/75276_o.jpg
http://weibo.cns*****.com/images/topic/6/0/75351_o.jpg
http://weibo.cns*****.com/images/topic/6/3/75390_o.jpg
、、、
搜索所有$(hostname)*.txt文件里含http关键词的行,删除lindows*.txt:的文字后,排序且删除重复项后并展示,并批量下载所有jpg到指定目录/home/lindows/
[root@locahost ~]# grep 'o.jpg" class="artZoomAll"' index.php\?mod\=yugao008 | awk -F "\"" '{print $2}' > $(hostname)_$(date +%Y%m%d%H%M%S).txt | grep http $(hostname)*.txt | awk -F "txt:" '{print $2}' | sort | uniq | more | xargs -I {} wget -P /home/lindows/ {}
相关推荐
微博权限管理系统是一个针对微博平台进行用户权限控制的项目,它涉及到多方面的IT技术与概念。在深入探讨这个项目之前,让我们先理解一下“权限管理”的基本含义。权限管理是信息系统中一个关键的组成部分,用于控制...
`.settings`、`.project`和`.classpath`是Eclipse或IDEA等开发环境的配置文件,帮助管理项目结构和编译设置。 封装完成后,开发者只需要引入这个库,就可以方便地使用腾讯微博的功能,无需关心底层的实现细节。这...
《微博API调用初学者教程:基于project_micro_blog项目》 在互联网社交领域,微博作为一个重要的平台,提供了丰富的API(应用程序编程接口)供开发者使用。本教程将通过一个名为"project_micro_blog"的项目,帮助...
- 创建一个新的 Laravel 项目:`composer create-project --prefer-dist laravel/laravel weibo-login` - 配置 `.env` 文件,包括数据库连接、应用密钥等。 - 安装并配置好路由、控制器和视图。 2. **OAuth 授权...
`.classpath`和`.project`文件是Eclipse IDE的项目配置文件,它们定义了项目的构建路径和元数据,帮助开发者在Eclipse环境中管理项目。`.settings`目录则可能包含了项目的特定设置,如编译器选项或格式化规则。 `...
`.classpath`和`.project`文件是Eclipse IDE的配置文件,帮助开发者快速导入和配置工程;`Read me.txt`通常包含SDK的使用指南和注意事项;`.settings`目录则包含了项目的特定配置信息。 为了充分利用这个SDK,...
集成SDK需要在project根目录的build.gradle文件中添加依赖配置,并在module的build.gradle文件中添加依赖和属性配置。此外,还需要在AndroidManifest.xml中添加权限和混淆配置。 5. 初始化SDK 初始化SDK需要在...
在本资源中,我们主要关注的是使用Python3和Django框架构建的一个微博应用。Django是一个强大且流行的Python web框架,它提供了丰富的功能和工具,用于快速开发高效、安全的Web应用程序。Python3是该框架的最新版本...
在`Project`级别的`build.gradle`文件中,你需要在`repositories`块中添加微博SDK的仓库: ```groovy allprojects { repositories { maven { url 'https://dl.bintray.com/thelasterstar/maven/' } } } ``` ...
【标题】:“新浪微博+九宫格快捷分享.zip”是一个与Android开发相关的压缩包,其中包含了一个实现新浪微博九宫格快捷分享功能的源码示例。这个项目可能为开发者提供了如何在Android应用中集成新浪微博分享功能的...
Cong Jin , YDJSIR, Sugar Xu‘s project of 2020 Data Science Basic Course in SWI, NJU. 此为发布开源的版本而不是开发环境中使用的版本。 ## 文件结构 ```bash │ LICENSE │ README.md ├─Analyze # 分析...
基于微博的数据挖掘与社交舆情分析 This project consists of four parts: 1. Crawl weibo data, contain comment、userinfo etc... 2. Process the captured data to the format we want 3. Analyze the data in ...
2. **创建新项目**:在Android Studio中,选择“Start a new Android Studio project”,然后选择"Empty Activity"模板,这将为你创建一个基本的安卓应用结构。 3. **布局设计**:登录界面的核心是XML布局文件,...
2. `.project`:这是Eclipse工作空间项目的配置文件,包含了项目属性和构建设置,帮助IDE识别项目类型和管理构建过程。 3. `default.properties`:旧版Android项目中的配置文件,用于记录项目的基本信息,如最小SDK...
3. **Sina**: 新浪项目可能是抓取新浪新闻或其他相关数据,如微博内容。新浪的网页结构和数据格式可能需要特别的解析技巧,这将有助于你提升处理复杂HTML和XML的能力。 4. **douyuSpider**: 这个项目可能是针对斗鱼...
- Project.xcodeproj:Xcode项目文件,用于在Xcode环境中打开并编辑项目。 - Sources:存放Objective-C或Swift源代码的文件夹。 - Resources:包含图片、故事板、本地化文件等资源。 - Info.plist:应用的配置...
先在 build.gradle(Project:XXXX) 的 repositories 添加: allprojects { repositories { ... maven { url 'https://jitpack.io' } } } >> 2.然后在 build.gradle(Module:app) 的 dependencies 添加: ...
这篇内容将深入解析《安卓Android源码——新浪微博+九宫格快捷分享》的相关知识点,主要涉及Android应用开发、源码分析、微博API集成以及UI设计中的九宫格布局。 首先,Android是Google开发的一种开源移动操作系统...
【作品名称】:基于 python 实现的微博的数据挖掘与社交舆情分析 【适用人群】:适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。 【项目介绍】: ...
在代码结构中,`.classpath`和`.project`是Eclipse项目的配置文件,`src`目录存放源代码,`bin`包含编译后的字节码,`.settings`可能包含了项目的特定设置。`image`目录可能是用于存放待上传图片的,而`jar`文件可能...