`

project weibo

 
阅读更多

jishigou  / thinksns

 

每天自动化批量获取weibo食堂----美食菜谱图片吻

下载固定微博页面文件index.php?mod=yugao008准备调试脚本,并展示文件名
[root@localhost ~]# wget http://weibo.cns*****.com/index.php?mod=yugao008 | ls -l index.php\?mod\=yugao008
-rw-r--r-- 1 root root 135540 04-23 11:37 index.php?mod=yugao008
搜索图片文件含o.jpg关键词的行,并展示
[root@localhost ~]# grep 'o.jpg" class="artZoomAll"' index.php\?mod\=yugao008 | more
    <li><a href="http://weibo.cns*****.com/images/topic/9/39/75512_o.jpg" class="artZoomAll" rel="http://weibo.cns*****.com/images/topic/9/39/75512_s.jpg" rev="1444907_lLhRjs"><img  src="http://wei 
    *.com/images/topic/9/39/75512_s.jpg" /></a></li> 
    <li><a href="http://weibo.cns*****.com/images/topic/3/27/75505_o.jpg" class="artZoomAll" rel="http://weibo.cns*****.com/images/topic/3/27/75505_s.jpg" rev="1444805_LiCXAH"><img  src="http://wei 
    *.com/images/topic/3/27/75505_s.jpg" /></a></li> 
    <li><a href="http://weibo.cns*****.com/images/topic/e/19/75506_o.jpg" class="artZoomAll" rel="http://weibo.cns*****.com/images/topic/e/19/75506_s.jpg" rev="1444805_LiCXAH"><img  src="http://wei 
    *.com/images/topic/e/19/75506_s.jpg" /></a></li>  
搜索图片文件含o.jpg关键词的行,以awk截取引号分割第二段url另存为$(hostname)_$(date +%Y%m%d%H%M%S).txt文件,并展示各文件
[root@locahost ~]# grep 'o.jpg" class="artZoomAll"' index.php\?mod\=yugao008 | awk -F "\"" '{print $2}' > $(hostname)_$(date +%Y%m%d%H%M%S).txt | ls -l $(hostname)*.txt
-rw-r--r-- 1 root root 1286 04-23 12:59 lindows_20130423125938.txt
-rw-r--r-- 1 root root 1286 04-23 14:49 lindows_20130423144952.txt
-rw-r--r-- 1 root root 1286 04-23 14:49 lindows_20130423144957.txt
-rw-r--r-- 1 root root 1286 04-23 14:51 lindows_20130423145111.txt
-rw-r--r-- 1 root root 1286 04-23 14:51 lindows_20130423145149.txt
-rw-r--r-- 1 root root 1286 04-23 14:53 lindows_20130423145307.txt
、、、
搜索图片文件含o.jpg关键词的行,以awk截取引号分割第二段url另存为$(hostname)_$(date +%Y%m%d%H%M%S).txt文件,并展示各文件名及其内容
[root@localhost ~]# ls -l $(hostname)*.txt
[root@localhost ~]# more lindows_20130423125938.txt
http://weibo.cns*****.com/images/topic/9/39/75512_o.jpg
http://weibo.cns*****.com/images/topic/3/27/75505_o.jpg
http://weibo.cns*****.com/images/topic/e/19/75506_o.jpg
http://weibo.cns*****.com/images/topic/d/82/75500_o.jpg
http://weibo.cns*****.com/images/topic/9/45/75501_o.jpg
、、、
搜索所有$(hostname)*.txt文件里含http关键词的行并展示各文件名和内容
[root@localhost ~]# grep 'o.jpg" class="artZoomAll"' index.php\?mod\=yugao008 | awk -F "\"" '{print $2}' > $(hostname)_$(date +%Y%m%d%H%M%S).txt | grep http $(hostname)*.txt | more
lindows_20130423144952.txt:http://weibo.cns*****.com/images/topic/9/45/75501_o.jpg
lindows_20130423144952.txt:http://weibo.cns*****.com/images/topic/0/17/75458_o.jpg
lindows_20130423144952.txt:http://weibo.cns*****.com/images/topic/c/99/75459_o.jpg
lindows_20130423144952.txt:http://weibo.cns*****.com/images/topic/b/28/75454_o.jpg
、、、
搜索所有$(hostname)*.txt文件里含http关键词的行,删除lindows*.txt:的文字后,排序且删除重复项后并展示
[root@localhost ~]# grep 'o.jpg" class="artZoomAll"' index.php\?mod\=yugao008 | awk -F "\"" '{print $2}' > $(hostname)_$(date +%Y%m%d%H%M%S).txt | grep http $(hostname)*.txt | awk -F "txt:" '{print $2}' | sort | uniq | more
http://weibo.cns*****.com/images/topic/0/17/75458_o.jpg
http://weibo.cns*****.com/images/topic/0/20/75450_o.jpg
http://weibo.cns*****.com/images/topic/3/25/75423_o.jpg
http://weibo.cns*****.com/images/topic/3/27/75505_o.jpg
http://weibo.cns*****.com/images/topic/3/82/75455_o.jpg
http://weibo.cns*****.com/images/topic/4/27/75302_o.jpg
http://weibo.cns*****.com/images/topic/5/27/75276_o.jpg
http://weibo.cns*****.com/images/topic/6/0/75351_o.jpg
http://weibo.cns*****.com/images/topic/6/3/75390_o.jpg
、、、
搜索所有$(hostname)*.txt文件里含http关键词的行,删除lindows*.txt:的文字后,排序且删除重复项后并展示,并批量下载所有jpg到指定目录/home/lindows/
[root@locahost ~]# grep 'o.jpg" class="artZoomAll"' index.php\?mod\=yugao008 | awk -F "\"" '{print $2}' > $(hostname)_$(date +%Y%m%d%H%M%S).txt | grep http $(hostname)*.txt | awk -F "txt:" '{print $2}' | sort | uniq | more | xargs -I {} wget -P /home/lindows/ {}
加载Redhat Linux Crontab 列表 / 每天中午11点定时下载美食图片
[root@locahost ~]# crontab -e
# 每天10:30下载新文件index.php?mod=yugao008
30 10 * * * wget http://weibo.cnsu****.com/index.php?mod=yugao008
# 每天11:00根据新文件index.php?mod=yugao008匹配一定规则自动下载指定美食菜谱图片
0 11 * * * grep 'o.jpg" class="artZoomAll"' index.php\?mod\=yugao008 | awk -F "\"" '{print $2}' > $(hostname)_$(date +%Y%m%d%H%M%S).txt | grep http $(hostname)*.txt | awk -F "txt:" '{print $2}' | sort | uniq | more | xargs -I {} wget -P /home/lindows/ {}
ok
 
 
 
 
 
 
 
 
 

 
  • A餐厅套餐

  • 绍兴酱鸭
  • 全家福
  • 青椒炒蛋
  • 地瓜炒猪肝
  • 蒜泥生菜
  • 白菜面筋包
  • 笋瓜蛋汤
  • A餐厅特色菜肴

  • 湘味鲫鱼
  • 干切牛肉
  • 毛豆烧鸡
  • 骨肉相连
  • 银鱼蒸蛋
  • 白菜面筋包
  • 青椒炒蛋
  • 莴笋鸡柳
  • 青椒酱干丝
  • 青菜粉丝
  • 韭菜绿豆芽
  • 姜米包菜
  • 酸菜鱼
  • 黄焖鸡
  • 香锅鱼头
  • 牛肉砂锅
  • 红油大虾
  • 平桥豆腐羹
  • 鸭血粉丝
  • 鸡蛋炒饭
  • 三鲜炒面
  • 鲜肉馄饨
  • 鲜肉锅贴
  • 经理餐厅套餐

  • 年糕炒小排
  • 蒜柱青龙鱼
  • 口味酸菜鸡
  • 胡萝卜烧羊肉
  • 江南捞百叶
  • 淮扬小炒
  • 花菜肉片
  • 油面筋白菜
  • 蒜泥苋菜
  • 萝卜小排饭
  • 三鲜炒面
  • 酒粮小元宵
  • 经理餐厅冷盘点心

  • 盐水鸭
  • 心里美拌海蜇
  • 麻油肚丝
  • 麻辣翅尖
  • 蜜汁芋艿
  • 盐水花生
  • 韩国泡菜
  • 台湾豆腐
  • B餐厅套餐

  • 牛肉汉堡
  • 红烧鸡腿
  • 鱼香肉丝
  • 清蒸鸡蛋
  • 油渣大白菜
  • 韭菜豆芽
  • 笋瓜蛋汤
  • B餐厅零点和小吃

  • 泉水鱼
  • 金陵烤鸭
  • 荠菜香干
  • 西红柿炒蛋
  • 干锅鸭
  • 罗汉观斋
  • 咕噜素肉
  • 浇汁臭豆腐
  • 酱炒牛蛙
  • 香辣羊肉卷
  • 三鲜砂锅
  • 辣子大虾
  • 扬州狮子头
  • 剁椒黄鱼
  • 金陵烤鸡
  • 莲藕鸡片

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  • 柠檬厅

  • 套餐茨菰烧肉
  • 青豆香菇鸡上腿
  • 杂烩
  • 麻辣豆腐
  • 包菜炒蛋
  • 蒜泥菠菜
  • 青椒土豆丝
  • 大白菜蛋汤
  • 特色菜酸菜牛蛙
  • 青椒姬菇炒肉片
  • 肉沫蒸鸡蛋
  • 腌菜牛肉锅
  • 大碗菜毛血旺
  • 酸菜鱼
  • 鲫鱼蒸鸡蛋
  • 水煮牛肉片
  • 盖浇饭小排盖浇饭
  • 萝卜烧肉
  • 姬菇鸡蛋肉片
  • 烤鸭盖浇饭
  • 面条小排面
  • 香肠面
  • 大肠面
  • 中西明档类

  • 碳烤蒜茸虾
  • 碳烤全家福
  • 碳烤剁椒鱼头
  • 干锅牛蛙
  • 金陵烤鸭
  • 川香口水鸡
  • 莴笋拌鸭肫
  • 香辣鸭脖
  • 腐竹拌花生
  • 四喜烤麸
  • 香菜拌香干
  • 朝鲜泡菜
  • 明档类

  • 碳烤香辣翅
  • 川香牛杂
  • 港式煲仔饭
  • 牛肉砂锅
  • 菌菇砂锅
  • 羊肉锅仔
  • 小六碳烤鱼
  • 小六杂鱼锅
  • 小六碳烤江支鱼
  • 萝卜乌贼锅仔
  • 牛筋牛腩锅仔
  • 咸肉河蚌锅仔
  • 大脸鸡排
  • 秘制烤全翅
  • 鱼籽鱼泡锅仔
  • 鲶鱼豆腐盆菜
  • 秦川臊子面
  • 炸酱面
  • 香菇仔鸡面
  • 特色瓦罐面
  • 红烧排骨面
  • 红汤馄饨
  • 西餐类

  • 咖喱鸡配饭
  • 韩式腊味炒饭
  • 韩式烤肉配饭
  • 三鲜乌冬面
  • 黑森林
  • 抹茶水果
  • 奶油水果
  • 大理石
  • 椰蓉软包
  • 原味黄油蛋糕
  • 竹炭面包
  • 原味玛芬
  • 中餐类

  • 青菜肉圆盖浇饭
  • 红烧排骨盖浇饭
  • 青椒香干炒肉丝
  • 毛豆烧仔鸡
  • 红烧鲫鱼
  • 小炒肉
  • 红椒莴笋炒肉片
  • 黄瓜鸡蛋
  • 干锅包菜
  • 干椒绿豆芽
  • 蒜泥菜秧
  • 大碗菜类

  • 黄焖鸡米饭
  • 羊肉汤
  • 牛肉汤
  • 酸菜鱼面
  • 红烧排骨面
  • 香菇仔鸡面
  • 酸菜鱼瓦罐面
  • 红烧排骨瓦罐面
  • 香菇仔鸡瓦罐面
  • 川味小炒肉石锅饭
  • 酸菜鸡块石锅饭
  • 腌菜烧肉石锅饭

 

http://book.js165.com/iread/wml/p/help.jsp;jsessionid=36DF9F47C606A8ACA5D00AEB14255A0E

 

Apache Tomcat/5.5.27

 

 

【e悦读介绍】

e悦读是江苏新华传媒与江苏联通合作推出的手机阅读服务。e悦读注重寻求特色化的阅读资源,致力于为江苏联通用户提供具有地区特色的和更具吸引力的阅读服务。e悦读业务自2012年1月1日起试运营。

【资费说明】

好消息,新年送大礼!e悦读全站图书大开放,免费看!在e悦读试运营期间,江苏联通用户在省内访问e悦读站点将不收取流量费和信息费。试运营期结束之后,e悦读将按标准资费收费。e悦读试运营期的截止日期以站内公告为准。e悦读自此将会矢志不渝地更好的完善平台服务,以回馈您的支持和厚爱,感谢您的关注。

常规的手机阅读产品资费包括三个部分:点播信息费、包月信息费和流量费。

1.点播资费:主要包括按章、按本收费两种资费。按章标准资费每章0.10元-0.12元不等;具体资费以用户点播提醒为准。按本标准资费为2-3元/本。

2.包月产品按价格分为二类:2元优惠包和4元优惠包。2元优惠包可选择2本单本图书;4元优惠包可选择6本单本图书。退订包月后可享受所有包月特权至当月底;连载中小说不参与优惠包。

【分类介绍】

目前e悦读图书共有15个杂类,主要包括:全本频道、名家推荐、言情小说、玄幻穿越、武侠仙侠、历史军事、幽默短篇、灵异悬疑、影视文学、教育教辅等类型图书。

【排行榜介绍】

排行榜根据读者对每一本书的在当周内、当月内及历史累计点击数的多少分周榜、月榜和总榜由高到低依次排列。

【搜索介绍】

手机阅读的搜索功能具有模糊搜索的能力,无论输入书名,作者名或者关键字、词均可以进行搜索。

【书架介绍】

书架里可以查询用户自己最近阅读过的书籍、自己的消费记录、自己的包月书包以及自己的书籍收藏目录。

【听书帮助】

e悦读用户如果遇到听书功能无法正常使用的情况,请参看以下使用帮助:

a.目前e悦读手机听书功能支持苹果和安卓系统,其他系统暂不支持;b.安装最新版的flash插件。下载地址:http://dl.pconline.com.cn/download/77813.html;c.请优先使用手机自带浏览器,其他的如UC、QQ浏览器也可备选。

附:下载插件会产生流量费,请尽量使用Wi-Fi下载,以节约您的套餐流量。

【字数设置介绍】

字数设置分500字、1000字、2000字三种模式。设置方法:阅读页→页面下方字数设置。

备注:由于手机性能所限,每页显示1000或以上字数可能会因为容量太大导致页面无法打开。如果你使用的是型号和款式比较旧的手机,建议采用500字/页阅读。

 

end

分享到:
评论

相关推荐

    微博权限管理系统Project

    微博权限管理系统是一个针对微博平台进行用户权限控制的项目,它涉及到多方面的IT技术与概念。在深入探讨这个项目之前,让我们先理解一下“权限管理”的基本含义。权限管理是信息系统中一个关键的组成部分,用于控制...

    腾讯微博api封装

    `.settings`、`.project`和`.classpath`是Eclipse或IDEA等开发环境的配置文件,帮助管理项目结构和编译设置。 封装完成后,开发者只需要引入这个库,就可以方便地使用腾讯微博的功能,无需关心底层的实现细节。这...

    适合初学者学习的微博demo

    《微博API调用初学者教程:基于project_micro_blog项目》 在互联网社交领域,微博作为一个重要的平台,提供了丰富的API(应用程序编程接口)供开发者使用。本教程将通过一个名为"project_micro_blog"的项目,帮助...

    基于laravel模拟微博登陆

    - 创建一个新的 Laravel 项目:`composer create-project --prefer-dist laravel/laravel weibo-login` - 配置 `.env` 文件,包括数据库连接、应用密钥等。 - 安装并配置好路由、控制器和视图。 2. **OAuth 授权...

    Java版腾讯微博OAuth2.0授权可发文本微博示例代码

    `.classpath`和`.project`文件是Eclipse IDE的项目配置文件,它们定义了项目的构建路径和元数据,帮助开发者在Eclipse环境中管理项目。`.settings`目录则可能包含了项目的特定设置,如编译器选项或格式化规则。 `...

    腾讯微博开放平台Java开发SDK

    `.classpath`和`.project`文件是Eclipse IDE的配置文件,帮助开发者快速导入和配置工程;`Read me.txt`通常包含SDK的使用指南和注意事项;`.settings`目录则包含了项目的特定配置信息。 为了充分利用这个SDK,...

    微博Android SDK使用指南_v11.11.11

    集成SDK需要在project根目录的build.gradle文件中添加依赖配置,并在module的build.gradle文件中添加依赖和属性配置。此外,还需要在AndroidManifest.xml中添加权限和混淆配置。 5. 初始化SDK 初始化SDK需要在...

    python3+Django微博源代码和开发环境

    在本资源中,我们主要关注的是使用Python3和Django框架构建的一个微博应用。Django是一个强大且流行的Python web框架,它提供了丰富的功能和工具,用于快速开发高效、安全的Web应用程序。Python3是该框架的最新版本...

    微博Android SDK使用指南_v9.12.0.pdf

    在`Project`级别的`build.gradle`文件中,你需要在`repositories`块中添加微博SDK的仓库: ```groovy allprojects { repositories { maven { url 'https://dl.bintray.com/thelasterstar/maven/' } } } ``` ...

    新浪微博+九宫格快捷分享.zip

    【标题】:“新浪微博+九宫格快捷分享.zip”是一个与Android开发相关的压缩包,其中包含了一个实现新浪微博九宫格快捷分享功能的源码示例。这个项目可能为开发者提供了如何在Android应用中集成新浪微博分享功能的...

    疫情背景下,基于情感词典和机器学习对新闻和微博评论的情感分析

    Cong Jin , YDJSIR, Sugar Xu‘s project of 2020 Data Science Basic Course in SWI, NJU. 此为发布开源的版本而不是开发环境中使用的版本。 ## 文件结构 ```bash │ LICENSE │ README.md ├─Analyze # 分析...

    基于微博的数据挖掘与社交舆情分析.zip

    基于微博的数据挖掘与社交舆情分析 This project consists of four parts: 1. Crawl weibo data, contain comment、userinfo etc... 2. Process the captured data to the format we want 3. Analyze the data in ...

    用安卓做的微博登陸界面

    2. **创建新项目**:在Android Studio中,选择“Start a new Android Studio project”,然后选择"Empty Activity"模板,这将为你创建一个基本的安卓应用结构。 3. **布局设计**:登录界面的核心是XML布局文件,...

    android微博开发工程的源代码

    2. `.project`:这是Eclipse工作空间项目的配置文件,包含了项目属性和构建设置,帮助IDE识别项目类型和管理构建过程。 3. `default.properties`:旧版Android项目中的配置文件,用于记录项目的基本信息,如最小SDK...

    scrapyProject.rar

    3. **Sina**: 新浪项目可能是抓取新浪新闻或其他相关数据,如微博内容。新浪的网页结构和数据格式可能需要特别的解析技巧,这将有助于你提升处理复杂HTML和XML的能力。 4. **douyuSpider**: 这个项目可能是针对斗鱼...

    微博包含ios.zip

    - Project.xcodeproj:Xcode项目文件,用于在Xcode环境中打开并编辑项目。 - Sources:存放Objective-C或Swift源代码的文件夹。 - Resources:包含图片、故事板、本地化文件等资源。 - Info.plist:应用的配置...

    Android代码-仿微博带自定义身份标识和进度条的圆形头像

    先在 build.gradle(Project:XXXX) 的 repositories 添加: allprojects { repositories { ... maven { url 'https://jitpack.io' } } } &gt;&gt; 2.然后在 build.gradle(Module:app) 的 dependencies 添加: ...

    安卓Android源码——新浪微博+九宫格快捷分享.zip

    这篇内容将深入解析《安卓Android源码——新浪微博+九宫格快捷分享》的相关知识点,主要涉及Android应用开发、源码分析、微博API集成以及UI设计中的九宫格布局。 首先,Android是Google开发的一种开源移动操作系统...

    基于 python 实现的微博的数据挖掘与社交舆情分析

    【作品名称】:基于 python 实现的微博的数据挖掘与社交舆情分析 【适用人群】:适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。 【项目介绍】: ...

    Java版|腾讯微博|OAuth2.0授权|官方方法|可发文本和图片|示例代码

    在代码结构中,`.classpath`和`.project`是Eclipse项目的配置文件,`src`目录存放源代码,`bin`包含编译后的字节码,`.settings`可能包含了项目的特定设置。`image`目录可能是用于存放待上传图片的,而`jar`文件可能...

Global site tag (gtag.js) - Google Analytics