`
Yinny
  • 浏览: 295815 次
  • 性别: Icon_minigender_2
  • 来自: 杭州
社区版块
存档分类
最新评论

提取各大类目下分享量top500的用户的需求总结

阅读更多
历经了一周几乎天天加班的日子,终于把这个提取靠谱数据的复杂规则需求搞定了,现在对做这次需求做一些总结:
①、接到需求时是三周以前,当时改需求的优先级并不高,所以先忙于其他淘单的优化点,之后的一周里我把提取数据的hive和会调用的接口都已经整理好,但是一直没有开始在云梯上执行,原因是之前志宏说在做每一个需求之前自己把思路理清楚,设计流程跟他讲一遍,避免一些错误和弯路,而他那阶段比较忙,所以拖了几天也没空帮我review一下提取流程,于是我在这几天里也没有做,虽然第二周来我没有等他review就决定自己先去做了,但是因为提取过程比较复杂还是导致后面的时间比较紧张,几乎天天加班,这次我时间安排不合理是影响日常进度的一个重要原因,虽然PM没时间,但是我自己要主动去做这个事情,除了写好hive之外还可以把调用接口判断排除卖家账号,排除黑名单用户,根据评论实拍图排序等代码写好,先测试保证功能正确,之后在跑数据时候不懂的地方再请教一下,这样我就有足够的时间来完成这个需求了,虽然在这过程中可能会出现一些弯路或者错误,但这样才能真正获得成长,这是我总结反思并且日后要改进的第一点;
②、在写代码时候,考虑不全面,走了些弯路,在过滤不合格用户时候只是读取id文件对id进行过滤没有把用户对应的分享数量count同时过滤掉,导致了得到最终用户群体时候,用户id和count无法做匹配了,只能又写方法取读取最早从云梯上获取的表(userId,count),用最终用户id去判断取出count,正确的做法应该是:在第一次读取文件时候就应该把id 和count一起读取进来,对用户进行过滤时候顺便就可以过滤掉对应的count,这样可以避免循环读取文件操作;
③、整个代码里对map的使用过多,不仅耗内存,也被其的生命周期管理搞得很晕,稍不留神就容易出错,昨天听了志宏给我讲解他的设计思路,整个代码里面基本没有用到map,一个一个userId走完所有的流程,比较清晰,而我是单个个批量操作混合在一起,感觉有点乱,因为这个代码基本是一次性使用的,所以后续不想去优化了,嘿嘿;
④、在写代码的时候犯了很多低级错误,这是十分不应该的,浪费了很多时间去检查,以后要改正,写代码时候要集中精力,不要心不在焉,写完之后做一遍大致的检查,把明显的错误排除掉!!
⑤、有时候是想得清楚过程,但是不完全写的出来,这个还是基础不牢,项目经验少,要在平时加强学习和练习并沉淀,赶快成长起来。
分享到:
评论
1 楼 sfdev 2012-04-27  
对第3点,不能放弃优化,这种优化一定要去实战不然成长还只是停留在理论阶段!可以仅仅针对你用map实现的那一段代码进行优化,可以不在项目代码库中优化,但可以单独领出来在自己的本地测试工程里面做优化对比,一个是基于map实现,一个是基于非map实现,实现之后两者做对比,也可以在周分享会上看大家有没有更好的实现方案;
第5点,可以多尝试在纸质笔记本上画画流程图、写写方法级的伪代码和注释,可以很好的帮助理清思路;

相关推荐

    维基百科类目层次结构提取

    维基百科类目层次结构提取是一项重要的数据挖掘任务,它涉及到对维基百科庞大的信息库进行有组织的、结构化的访问。在这个过程中,我们可以利用HTMLParser这个Java库来解析HTML文档,提取出维基百科页面中的类目链接...

    淘宝top40万类目词库-pc端.xlsx

    淘宝top40万类目词库-pc端 电脑端

    淘宝全类目top20w关键词表.xlsx

    电商,淘宝全类目TOP20万搜索词记录表

    淘宝top20万类目词库-无线端.xlsx

    淘宝top20万类目词库

    淘宝类目大全 详细类目 一级类目 二级类目 三级类目 详细精准

    三级类目的设置极大地丰富了淘宝商品的分类体系,使得每个商品都能被归入最合适的类目之下。 ### 三、淘宝类目在电商中的作用 1. **提高用户体验**:通过清晰的类目划分,用户能够更快地找到自己想要购买的商品,...

    类目改造-需求及线框图_产品矩阵线框图

    例如,如果用户经常在某个类目下迷失,或者搜索结果不准确,那么这些都可能是需求分析的重点。 接下来,线框图是产品设计中的关键工具,用于可视化地呈现界面元素和交互流程。在“产品矩阵线框图(Trader)”中,...

    【解数】酒类行业调研:大类目下细分火热赛道数据趋势.pdf

    - 从2017年到2020年,销售额在每年的1月、6月、11月和12月达到高峰,尤其是1月,接近春节,消费者需求激增,而这些月份也正值大促销活动,比如双11、双12等,能够显著提升销售额。 - 2月销售额通常较低,这是由于1...

    淘宝类目查询工具 宝贝类目一键查询软件 天猫分类查询

    淘宝类目查询工具是一款专为电商从业者设计的实用软件,主要功能是帮助用户快速、准确地查询淘宝和天猫平台上的商品所属类别。在电子商务日益发达的今天,了解正确的商品类目对于商家至关重要,因为它直接影响到商品...

    2020年天猫美妆(彩妆_香水_美妆工具)业绩占比TOP10类目.xls

    2020年天猫美妆(彩妆_香水_美妆工具)业绩占比TOP10类目.xls

    淘宝分类ID,类目列表,详情准确,类目大全

    总结来说,淘宝分类ID和类目列表是商家进行精准营销和提升销售业绩的重要工具。理解并正确使用这些数据,可以帮助商家更好地融入淘宝的庞大生态系统,提高商品的可见性和销售效率。因此,无论是新手还是经验丰富的...

    自然语言处理数据集-52万件商品一千多个类目,近150 万用户,近800 万条评论评分数据.rar

    这样的数据量使得它成为训练和评估NLP模型的理想选择,尤其是在情感分析、语义理解、推荐系统和用户行为分析等方面。 首先,从自然语言处理的角度来看,这个数据集可以用于训练文本分类模型。每个商品评论都可以视...

    商品三级类目

    "商品三级类目"是指在商品分类体系中采用三层结构的分类方式,这样的设计有助于实现更精细化的分类,提高用户体验和运营效率。 一、商品三级类目简介 商品三级类目是一种将商品按照大类、中类、小类三层结构进行...

    淘宝商品类目(含四级类目)

    自己整理的淘宝商品全部类目,包含了四级类目,信息为各类目的名称,类目id,类目层级 更新于2020年11月,该文件为sql文件

    淘宝商品类目体系

    在淘宝和天猫这两个中国最大的在线购物平台上,商品类目体系是组织和分类商品的重要方式,帮助用户快速找到他们想要购买的产品。这个体系包含了类目ID和类目名称之间的映射关系,使得每个商品都有一个明确的类别归属...

    淘宝类目.zip

    2019年7月发布的这个“淘宝类目.zip”压缩包提供了最新的淘宝商品分类信息,涵盖了sql、word、excel三种常用的数据格式,以满足不同用户的需求。 首先,我们来看`tb_cat_copy.sql`文件,这是一个SQL数据库文件,...

    淘宝网的所有类目汇总

    在“电子产品”这一大类下,我们可以看到一些常见的电子产品分类: - **CPU**:中央处理器,是电脑的核心部件。 - **DVD**:数字多功能光盘,用于存储数据、视频等。 - **CRT**:阴极射线管显示器,一种较老式的...

    2022年淘宝标准类目数据

    它按照商品的特性、用途等进行划分,形成一套完整的分类体系,如数码家电、服装鞋帽、家居百货等大类,再到每个大类下的子类目,如数码家电中的手机、电视、电脑等。类目结构清晰,便于消费者快速定位到自己感兴趣的...

    真实类目跳转代码

    在深入探讨“真实类目跳转代码”这一主题前,我们先来理解其核心概念。“真实类目跳转代码”,通常指的是在Web开发领域中,用于实现从当前页面跳转到另一特定页面或类目的代码片段。这类代码主要用于改善用户体验,...

    最新淘宝类目.zip

    5. 路径:类目在整个类目树中的路径,例如“0/1/2”,表示当前类目在顶级类目0下,次级类目1下,再次级类目2下。 6. ID路径:类目ID组成的路径,与路径字段类似,但使用ID而非类目名称,便于程序处理。 这些数据...

    最新淘宝商品类目数据.sql

    用户在导入此文件后,将能够查询和分析各种类目下的商品数量、销售额、热门商品分布等信息。 总结来说,这个“最新淘宝商品类目数据.sql”文件提供了淘宝平台的最新商品分类信息,对于研究淘宝市场趋势、优化店铺...

Global site tag (gtag.js) - Google Analytics