Shui-Lung Chuang 庄水龙(UIUC)
2008
Shui-Lung Chuang, Kevin Chen-Chuan Chang: Integrating web query results: holistic schema matching. CIKM 2008: 33-42
2007
Shui-Lung Chuang, Kevin Chen-Chuan Chang, ChengXiang Zhai: Collaborative Wrapping: A Turbo Framework for Web Data Extraction. ICDE 2007: 1261-1262
Zaiqing Nie, Jun Zhu(MSRA)
Zaiqing Nie, Fei Wu, Ji-Rong Wen, Wei-Ying Ma: Extracting Objects from the Web. ICDE 2006:123
Jun Zhu, Zaiqing Nie, Ji-Rong Wen, Bo Zhang, Wei-Ying Ma: 2D Conditional Random Fields for Web information extraction. ICML 2005:1044-1051
Jun Zhu, Zaiqing Nie, Ji-Rong Wen, Bo Zhang, Wei-Ying Ma: Simultaneous record detection and attribute labeling in web data extraction. KDD 2006:494-503
Jun Zhu, Bo Zhang, Zaiqing Nie, Ji-Rong Wen, Hsiao-Wuen Hon: Webpage understanding: an integrated approach. KDD 2007:903-912
Jun Zhu, Zaiqing Nie, Bo Zhang, Ji-Rong Wen: Dynamic hierarchical Markov random fields and their application to web data extraction. ICML 2007: 1175-1182
唐杰(清华)
Xin Xin, Juanzi Li, Jie Tang, Qiong Luo: Academic conference homepage understanding using constrained hierarchical conditional random fields. CIKM 2008: 1301-1310
Huan Wang, Xiaomin Shi, Yan Li, Heng Chang, Weiliang Chen, Jie Tang, Eduardo Martins: User Profile Management for Personalized Telecom Service. ICYCS 2008: 1087-1092
Jie Tang, Jing Zhang, Limin Yao, Juanzi Li, Li Zhang, Zhong Su: ArnetMiner: extraction and mining of academic social networks. KDD 2008: 990-998
Xiao Zhang, Qian Zhong, Juanzi Li, Jie Tang: RiMOM Results for OAEI 2008. OM 2008
Jing Zhang, Jie Tang, Liu Liu, Juan-Zi Li: A Mixture Model for Expert Finding. PAKDD 2008: 466-478
Yize Li, Jie Tang: Expertise Search in a Time-Varying Social Network. WAIM 2008: 293-300
Tak-Lam Wong(香港中文大学)
Tak-Lam Wong, Wai Lam, and Tik-Shun Wong, "An Unsupervised Framework for Extracting and Normalizing Product Attributes from Multiple Web Sites", Proceedings of the Thirty-First Annual International ACM Conference on Research and Development on Information Retrieval (SIGIR), pages 35-42, 2008.
Tak-Lam Wong, Tik-Sun Wong, and Wai Lam, "An Unsupervised Approach for Product Record Normalization across Different Web Sites", Proceedings of the Twenty-Third AAAI Conference on Artificial Intelligence (AAAI), pages 1249-1254, 2008.
Tak-Lam Wong, Wai Lam, Shing-Kit Chan, "Collaborative Information Extraction and Mining from Multiple Web Documents", Proceedings of Sixth SIAM International Conference on Data Mining (SDM), pages 440-450, 2006.
Tak-Lam Wong, Wai Lam, Shing-Kit Chan, "Extracting and Summarizing Hot Item Features across Different Auction Web Sites", Proceedings of Tenth Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD), LNAI 3918, pages 334-345, 2006.
Tak-Lam Wong and Wai Lam, "Learning to Refine Ontology for a New Web Site Using a Bayesian Approach", Proceedings of Fifth SIAM International Conference on Data Mining (SDM), pages 298-309, 2005.
分享到:
相关推荐
在医疗科研和论文撰写中,数据处置和统计分析方法扮演着至关重要的角色。这些方法确保了研究结果的准确...理解和掌握这些方法,能帮助研究人员提高研究质量,避免常见的统计误区,从而为医学领域提供更可靠的研究成果。
例如,在一项社会调查中,研究人员可能需要估计某个城市中成年人的平均收入水平。通过使用适当的抽样方法和统计分析技术,可以有效地从样本数据中得出关于总体的结论。 #### 六、总结 《抽样统计》是一本深入探讨...
根据给定文件的信息,我们可以将知识点分为以下几个方面进行详细的阐述: ### 一、社会研究基础 1. **社会研究的概念特征**:社会研究是社会科学领域内的一种系统性探索活动,旨在通过观察、实验、访谈等多种手段...
分层随机抽样是根据某个因素将母体分为几层,然后在每层进行简单随机抽样;群集随机抽样是将母体分为多个群集,选取一个或多个群集进行抽样;系统随机抽样则是每隔一定数量的单位选取样本,常用于管制图的制作。 非...
统计学在医学领域的作用尤为重要,因为它可以帮助研究人员通过偶然现象洞察潜在的规律,确保研究结论的科学性。医学统计学主要包括四个核心内容:统计设计、数据整理、统计描述和统计推断。 统计设计是指在研究开始...
根据给定文件的信息,我们可以提炼出以下几个关键知识点: ### 一、TS16949与SPC的关系 TS16949是一项国际汽车行业的质量管理体系标准,它基于ISO 9001标准,并增加了汽车行业特有的要求。该标准特别强调了通过...
通过对实验数据的分析,研究人员能够得出相关词提示技术在不同场景下的表现,以及它对提高信息检索质量的具体贡献。例如,如果发现某项技术能够显著提高查准率,则表明这项技术在提升检索效果方面是有效的。 #### ...
简单随机抽样要求每个个体被选中的概率相等,而分层抽样则是将总体按特定属性分成几层,然后从每一层中按比例抽取样本。 2. **样本与总体**:总体是研究对象的全体,而样本是从总体中抽取的一部分观测值(第1题)。...
12. **系统抽样与分层抽样结合**:第十二题中,抽取样本既考虑职位的不同层次(工程师、技术员、技工),也可能使用系统抽样方法,具体取决于抽取的具体步骤。 这些题目和解答展示了随机抽样在实际问题中的应用,...
3. **整群抽样**:不是抽取个体,而是抽取包含多个个体的群体,例如,抽取几个班级而不是单个学生。 4. **系统抽样**:按照某种规则(如间隔)选取样本,比如每隔5个个体抽取一个。 在编程实现中,可能涉及到的算法...
分层法是一种常用的统计分析工具,通过对数据按特定标志进行分类,有助于找出问题的根源,比如人员、机器、材料、方法、测量、时间、环境等因素,进而改进质量管理策略。 此外,分层法常与其他统计工具结合使用,如...
选2-3位操作员在不知情的状况下使用校验合格的量具分别对10个零件进行测量,测试人员将操作员所读数据进行记录,研究其重复性及再现性。 在选择量具时,需要注意量具的精确度应是被测量物品公差的1/10,以避免量具...
1. 不属于描述统计问题的是( )A 根据样本信息对总体进行的推断 .getDescription:描述统计的目的是描述和总结已有的数据,而不是对总体进行推断。描述统计问题包括对数据的描述、数据的可视化、数据的总结等。 2...
对于商业分析师、研究人员和学生来说,这是一个非常实用的功能集合,能够帮助他们从数据中提取有价值的信息,做出更好的决策。 需要注意的是,虽然Excel 2003已经相对较旧,但这些基本的数据分析概念和方法在现代...
统计方法的运用包括群体与样本的概念,明确何时从整个群体中抽取样本进行分析。此外,数据分为计数数据(如合格/不合格)和计量数据(如长度、重量等连续数值),它们的分析方法有所不同,计数数据常用比例或比率...
首先,文档指出在计算机上产生随机数列的通用方法是使用数学算法,这与真正从均匀分布中抽取的随机数不同,因此称之为伪随机数列。这种数列虽然在理论上是确定性的,但只要它们的统计特征(如均匀性和随机性)与真正...
它可以按人员、机器、材料、方法、测量、时间、环境和其他因素进行分层。分层法常与直方图、排列图、控制图、散布图等其他统计工具结合使用,以发现和解决质量问题。 最后,简易图表如饼分图、环形图、雷达图、甘特...
第十二题中,男女运动员的比例为56:42,可以根据这个比例计算出男运动员应抽取的人数。 13. **样本容量的计算** - 根据已知的样本中某一类别产品的数量,以及各类别的比例,可以计算出样本的总容量。第十三题中,...
- **知识点总结**:统计研究中,总体的同质性是进行统计推断的基础之一,但并不是所有情况下都需要完全同质的总体。 7. **质量指标的表述**: - **正确答案**:错 - **知识点总结**:质量指标虽然是反映总体质量...
5. **统计方法的选择**:问题8中,测量心跳次数的方法,乙同学的建议可能更具有代表性,因为10秒内的数据乘以6通常比2分钟除以2更接近实际的平均值,减少了时间间隔带来的误差。 6. **数据变化趋势分析**:问题9...