`
touchinsert
  • 浏览: 1314121 次
  • 性别: Icon_minigender_1
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

用统计方法进行信息抽取的几位研究人员

 
阅读更多

Shui-Lung Chuang 庄水龙(UIUC)

2008

Shui-Lung Chuang, Kevin Chen-Chuan Chang: Integrating web query results: holistic schema matching. CIKM 2008: 33-42

2007

Shui-Lung Chuang, Kevin Chen-Chuan Chang, ChengXiang Zhai: Collaborative Wrapping: A Turbo Framework for Web Data Extraction. ICDE 2007: 1261-1262

Zaiqing Nie, Jun Zhu(MSRA)

Zaiqing Nie, Fei Wu, Ji-Rong Wen, Wei-Ying Ma: Extracting Objects from the Web. ICDE 2006:123

Jun Zhu, Zaiqing Nie, Ji-Rong Wen, Bo Zhang, Wei-Ying Ma: 2D Conditional Random Fields for Web information extraction. ICML 2005:1044-1051

Jun Zhu, Zaiqing Nie, Ji-Rong Wen, Bo Zhang, Wei-Ying Ma: Simultaneous record detection and attribute labeling in web data extraction. KDD 2006:494-503

Jun Zhu, Bo Zhang, Zaiqing Nie, Ji-Rong Wen, Hsiao-Wuen Hon: Webpage understanding: an integrated approach. KDD 2007:903-912

Jun Zhu, Zaiqing Nie, Bo Zhang, Ji-Rong Wen: Dynamic hierarchical Markov random fields and their application to web data extraction. ICML 2007: 1175-1182

唐杰(清华)

Xin Xin, Juanzi Li, Jie Tang, Qiong Luo: Academic conference homepage understanding using constrained hierarchical conditional random fields. CIKM 2008: 1301-1310

Huan Wang, Xiaomin Shi, Yan Li, Heng Chang, Weiliang Chen, Jie Tang, Eduardo Martins: User Profile Management for Personalized Telecom Service. ICYCS 2008: 1087-1092

Jie Tang, Jing Zhang, Limin Yao, Juanzi Li, Li Zhang, Zhong Su: ArnetMiner: extraction and mining of academic social networks. KDD 2008: 990-998

Xiao Zhang, Qian Zhong, Juanzi Li, Jie Tang: RiMOM Results for OAEI 2008. OM 2008

Jing Zhang, Jie Tang, Liu Liu, Juan-Zi Li: A Mixture Model for Expert Finding. PAKDD 2008: 466-478

Yize Li, Jie Tang: Expertise Search in a Time-Varying Social Network. WAIM 2008: 293-300

Tak-Lam Wong(香港中文大学)

Tak-Lam Wong, Wai Lam, and Tik-Shun Wong, "An Unsupervised Framework for Extracting and Normalizing Product Attributes from Multiple Web Sites", Proceedings of the Thirty-First Annual International ACM Conference on Research and Development on Information Retrieval (SIGIR), pages 35-42, 2008.

Tak-Lam Wong, Tik-Sun Wong, and Wai Lam, "An Unsupervised Approach for Product Record Normalization across Different Web Sites", Proceedings of the Twenty-Third AAAI Conference on Artificial Intelligence (AAAI), pages 1249-1254, 2008.

Tak-Lam Wong, Wai Lam, Shing-Kit Chan, "Collaborative Information Extraction and Mining from Multiple Web Documents", Proceedings of Sixth SIAM International Conference on Data Mining (SDM), pages 440-450, 2006.

Tak-Lam Wong, Wai Lam, Shing-Kit Chan, "Extracting and Summarizing Hot Item Features across Different Auction Web Sites", Proceedings of Tenth Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD), LNAI 3918, pages 334-345, 2006.

Tak-Lam Wong and Wai Lam, "Learning to Refine Ontology for a New Web Site Using a Bayesian Approach", Proceedings of Fifth SIAM International Conference on Data Mining (SDM), pages 298-309, 2005.

分享到:
评论

相关推荐

    医疗科研和论文撰写中常用的数据处置和统计分析方法培训课件.ppt

    在医疗科研和论文撰写中,数据处置和统计分析方法扮演着至关重要的角色。这些方法确保了研究结果的准确...理解和掌握这些方法,能帮助研究人员提高研究质量,避免常见的统计误区,从而为医学领域提供更可靠的研究成果。

    抽样统计 Sampling Statistics 数学

    例如,在一项社会调查中,研究人员可能需要估计某个城市中成年人的平均收入水平。通过使用适当的抽样方法和统计分析技术,可以有效地从样本数据中得出关于总体的结论。 #### 六、总结 《抽样统计》是一本深入探讨...

    甘肃农业大学729社会研究方法2021年考研专业课初试大纲.pdf

    根据给定文件的信息,我们可以将知识点分为以下几个方面进行详细的阐述: ### 一、社会研究基础 1. **社会研究的概念特征**:社会研究是社会科学领域内的一种系统性探索活动,旨在通过观察、实验、访谈等多种手段...

    SPC统计制程管制99051343.pptx

    分层随机抽样是根据某个因素将母体分为几层,然后在每层进行简单随机抽样;群集随机抽样是将母体分为多个群集,选取一个或多个群集进行抽样;系统随机抽样则是每隔一定数量的单位选取样本,常用于管制图的制作。 非...

    医学统计学知识点.doc

    统计学在医学领域的作用尤为重要,因为它可以帮助研究人员通过偶然现象洞察潜在的规律,确保研究结论的科学性。医学统计学主要包括四个核心内容:统计设计、数据整理、统计描述和统计推断。 统计设计是指在研究开始...

    TS16949:2009-SPC统计过程控制培训教材(第二版)-最新版

    根据给定文件的信息,我们可以提炼出以下几个关键知识点: ### 一、TS16949与SPC的关系 TS16949是一项国际汽车行业的质量管理体系标准,它基于ISO 9001标准,并增加了汽车行业特有的要求。该标准特别强调了通过...

    信息检索系统的相关词提示技术与评测.pdf

    通过对实验数据的分析,研究人员能够得出相关词提示技术在不同场景下的表现,以及它对提高信息检索质量的具体贡献。例如,如果发现某项技术能够显著提高查准率,则表明这项技术在提升检索效果方面是有效的。 #### ...

    苏教版必修三第2章统计作业题及答案解析11套12精选.docx

    简单随机抽样要求每个个体被选中的概率相等,而分层抽样则是将总体按特定属性分成几层,然后从每一层中按比例抽取样本。 2. **样本与总体**:总体是研究对象的全体,而样本是从总体中抽取的一部分观测值(第1题)。...

    2014届高考数学一轮 知识点各个击破 第十章 第一节 随机抽样追踪训练 文(含解析)新人教A版

    12. **系统抽样与分层抽样结合**:第十二题中,抽取样本既考虑职位的不同层次(工程师、技术员、技工),也可能使用系统抽样方法,具体取决于抽取的具体步骤。 这些题目和解答展示了随机抽样在实际问题中的应用,...

    Random-sample-analysis.zip_random

    3. **整群抽样**:不是抽取个体,而是抽取包含多个个体的群体,例如,抽取几个班级而不是单个学生。 4. **系统抽样**:按照某种规则(如间隔)选取样本,比如每隔5个个体抽取一个。 在编程实现中,可能涉及到的算法...

    企业质量管理的培训资料.pptx

    分层法是一种常用的统计分析工具,通过对数据按特定标志进行分类,有助于找出问题的根源,比如人员、机器、材料、方法、测量、时间、环境等因素,进而改进质量管理策略。 此外,分层法常与其他统计工具结合使用,如...

    MSA测量系统分析.pdf

    选2-3位操作员在不知情的状况下使用校验合格的量具分别对10个零件进行测量,测试人员将操作员所读数据进行记录,研究其重复性及再现性。 在选择量具时,需要注意量具的精确度应是被测量物品公差的1/10,以避免量具...

    统计学考试试题(卷)A与答案解析.doc

    1. 不属于描述统计问题的是( )A 根据样本信息对总体进行的推断 .getDescription:描述统计的目的是描述和总结已有的数据,而不是对总体进行推断。描述统计问题包括对数据的描述、数据的可视化、数据的总结等。 2...

    excel2003 分析工具库

    对于商业分析师、研究人员和学生来说,这是一个非常实用的功能集合,能够帮助他们从数据中提取有价值的信息,做出更好的决策。 需要注意的是,虽然Excel 2003已经相对较旧,但这些基本的数据分析概念和方法在现代...

    SPC在制程中的应用.pptx

    统计方法的运用包括群体与样本的概念,明确何时从整个群体中抽取样本进行分析。此外,数据分为计数数据(如合格/不合格)和计量数据(如长度、重量等连续数值),它们的分析方法有所不同,计数数据常用比例或比率...

    伪随机数生成算法及比较.pdf

    首先,文档指出在计算机上产生随机数列的通用方法是使用数学算法,这与真正从均匀分布中抽取的随机数不同,因此称之为伪随机数列。这种数列虽然在理论上是确定性的,但只要它们的统计特征(如均匀性和随机性)与真正...

    05142 质量管理培训(PPT 31页).ppt

    它可以按人员、机器、材料、方法、测量、时间、环境和其他因素进行分层。分层法常与直方图、排列图、控制图、散布图等其他统计工具结合使用,以发现和解决质量问题。 最后,简易图表如饼分图、环形图、雷达图、甘特...

    高中数学 第二章 统计优秀学生寒假必做作业练习二 新人教A版必修3 试题.doc

    第十二题中,男女运动员的比例为56:42,可以根据这个比例计算出男运动员应抽取的人数。 13. **样本容量的计算** - 根据已知的样本中某一类别产品的数量,以及各类别的比例,可以计算出样本的总容量。第十三题中,...

    复习统计学备考

    - **知识点总结**:统计研究中,总体的同质性是进行统计推断的基础之一,但并不是所有情况下都需要完全同质的总体。 7. **质量指标的表述**: - **正确答案**:错 - **知识点总结**:质量指标虽然是反映总体质量...

    第十章数据的收集整理与描述能力测试题及答案精选.doc

    5. **统计方法的选择**:问题8中,测量心跳次数的方法,乙同学的建议可能更具有代表性,因为10秒内的数据乘以6通常比2分钟除以2更接近实际的平均值,减少了时间间隔带来的误差。 6. **数据变化趋势分析**:问题9...

Global site tag (gtag.js) - Google Analytics