微软亚洲研究院的文章确实在数量、质量上都算得上高产,很值得我们学习。这里总结一下他们近几年在知名会议上发表的和信息抽取相关的文章。
[1] Zaiqing Nie, Yunxiao Ma, Shuming Shi, Ji-Rong Wen, and Wei-Ying Ma. Web Object Retrieval. WWW 2007.
[2] Li Zhuang, Feng Jing, Xiao-Yan Zhu. Movie Review Mining and Summarization. CIKM 2006.
[3] Jizhou Huang, Ming Zhou, and Dan Yang. Extracting Chatbot Knowledge from Online Discussion Forums. IJCAI 2007.
[4] Jun Zhu, Zaiqing Nie, Bo Zhang, and Ji-Rong Wen. Dynamic Hierarchical Markov Random Fields and their Application to Web Data Extraction. ICML 2007.
[5] Shuyi Zheng, Di Wu, Ruihua Song, and JiRong Wen. Towards Joint Optimization of Wrapper Generation and Template Detection. SIGKDD 2007.
[6] Jun Zhu, Zaiqing Nie, Ji-Rong Wen, Bo Zhang, and Hsiao-Wuen Hon. Webpage Understanding: an Integrated Approach. SIGKDD 2007.
[7] Jun Zhu, Zaiqing Nie, Ji-Rong Wen, Bo Zhang, and Wei-Ying Ma. Simultaneous Record Detection and Attribute Labeling in Web Data Extraction. SIGKDD 2006.
分享到:
相关推荐
信息抽取(Information Extraction,简称IE)是计算机科学领域的一个重要分支,主要目标是从大量非结构化文本中自动抽取有意义的信息并转化为结构化的形式。在这个领域,我们通常关注的关键任务包括实体识别、关系...
在IT行业中,自动抽取文章中心思想是一项重要的自然语言处理任务,它涉及到文本挖掘、信息检索以及人工智能等多个领域。这项技术的主要目标是从大量的文本数据中快速提取出关键信息,帮助读者理解文章的核心要点,...
同时,结合本体(Ontology)的信息抽取研究也日益受到关注,本体能够提供领域知识的结构化表示,有助于提高信息抽取的准确性和智能性。 #### 面临的挑战与未来方向 尽管Web信息抽取技术取得了显著进展,但仍面临...
信息抽取(Information Extraction,简称IE)是自然语言...通过其内置的ANNIE和JAPE,以及多语言工具和评估组件,GATE不仅有助于研究人员和开发者进行语言学分析,还能够支持在实际应用中快速开发和部署信息抽取系统。
### 基于WEB的快速信息抽取技术的研究和实现 #### 摘要与背景介绍 随着互联网技术的快速发展,网络已经成为人们获取信息的主要渠道之一。然而,互联网上的信息庞大而繁杂,如何从海量信息中高效、准确地提取出有...
### 中文信息抽取关键技术研究与实现 #### 一、引言 随着互联网技术的飞速发展,信息量呈爆炸式增长。如何从海量的电子文档中高效、准确地获取所需信息成为了亟需解决的关键问题之一。信息抽取技术应运而生,它...
文章在研究中还提到了大数据信息抽取算法的研究现状。国内外对大数据信息抽取的研究主要集中在数据产生频率分析、数据存储位置的具体分析、以及基于挖掘的数据信息来提升整体数据收集性能等方面。通过这些分析,算法...
"基于HMM_BP混合模型的文本信息抽取研究" 本文主要介绍了一种基于HMM和BP混合模型的文本信息抽取研究。该混合模型通过结合HMM和BP网络模型的优点,弥补了两者的缺点,从而提高了文本信息抽取的精度和召回率。 首先...
### 微软研究院分词标准 #### 概述 微软研究院分词标准是针对中文文本的一种规范化处理方式,主要用于自然语言处理(NLP)领域,特别是机器翻译、文本分类、情感分析等应用中。该标准定义了如何将中文连续文本切...
ChineseNERMSRA是微软亚洲研究院开发的一个中文命名实体识别(NER)系统。该系统专为中文文本设计,利用深度学习技术,尤其是序列标注模型,来精准地识别文本中的实体。它的出现极大地推动了中文NLP领域的发展,为...
生物医学领域作为科学研究和技术发展的重要分支,近年来随着信息技术的飞速进步,文本信息抽取技术得到了迅猛发展,尤其是在自然语言处理(NLP)领域的研究和应用不断深化。本文献综述提供了生物医学领域中文本信息...
通用抽取引擎框架_一种新的Web信息抽取方法的研究
### 信息抽取技术及其发展前景分析 #### 一、引言 信息抽取技术作为一种重要的自然语言处理技术,在当今...通过对现有技术的研究和发展,我们有望实现更加高效、准确的信息抽取,为用户提供更好的信息服务和支持。