信息检索
信息提取
一般而言,信息抽取系统进行的工作是这样一个计算机程序系统,这个系统的输入时非受限的文本,系统按照用户的预期,从文本中提取出用户预先指定的某些类型的信息。
实质上,信息抽取系统进行的工作是从非结构化的文本中提取结构化的信息。
信息提取系统的应用价值在:(1)情报收集;(2)科技文献监控;(3)医疗保健服务;(4)商业信息提取。其中商业信息提取的应用中,可以专门设计一个信息提取系统,分析新闻中的商业信息,提取诸如有关公司合并、合并的参与方以及合并涉及金额等信息,提供决策支持信息。
信息提取的具体任务:(1)准确识别文本中的各种命名实体,这一般包括文本中出现的人名、地名、机构名、时间表示、货币表示以及各种数字等等;(2)准确识别并标记指称相同的不同语言元素,这种指称相同的语言元素一般称为共指;(3)利用领域知识进行推理,在实体—实体之间,实体—事件之间建立关系。
- 大小: 6.5 KB
- 大小: 28.8 KB
分享到:
相关推荐
《计算语言学》是北京大学中文系的一门重要课程,由著名学者俞士汶教授与詹卫东老师共同讲授。这门课程深入探讨了如何利用计算机处理和理解自然语言,涵盖了语言学、计算机科学和人工智能等多个领域的交叉知识。在本...
计算语言学是一门交叉学科,它融合了计算机科学、人工智能、语言学以及统计学等多个领域的理论与技术,主要目标是对人类自然语言进行处理、理解和生成。在这个领域中,计算机被用来分析、解释和生成人类语言数据,...
### 计算语言学概论知识点解析 #### 一、课程基本信息 - **课程名称**:计算语言学概论 - **主讲人**:詹卫东 - **所在单位**:北京大学中文系 - **在线资源地址**:[http://ccl.pku.edu.cn/doubtfire/]...
2. **人工智能与智能系统**:清华大学的张钹教授专注于人工智能、神经网络、遗传算法、智能机器人等领域,而北京大学的俞士汶教授则在计算语言学和自然语言处理方面有深入研究。 3. **计算机网络**:吴建平(清华...
描述中还提到了使用Matlab进行仿真实验,Matlab是一种用于数值计算、可视化以及编程的高级语言和交互式环境,广泛应用于工程计算、控制设计、信号处理等领域。仿真实验的结果表明,在翻译评分方面,改进PSO-BP神经...