这个练习会使用SAP HANA Express Edition的文本语义分析引擎对JSON格式的documents进行语义分析。
首先创建一个column table,对其index开启fuzzy text search(模糊搜索)功能。
上述描述的操作可以用下面的SQL语句来完成:
create column table food_analysis
(
name nvarchar(64),
description text FAST PREPROCESS ON FUZZY SEARCH INDEX ON
);
其中description字段开启了模糊搜索功能。
将存储于名为doc_store的document store collection里的json key-value键值对拷贝到刚刚创建的数据库表里:
insert into food_analysis with doc_store as (select "name", "description" from food_collection) select doc_store."name" as name, doc_store."description" as description from doc_store;
执行上述的sql语句,确保数据全部拷贝到数据库表food_analysis中:
使用下列的sql语句对description字段进行模糊搜索:
select name, score() as similarity, TO_VARCHAR(description) from food_analysis where contains(description, 'nuts', fuzzy(0.5,'textsearch=compare')) order by similarity desc
执行结果:
HANA Express Edition里的linguistic 文本分析步骤也比较简单。
首先还是创建一个数据库表:
create column table food_sentiment ( name nvarchar(64) primary key, description nvarchar(2048) );
将document store里的json数据拷贝到数据库表里:
insert into food_sentiment with doc_store as (select "name", "description" from food_collection) select doc_store."name" as name, doc_store."description" as description from doc_store;
针对description字段创建一个新的index:
CREATE FULLTEXT INDEX FOOD_SENTIMENT_INDEX ON "FOOD_SENTIMENT" ("DESCRIPTION") CONFIGURATION 'GRAMMATICAL_ROLE_ANALYSIS' LANGUAGE DETECTION ('EN') SEARCH ONLY OFF FAST PREPROCESS OFF TEXT MINING OFF TOKEN SEPARATORS '' TEXT ANALYSIS ON;
上述SQL语句会自动创建一个名为$TA_FOOD_SENTIMENT_INDEX的文本分析表:
该表里的内容:
由此可以发现,之前我们导入到数据库表里的英文句子,被HANA text engine拆解成单词,并且每个单词的词性也自动被HANA解析出来了。
相关推荐
SAP HANA Express 版提供了多种可选包以增强其功能,包括但不限于文本分析、流数据分析、企业架构设计等。 ##### 4.1 安装文本分析文件包 对于需要进行大量文本处理的应用场景,安装文本分析文件包可以提高文本处理...
7. 测试SAP HANA Express Edition(Test SAPHANA, express edition): 安装完成后,需要进行测试来验证HANA Express Edition是否安装成功并且能够正常工作。 8. 安装可选组件(Installing Optional Packages): ...
SAP HANA Express Edition是SAP HANA的一个免费版本,特别适合开发、学习和小型项目,它提供了一部分SAP HANA的核心功能,包括内存计算和数据处理能力。 标签 "jdbc" 明确了此压缩包的核心内容,即与JDBC相关的技术...
总的来说,SAP官方下载平台是获取SAP产品和服务的重要途径,而HXE Download Manager则是Linux用户便捷下载和管理SAP HANA Express Edition的实用工具。通过这个工具,你可以轻松地将SAP HANA集成到你的开发和测试...
这里所描述的是一个SAP HANA Express Edition的安装过程,这是一个免费的SAP HANA版本,适合初学者进行学习和实验。文中所提及的安装过程还包含了一些扩展虚拟机硬盘空间的方法,以便可以适用于内存要求较高的应用。...
根据提供的文件信息,这份指南主要介绍了如何通过虚拟机方法安装和使用SAP HANA 2.0 express edition,也就是SAP HANA的开源版本,适用于想体验SAP HANA数据库和应用平台的开发者和用户。以下是对文件中提及的知识点...
HANA2.0 SPS00(SAP HANA Express Edition)需要满足两个条件(操作系统版本为SUSE12 SP1):'libgcc_s1'至少为version 5.3.1和'libstdc++6'至少为version 5.3.1。
教程:使用SAP HANA Express Edition在本地进行开发并部署到Cloud Foundry 方案概述 通过SAP HANA 1 SPS 11,SAP引入了一种主要的新应用程序服务器体系结构:用于SAP HANA的扩展应用程序服务,内部高级模型(XS ...