`
JerryWang_SAP
  • 浏览: 1064461 次
  • 性别: Icon_minigender_1
  • 来自: 成都
文章分类
社区版块
存档分类
最新评论

在SAP HANA Express Edition里进行文本分析

阅读更多

这个练习会使用SAP HANA Express Edition的文本语义分析引擎对JSON格式的documents进行语义分析。

 

首先创建一个column table,对其index开启fuzzy text search(模糊搜索)功能。

 

上述描述的操作可以用下面的SQL语句来完成:

 

create column table food_analysis

(

name nvarchar(64),

description text FAST PREPROCESS ON FUZZY SEARCH INDEX ON

);

 

其中description字段开启了模糊搜索功能。

 

将存储于名为doc_store的document store collection里的json key-value键值对拷贝到刚刚创建的数据库表里:

insert into food_analysis with doc_store as (select "name", "description" from food_collection) select doc_store."name" as name, doc_store."description" as description from doc_store;

 

执行上述的sql语句,确保数据全部拷贝到数据库表food_analysis中:

 

 

 

使用下列的sql语句对description字段进行模糊搜索:

select name, score() as similarity, TO_VARCHAR(description) from food_analysis where contains(description, 'nuts', fuzzy(0.5,'textsearch=compare')) order by similarity desc

 

执行结果:

 

 

HANA Express Edition里的linguistic 文本分析步骤也比较简单。

 

首先还是创建一个数据库表:

create column table food_sentiment ( name nvarchar(64) primary key, description nvarchar(2048) );

 

将document store里的json数据拷贝到数据库表里:

insert into food_sentiment with doc_store as (select "name", "description" from food_collection) select doc_store."name" as name, doc_store."description" as description from doc_store;

 

针对description字段创建一个新的index:

 

CREATE FULLTEXT INDEX FOOD_SENTIMENT_INDEX ON "FOOD_SENTIMENT" ("DESCRIPTION") CONFIGURATION 'GRAMMATICAL_ROLE_ANALYSIS' LANGUAGE DETECTION ('EN') SEARCH ONLY OFF FAST PREPROCESS OFF TEXT MINING OFF TOKEN SEPARATORS '' TEXT ANALYSIS ON;

 

上述SQL语句会自动创建一个名为$TA_FOOD_SENTIMENT_INDEX的文本分析表:

该表里的内容:

 

 

由此可以发现,之前我们导入到数据库表里的英文句子,被HANA text engine拆解成单词,并且每个单词的词性也自动被HANA解析出来了。

0
2
分享到:
评论

相关推荐

    hana express VM Env

    SAP HANA Express 版提供了多种可选包以增强其功能,包括但不限于文本分析、流数据分析、企业架构设计等。 ##### 4.1 安装文本分析文件包 对于需要进行大量文本处理的应用场景,安装文本分析文件包可以提高文本处理...

    hana快递版安装说明

    7. 测试SAP HANA Express Edition(Test SAPHANA, express edition): 安装完成后,需要进行测试来验证HANA Express Edition是否安装成功并且能够正常工作。 8. 安装可选组件(Installing Optional Packages): ...

    ngdbc_for_sap_hana.rar

    SAP HANA Express Edition是SAP HANA的一个免费版本,特别适合开发、学习和小型项目,它提供了一部分SAP HANA的核心功能,包括内存计算和数据处理能力。 标签 "jdbc" 明确了此压缩包的核心内容,即与JDBC相关的技术...

    SAP 官方下载平台

    总的来说,SAP官方下载平台是获取SAP产品和服务的重要途径,而HXE Download Manager则是Linux用户便捷下载和管理SAP HANA Express Edition的实用工具。通过这个工具,你可以轻松地将SAP HANA集成到你的开发和测试...

    HANA2.0 环境搭建.pdf

    这里所描述的是一个SAP HANA Express Edition的安装过程,这是一个免费的SAP HANA版本,适合初学者进行学习和实验。文中所提及的安装过程还包含了一些扩展虚拟机硬盘空间的方法,以便可以适用于内存要求较高的应用。...

    Getting_Started_HANAexpress_VM.pdf

    根据提供的文件信息,这份指南主要介绍了如何通过虚拟机方法安装和使用SAP HANA 2.0 express edition,也就是SAP HANA的开源版本,适用于想体验SAP HANA数据库和应用平台的开发者和用户。以下是对文件中提及的知识点...

    HANA2.0升级所需RPM包

    HANA2.0 SPS00(SAP HANA Express Edition)需要满足两个条件(操作系统版本为SUSE12 SP1):'libgcc_s1'至少为version 5.3.1和'libstdc++6'至少为version 5.3.1。

    cloud-xsa-hybrid-deployment-tutorial:本教程中的多目标应用程序将使用微服务构建,并利用强大的HANA数据库功能与灵活的云技术相结合

    教程:使用SAP HANA Express Edition在本地进行开发并部署到Cloud Foundry 方案概述 通过SAP HANA 1 SPS 11,SAP引入了一种主要的新应用程序服务器体系结构:用于SAP HANA的扩展应用程序服务,内部高级模型(XS ...

Global site tag (gtag.js) - Google Analytics