`
JerryWang_SAP
  • 浏览: 1030455 次
  • 性别: Icon_minigender_1
  • 来自: 成都
文章分类
社区版块
存档分类
最新评论

在SAP HANA Express Edition里进行文本分析

阅读更多

这个练习会使用SAP HANA Express Edition的文本语义分析引擎对JSON格式的documents进行语义分析。

 

首先创建一个column table,对其index开启fuzzy text search(模糊搜索)功能。

 

上述描述的操作可以用下面的SQL语句来完成:

 

create column table food_analysis

(

name nvarchar(64),

description text FAST PREPROCESS ON FUZZY SEARCH INDEX ON

);

 

其中description字段开启了模糊搜索功能。

 

将存储于名为doc_store的document store collection里的json key-value键值对拷贝到刚刚创建的数据库表里:

insert into food_analysis with doc_store as (select "name", "description" from food_collection) select doc_store."name" as name, doc_store."description" as description from doc_store;

 

执行上述的sql语句,确保数据全部拷贝到数据库表food_analysis中:

 

 

 

使用下列的sql语句对description字段进行模糊搜索:

select name, score() as similarity, TO_VARCHAR(description) from food_analysis where contains(description, 'nuts', fuzzy(0.5,'textsearch=compare')) order by similarity desc

 

执行结果:

 

 

HANA Express Edition里的linguistic 文本分析步骤也比较简单。

 

首先还是创建一个数据库表:

create column table food_sentiment ( name nvarchar(64) primary key, description nvarchar(2048) );

 

将document store里的json数据拷贝到数据库表里:

insert into food_sentiment with doc_store as (select "name", "description" from food_collection) select doc_store."name" as name, doc_store."description" as description from doc_store;

 

针对description字段创建一个新的index:

 

CREATE FULLTEXT INDEX FOOD_SENTIMENT_INDEX ON "FOOD_SENTIMENT" ("DESCRIPTION") CONFIGURATION 'GRAMMATICAL_ROLE_ANALYSIS' LANGUAGE DETECTION ('EN') SEARCH ONLY OFF FAST PREPROCESS OFF TEXT MINING OFF TOKEN SEPARATORS '' TEXT ANALYSIS ON;

 

上述SQL语句会自动创建一个名为$TA_FOOD_SENTIMENT_INDEX的文本分析表:

该表里的内容:

 

 

由此可以发现,之前我们导入到数据库表里的英文句子,被HANA text engine拆解成单词,并且每个单词的词性也自动被HANA解析出来了。

0
2
分享到:
评论

相关推荐

    SAP HANA 内存使用分析

    标题和描述中提到的知识点有:SAP HANA内存使用分析、SAP技术顾问或 Basis相关人员、通过SQL语句进行分析。 在SAP HANA数据库中,内存是最重要的资源之一。内存的使用情况对于SAP HANA系统的性能有着直接影响。因此...

    hana express VM Env

    SAP HANA Express 版提供了多种可选包以增强其功能,包括但不限于文本分析、流数据分析、企业架构设计等。 ##### 4.1 安装文本分析文件包 对于需要进行大量文本处理的应用场景,安装文本分析文件包可以提高文本处理...

    SAP HANA 数据库 2.8.22 含 ODBC

    2.8.22是该数据库系统的一个版本号,代表着在该版本中,SAP对HANA进行了多方面的优化和更新,以提供更高效、稳定的服务。 在描述中提到的"含ODBC"意味着此版本的SAP HANA客户端包含了Open Database Connectivity...

    SAP HANA操作手册

    SAP HANA是SAP公司推出的一款高性能数据库产品,它能够处理大量的数据并提供实时分析能力,满足现代企业对业务数据处理和分析的需求。HANA支持多种数据类型,包括结构化数据和非结构化数据,支持数据存储、处理、...

    SAP HANA-STUDIO 安装包

    6. **报表和分析**:使用BusinessObjects工具集,可以直接在HANA Studio中创建和编辑报表,进行数据可视化。 7. **系统管理和监控**:监控HANA系统的健康状态,包括性能指标、日志查看和报警设置。 SAP HANA ...

    SAP HANA Platform 2.0参考手册完整版

    最后,SAP HANA 2.0 提供了丰富的分析功能,包括预测分析、机器学习和文本分析。这些功能可以帮助企业从大量数据中提取价值,实现智能决策和自动化流程。 总结来说,SAP HANA Platform 2.0 提供了一个强大且全面的...

    华为 SAP HANA一体机 集群安装指南(RH5885H&RH8100 V3+5500 V3+SLES12SP1)02.pdf

    在安装 SAP HANA 之前,需要进行软硬件规划。软硬件规划包括选择适合的服务器、存储设备和操作系统。 Huawei FusionServer RH5885H&RH8100 V3 是一个高性能的服务器,适合运行 SAP HANA。Huawei OceanStor 5500 V3 ...

    SAP HANA 中调试存储过程

    SAP HANA是一个高性能的内存数据库系统,它提供了一系列功能强大的工具来进行数据分析、应用开发、存储过程编写等操作。其中,对于存储过程的调试是开发者日常开发工作中的一个重要环节,SAP HANA为存储过程提供了...

    hana快递版安装说明

    文档中描述了如何安装SAP HANA Express Edition、配置相关工具及如何通过虚拟机方法进行安装。此指南主要针对英文版本的安装,但文档内容部分由于扫描识别问题可能存在字符错误。尽管如此,我们仍可从中提炼出关键的...

    华为SAP HANA一体机技术白皮书(单机方案).pdf

    6. SAP HANA 应用模式:SAP HANA提供了多种应用模式,例如报表、分析和数据挖掘等,能够满足客户对数据分析和处理的需求。 7. 高性能内存数据库:SAP HANA是一种高性能内存数据库,能够实时处理大量数据,具有高...

    HXEDownloadManager_win sap HANA express 下载工具

    HXEDownloadManager_win.EXE WINDOWS版本 sap HANA express 下载工具

    SAP HANA Developer Quick Start Guide For SAP HANA XS Classic Model

    SAP HANA Developer Quick Start Guide For SAP HANA XS Classic Model SAP HANA Platform 2.0 SPS 00 Document Version: 1.0 – 2016-11-30 from: ...

    SAP HANA SR配置手册

    这份手册旨在确保SAP HANA数据库的高可用性(HA)和灾难恢复能力,通过系统复制技术,可以在主系统发生故障时,无缝切换到备用系统,保证业务连续性。 SAP HANA System Replication是一种实时数据同步机制,它将一...

    SAPHANA数据库.pdf

    使用SAP HANA Studio,可以快速创建和管理SAP HANA数据库,进行数据分析和报表生成。 3.1 使用SAP HANA模型器 SAP HANA模型器是一个基于图形用户界面的开发工具,能够提供实时的数据分析和报表生成能力。使用SAP ...

    SAP HANA studio window版本2.4.126

    SAP HANA Studio是SAP公司为开发和管理SAP HANA数据库系统提供的一款集成开发环境(IDE)。在Windows平台上,版本2.4.126是该工具的一个特定更新,它包含了各种改进和增强功能,旨在提升开发人员的工作效率和数据库...

    SAP_HANA_STUDIO_X64_2.3.37.zip

    SAP HANA Studio是SAP公司为开发和管理SAP HANA数据库提供的集成开发环境(IDE)。这个2.3.37版本的压缩包包含了所有必要的工具,使得开发者和管理员能够充分利用SAP HANA的强大功能。 SAP HANA本身是一个高性能的...

    SAP HANA运维文档

    SAP HANA运维工具 自动化脚本 备份工具 SAP HANA运维工具 自动化脚本 备份工具

    SAP HANA STUDIO X64 Version: 2.3.37

    SAP HANA Studio是一款专为SAP HANA数据库设计的集成开发环境(IDE),它提供了全方位的工具和服务,便于开发者、管理员以及数据分析师对HANA系统进行管理和开发。这款工具在X64平台上运行,其Version 2.3.37确保了...

    SAP hana详细操作文档

    整体而言,SAP HANA的详细操作文档是一份深入的技术参考资料,旨在帮助合作伙伴和应用顾问更好地理解和运用SAP HANA数据库,以支持企业客户进行高效的数据处理和分析。由于是内部培训资料,文档中的信息可能不是公开...

Global site tag (gtag.js) - Google Analytics