这个练习会使用SAP HANA Express Edition的文本语义分析引擎对JSON格式的documents进行语义分析。
首先创建一个column table,对其index开启fuzzy text search(模糊搜索)功能。
上述描述的操作可以用下面的SQL语句来完成:
create column table food_analysis
(
name nvarchar(64),
description text FAST PREPROCESS ON FUZZY SEARCH INDEX ON
);
其中description字段开启了模糊搜索功能。
将存储于名为doc_store的document store collection里的json key-value键值对拷贝到刚刚创建的数据库表里:
insert into food_analysis with doc_store as (select "name", "description" from food_collection) select doc_store."name" as name, doc_store."description" as description from doc_store;
执行上述的sql语句,确保数据全部拷贝到数据库表food_analysis中:
使用下列的sql语句对description字段进行模糊搜索:
select name, score() as similarity, TO_VARCHAR(description) from food_analysis where contains(description, 'nuts', fuzzy(0.5,'textsearch=compare')) order by similarity desc
执行结果:
HANA Express Edition里的linguistic 文本分析步骤也比较简单。
首先还是创建一个数据库表:
create column table food_sentiment ( name nvarchar(64) primary key, description nvarchar(2048) );
将document store里的json数据拷贝到数据库表里:
insert into food_sentiment with doc_store as (select "name", "description" from food_collection) select doc_store."name" as name, doc_store."description" as description from doc_store;
针对description字段创建一个新的index:
CREATE FULLTEXT INDEX FOOD_SENTIMENT_INDEX ON "FOOD_SENTIMENT" ("DESCRIPTION") CONFIGURATION 'GRAMMATICAL_ROLE_ANALYSIS' LANGUAGE DETECTION ('EN') SEARCH ONLY OFF FAST PREPROCESS OFF TEXT MINING OFF TOKEN SEPARATORS '' TEXT ANALYSIS ON;
上述SQL语句会自动创建一个名为$TA_FOOD_SENTIMENT_INDEX的文本分析表:
该表里的内容:
由此可以发现,之前我们导入到数据库表里的英文句子,被HANA text engine拆解成单词,并且每个单词的词性也自动被HANA解析出来了。
相关推荐
标题和描述中提到的知识点有:SAP HANA内存使用分析、SAP技术顾问或 Basis相关人员、通过SQL语句进行分析。 在SAP HANA数据库中,内存是最重要的资源之一。内存的使用情况对于SAP HANA系统的性能有着直接影响。因此...
SAP HANA Express 版提供了多种可选包以增强其功能,包括但不限于文本分析、流数据分析、企业架构设计等。 ##### 4.1 安装文本分析文件包 对于需要进行大量文本处理的应用场景,安装文本分析文件包可以提高文本处理...
2.8.22是该数据库系统的一个版本号,代表着在该版本中,SAP对HANA进行了多方面的优化和更新,以提供更高效、稳定的服务。 在描述中提到的"含ODBC"意味着此版本的SAP HANA客户端包含了Open Database Connectivity...
SAP HANA是SAP公司推出的一款高性能数据库产品,它能够处理大量的数据并提供实时分析能力,满足现代企业对业务数据处理和分析的需求。HANA支持多种数据类型,包括结构化数据和非结构化数据,支持数据存储、处理、...
6. **报表和分析**:使用BusinessObjects工具集,可以直接在HANA Studio中创建和编辑报表,进行数据可视化。 7. **系统管理和监控**:监控HANA系统的健康状态,包括性能指标、日志查看和报警设置。 SAP HANA ...
最后,SAP HANA 2.0 提供了丰富的分析功能,包括预测分析、机器学习和文本分析。这些功能可以帮助企业从大量数据中提取价值,实现智能决策和自动化流程。 总结来说,SAP HANA Platform 2.0 提供了一个强大且全面的...
在安装 SAP HANA 之前,需要进行软硬件规划。软硬件规划包括选择适合的服务器、存储设备和操作系统。 Huawei FusionServer RH5885H&RH8100 V3 是一个高性能的服务器,适合运行 SAP HANA。Huawei OceanStor 5500 V3 ...
SAP HANA是一个高性能的内存数据库系统,它提供了一系列功能强大的工具来进行数据分析、应用开发、存储过程编写等操作。其中,对于存储过程的调试是开发者日常开发工作中的一个重要环节,SAP HANA为存储过程提供了...
文档中描述了如何安装SAP HANA Express Edition、配置相关工具及如何通过虚拟机方法进行安装。此指南主要针对英文版本的安装,但文档内容部分由于扫描识别问题可能存在字符错误。尽管如此,我们仍可从中提炼出关键的...
6. SAP HANA 应用模式:SAP HANA提供了多种应用模式,例如报表、分析和数据挖掘等,能够满足客户对数据分析和处理的需求。 7. 高性能内存数据库:SAP HANA是一种高性能内存数据库,能够实时处理大量数据,具有高...
HXEDownloadManager_win.EXE WINDOWS版本 sap HANA express 下载工具
SAP HANA Developer Quick Start Guide For SAP HANA XS Classic Model SAP HANA Platform 2.0 SPS 00 Document Version: 1.0 – 2016-11-30 from: ...
这份手册旨在确保SAP HANA数据库的高可用性(HA)和灾难恢复能力,通过系统复制技术,可以在主系统发生故障时,无缝切换到备用系统,保证业务连续性。 SAP HANA System Replication是一种实时数据同步机制,它将一...
使用SAP HANA Studio,可以快速创建和管理SAP HANA数据库,进行数据分析和报表生成。 3.1 使用SAP HANA模型器 SAP HANA模型器是一个基于图形用户界面的开发工具,能够提供实时的数据分析和报表生成能力。使用SAP ...
SAP HANA Studio是SAP公司为开发和管理SAP HANA数据库系统提供的一款集成开发环境(IDE)。在Windows平台上,版本2.4.126是该工具的一个特定更新,它包含了各种改进和增强功能,旨在提升开发人员的工作效率和数据库...
SAP HANA Studio是SAP公司为开发和管理SAP HANA数据库提供的集成开发环境(IDE)。这个2.3.37版本的压缩包包含了所有必要的工具,使得开发者和管理员能够充分利用SAP HANA的强大功能。 SAP HANA本身是一个高性能的...
SAP HANA运维工具 自动化脚本 备份工具 SAP HANA运维工具 自动化脚本 备份工具
SAP HANA Studio是一款专为SAP HANA数据库设计的集成开发环境(IDE),它提供了全方位的工具和服务,便于开发者、管理员以及数据分析师对HANA系统进行管理和开发。这款工具在X64平台上运行,其Version 2.3.37确保了...
整体而言,SAP HANA的详细操作文档是一份深入的技术参考资料,旨在帮助合作伙伴和应用顾问更好地理解和运用SAP HANA数据库,以支持企业客户进行高效的数据处理和分析。由于是内部培训资料,文档中的信息可能不是公开...