`
isiqi
  • 浏览: 16466933 次
  • 性别: Icon_minigender_1
  • 来自: 济南
社区版块
存档分类
最新评论

使用COMPOSE和UNISTR 创建沉音字符

阅读更多

很多语言,包括英语在内,都使用沉音字符(accented character)。因为这些字符不属于 ASCII 字符集,所以如果不查看 Unicode 值也不使用 Unicode 编辑器并将其转成一个已知字符集,就很难编写使用这些字符的代码。

Oracle9i 引入了 COMPOSE 函数,该函数接受一串 Unicode 字符并规则化其文本。这就意味着它可以接受一个字母和一个组合标记,比如说‘a'(Unicode 字符0097)和沉音符(Unicode 字符0300),然后创建一个单独的由两个标记组合而成的字符。COMPOSE 使用特殊的组合标记,而没有使用 ASCII 中相应的音节标记,它所使用的特殊的组合标记是 Unicode 标准 的一部分。上面的例子的结果应该是 Unicode 字符00E0(有一个沉音符的小写拉丁字母‘a')。

在 ANSI 中最常见的组合字符有:

· U+0300:沉音符(grave accent)( ` )

· U+0301:重音符(acute accent)( ' )

· U+0302:抑扬音符号(circumflex accent)(^)

· U+0303:颚化符号(tilde)(~)

· U+0308:元音变音

如果没有特殊的软件或者键盘驱动程序的话,很难在键盘上输入 Unicode 字符0097和0300。因此,以纯 ASCII 文本输入 Unicode 序列的一个方法是使用 UNISTR 函数。这个函数接受一个 ASCII 字符串然后以国家字符集(通常作为16位 Unicode 或者 UTF-8 字符集安装)创建一个 Unicode 字符的序列。它使用十六进制占位符序列映射任何非 ASCII 字符,映射方式与 Java 类似。

要输入 a 后接一个沉音符组合字符的序列,可以使用 UNISTR(‘a\0300'),而不要试图直接在代码中输入字符。这个函数在任何字符集以及任何具有基于 Unicode 的国家字符集的数据库下都可以正常运行。可以将多个组合字符放在函数中——可以在 UNISTR 函数中混合使用 ASCII 和 Unicode 占位符。例如,可以像下面这样使用 UNISTR 函数:

select COMPOSE(UNISTR('Unless you are nai\0308ve, meet me at the cafe\0301 with
your re\0301sume\0301.')) from dual;

在将 UNISTR 函数的输出与 COMPOSE 组合时,可以在不查找任何值的情况下生成一个 Unicode 字符。例如:

select 'it is true' if compose(unistr('a\0300')) = unistr('\00e0');

COMPOSE 函数返回一个NVARCHAR2 字符串,返回的NVARCHAR2 字符串通常是基于 Unicode 的。如果是在本地使用这些字符,在结果中具有一个隐式地 TO_CHAR 时,数据库将尝试将 Unicode 字符映射到本地字符集。不是所有的字符都可以被映射,有一些字符组合在 COMPOSE 中不能工作,因为 Unicode 协会没有在 Oracle 所用的级别定义它们。

要快速地检查字符如何在一个特定的环境下查询,可以运行一个与下面的脚本类似的脚本,以查看在输出组合字符如何被映射。你可能需要确定一下NLS_LANG 设置以确保这些字符正确地返回:

create or replace type hexrange_tbl as table of varchar2(4);
/
show errors;

create or replace function hexrange(n1 varchar2,n2 varchar2)
return hexrange_tbl pipelined
is
begin
for i in to_number(n1,'000X') .. to_number(n2,'000X') loop
pipe row(to_char(i,'FM000X'));
end loop;
return;
end hexrange;
/
show errors;

select column_value composer,
compose(unistr('a\'||column_value)) a,
compose(unistr('c\'||column_value)) c,
compose(unistr('e\'||column_value)) e,
compose(unistr('i\'||column_value)) i,
compose(unistr('n\'||column_value)) n,
compose(unistr('o\'||column_value)) o,
compose(unistr('r\'||column_value)) r,
compose(unistr('s\'||column_value)) s,
compose(unistr('u\'||column_value)) u,
compose(unistr('y\'||column_value)) y
from table(hexrange('0300','0327')) x;

下面轻松一下,这里有一小段 PL/SQL 脚本,这段脚本使用COMPOSE 和UNISTR 创建一种特殊效果,很多 SMS 用户、黑客和垃圾邮件发送者都使用这种效果使可读英文文本难于扫描,因为它使用字符重音版本的一个随机序列。我使用DBMS_RANDOM 随机选取一个可由不同字符使用的组合字符,然后让 SQL 进行组合并进行反向转换以生成 ANSI/Latin-1 输出。这段脚本在代码中使用了 EMP 表的 ENAME 字段。

set serveroutput on;
declare
-- these combinations work under ANSI, at least
a_comb nvarchar2(50) := unistr('\0300\0301\0302\0303\0308\ 030A ');
c_comb nvarchar2(50) := unistr('\0327');
e_comb nvarchar2(50) := unistr('\0300\0301\0302\0308');
i_comb nvarchar2(50) := unistr('\0300\0301\0308');
n_comb nvarchar2(50) := unistr('\0303');
o_comb nvarchar2(50) := unistr('\0300\0301\0302\0303\0308');
u_comb nvarchar2(50) := unistr('\0300\0301\0302\0308');
y_comb nvarchar2(50) := unistr('\0301\0308');
l_idx integer;
l_ename nvarchar2(50);
ch nchar;
l_junk varchar2(50);
begin
dbms_random.initialize(to_char(sysdate,'SSSSS'));
for row in (select ename from emp) loop
l_ename := row.ename;
l_junk := null;
for i in 1..length(l_ename) loop
ch := substr(l_ename,i,1);
case lower(ch)
when 'a' then
l_junk := l_junk || compose(ch || substr(a_comb,
mod(abs(dbms_random.random),length(a_comb)) + 1,1));
when 'c' then
l_junk := l_junk || compose(ch || substr(c_comb,
mod(abs(dbms_random.random),length(c_comb)) + 1,1));
when 'e' then
l_junk := l_junk || compose(ch || substr(e_comb,
mod(abs(dbms_random.random),length(e_comb)) + 1,1));
when 'i' then
l_junk := l_junk || compose(ch || substr(i_comb,
mod(abs(dbms_random.random),length(i_comb)) + 1,1));
when 'n' then
l_junk := l_junk || compose(ch || substr(n_comb,
mod(abs(dbms_random.random),length(n_comb)) + 1,1));
when 'o' then
l_junk := l_junk || compose(ch || substr(o_comb,
mod(abs(dbms_random.random),length(o_comb)) + 1,1));
when 'u' then
l_junk := l_junk || compose(ch || substr(u_comb,
mod(abs(dbms_random.random),length(u_comb)) + 1,1));
when 'y' then
l_junk := l_junk || compose(ch || substr(y_comb,
mod(abs(dbms_random.random),length(y_comb)) + 1,1));
else
l_junk := l_junk || ch;
end case;
end loop;
dbms_output.put_line(to_char(l_junk));
end loop;
end;
/
show errors;

分享到:
评论

相关推荐

    Oracle 9i应用COMPOSE和UNISTR创建沉音

    Oracle 9i 提供了两种功能,COMPOSE 和 UNISTR,来帮助开发者处理 Unicode 字符,特别是涉及到沉音字符(accented character)的情况。在多种语言中,沉音字符是常见的,但它们并不属于 ASCII 字符集,因此在编码时...

    compose 创建docker文件

    compose 创建docker文件 内含教程

    使用Docker Compose服务编排创建ELK

    logstash.yml --logstash的配置文件 我这里没有配置 使用默认的就好了 elasticsearch data --该目录存放elasticsearch的数据 plugins --该目录存放elasticsearch的插件,比如中文分词、同义词插件等 docker-...

    16运用compose使用现有镜像配置Lnmp网站.pptx

    它允许用户使用 YAML 文件来定义服务、网络和卷,然后使用这些定义来创建和管理容器。Compose 的主要特点是可以使用现有的镜像来配置和部署容器化应用程序。 在本节中,我们将使用 Compose 来配置和部署一个 Lnmp ...

    Compose和Xml视图的混用(分模块)

    - **包裹Compose组件**:相反,如果在XML布局中需要使用Compose组件,可以创建一个自定义的`ViewGroup`,并在其中初始化和渲染Compose的`Composition`。 4. **资源管理**:由于Compose不使用XML资源,所以在混用时...

    Compose 和 Android 传统View 互相调用 示例 Demo

    Compose 和 Android 传统View 互相调用 示例 Demo Sample,以及在双层嵌套(原生View嵌套Compose,Compose中又嵌套原生View)的情况下,在最外层原生View中,怎么获取到Compose内部的原生View。 具体详见我的博客 : ...

    android compose 从入门到精通 新手必备

    1. Compose Test Kit:提供了一套工具来测试Compose应用,包括UI组件的功能性和视觉一致性。 2. Layout Inspector:可视化工具,帮助开发者检查Compose布局层次和元素尺寸。 六、Jetpack Compose集成 1. Gradle...

    docker和docker compose安装使用、入门进阶案例.doc

    * 使用 docker compose 创建和运行应用程序 * 了解 docker compose 的使用和优点 六、docker compose 的使用 * 使用 docker compose 可以轻松定义和运行多容器应用程序 * 使用 docker compose 可以解决微服务之间...

    Jetpack Compose 入门到精通.pdf

    Jetpack Compose 是第一个使用 Kotlin 正在开发中的大型项目,因此 Android 团队正在探索 Kotlin API 指南的新世界,以创建一组特定于 Compose API 的指南,该工作仍在进行中,仍然有很长的路要走。 1.4 Compose ...

    Jetpack Compose入门到精通

    例如,可以使用`AnimatedVisibility`进行可见性切换,`Transition`来创建复杂的动画序列。 ### 反馈与交互 Jetpack Compose提供了`onClick`, `onLongClick`等交互处理函数,使得按钮点击、触摸事件的响应变得直观。...

    docker-compose安装包

    Docker-Compose项目是Docker官方的开源项目,负责实现对Docker容器集群的快速编排。 Docker-Compose将所管理的容器分为三层,分别是工程(project),服务(service)以及容器(container)。Docker-Compose运行目录...

    Ubuntu docker 20.10.12版本和docker-compose离线安装包

    总之,这个资源包提供了一套完整的解决方案,使得在没有互联网连接的Ubuntu 20.10环境中也能顺利安装和使用Docker和Docker Compose,极大地便利了开发者和系统管理员的工作。在实际使用中,务必根据具体需求和系统...

    elk的docker-compose配置

    2. **创建`docker-compose.yml`文件**:这个文件将定义我们的服务和它们之间的依赖关系。一个基本的`docker-compose.yml`文件可能如下所示: ```yaml version: '3' services: elasticsearch: image: docker....

    使用Docker 配置 LNMP 环境,使用compose一键部署

    使用Docker 配置 LNMP 环境,使用compose一键部署 DNMP(Docker + Nginx + MySQL + PHP)是一款全功能的LNMP环境一键安装程序,可多版本 快速使用 本地安装 git Docker docker-compose 2.0.0+ clone 项目 git clone...

    docker-compose_install.tar.gz

    通过 Docker Compose,开发者可以使用 YAML 文件(通常命名为 `docker-compose.yml`)来配置服务、网络和卷,然后通过 `docker-compose` 命令行工具一次性启动所有关联的服务。这大大简化了多容器应用的管理和部署...

    docker-compose-linux-aarch64

    Docker Compose是一个用于定义和运行多个Docker容器的工具。它允许您使用YAML文件来描述应用程序的组件、服务和网络配置,以便可以轻松地启动、停止和管理多个容器。 使用Docker Compose,您可以在单个配置文件中...

    docker-compose 容器部署 nginx

    下面,我们详细讨论如何创建和使用`docker-compose.yml`文件来配置Nginx容器: 1. **配置文件结构**:在`docker-compose.yml`文件中,我们需要定义一个或多个服务。对于Nginx,我们可以创建一个名为`nginx`的服务。...

    docker-compose Linux安装包(压缩包中含V1.29.2和V2.2.2两个版本)

    一旦安装完成,你就可以在同一个Linux环境中使用Docker Compose来管理和运行你的多容器应用。记得Docker Compose需要Docker Engine的支持,确保你的系统已经安装了Docker,并且Docker服务正在运行。 总之,Docker ...

Global site tag (gtag.js) - Google Analytics