Unicode 対応ライブラリ


文字コードが異なるデータを Unicode に変換して処理したい、外字人名漢字もきちんと表示したい方などにお勧めのツール

製品概要

ソフトウェアやインターネットアプリケーションを国際市場に対応させるには、言語にかかわる事項、特に文字コードが大きな課題となります。先進的なRosette® Unicode 対応ライブラリ (RCLU: Rosette Core Library for Unicode) は多言語対応の際に直面する文字コード処理の課題を解決します。

各国固有の文字コードを世界共通のUnicode に変換することにより、どのような文字コードのテキストデータも処理できるようになります。またデータ出力などでUnicode 以外の文字コードのサポートが必要な場合には、その文字コードへ変換して処理できます。

 

製品の特長

  • 12の言語ペアをサポート
  • シンプルなAPI
  • 高い拡張性と処理能力
  • 業務仕様のサポート
  • 簡単なインストール
  • 柔軟でカスタマイズ可能

機能

簡単なテキスト操作

データのソート、正規化、文字列の一致等の機能を容易に実現するため、さまざまな文字変換及び文字属性分類の機能を備えています。

テキストの正規化(一例):

大文字 ⇔ 小文字  
例:Unicode TEXT ⇔ unicode text
半角 ⇔ 全角(日本語のみ)  
例:ABCカンパニー  ⇔  ABCカンパニー
ひらがな ⇔ カタカナ(日本語のみ)


日本語対応

ISO-2022-JP (JIS)、Shift‑JIS、EUC‑JP などといった日本固有の文字コードでのデータ処理が必要となる場合、これら日本語固有の文字コードからUnicode への変換、あるいはその逆をおこなうためのツールとしてもご利用いただけます。JIS X0213 (JIS 第1~第4水準)にも対応しています。

文字コード変換

Unicode 5.0 と160種類以上の旧来の文字コードとの間の変換をサポートしています。

例: Shift-JIS ⇔ Unicode, GB18030 ⇔ Unicode

Unicode 文字の分類と変換

176種類の文字属性および文字種によってUnicode 文字の分類と置き換えを行います。

高い実行性能

  • 高速かつ効率的で、スレッド・セーフ。
  • 文字コードテーブルのダイナミック・ロード
  • メモリー必要量を最小限に抑えます。

仕様

160種類以上の旧来の文字コードに対応
Unicode 対応エンコーディング
Unicode標準 1.2、2.X、3.X、4.X、5.X
UCS-2 (big-endian または little-endian)
UTF-7、UTF-8 フォーマット
バイトオーダーマーク(BOM)有/無
Java及びSGMLの文字参照
30種類の文字変換
コンパクトなライブラリサイズ – 別に500KB – 10MB の変換テーブル

スペック

ご利用可能なプラットフォーム

提供形態:
プラグイン:
プログラミング:

対応している言語ペア

アラビア語 ↔ 英語 パシュトゥ語 ↔ 英語 日本語 ↦ 英語 中国語↔ 日本語
ダリ語 ↔ 英語 ウルドゥ語 ↦ 英語 韓国語 ↔ 英語 中国語 ↔ 韓国語
ファルシ語↔ 英語 中国語↔ 英語 ロシア語 ↔英語 韓国語↔ 日本語

サポートしている文字種 と翻訳標準

言語 文字種 翻訳標準の例
アラビア語 Arabic العربية IC, SATTS, BGN, Basis, Buckwalter and others
ペルシャ語 (ダリ/ファルシ) Arabic العربية BGN, IC, MELTS
パシュトゥ語 Arabic العربية BGN, JDEC-Afghanistan
ウルドゥ語 Arabic العربية BGN, IC
中国語 Hanzi 漢字 Hanyu Pinyin, Wade-Giles
韓国語 Hanja 漢字
Hangul한글
BGN, Korda, McCune-Reischauer, Revised Romanization of Korean
日本語 Hiragana かな
Katakana カナ
Hepburn, Kunrei
ロシア語 Cyrillic Кириллица BGN, IC

アラビア語翻訳サンプル

翻訳タイプ 入力 出力
人名 – アラビア語由来 ابو يوسف يعقوب‎‎ Abu-Yusif Ya’qub
人名 – 英語由来 رذرفورد بي هايز Rutherford B. Hayes
地名 – アラビア語由来 باقة الشرقية Baqah al-Sharqiyyah
組織の略称 – 英語由来 بي بي سي B.B.C.

お問い合わせ

 

お問い合わせ

弊社製品に関するお問い合わせおよび製品評価版のご利用をご希望の方は、こちらのフォームよりお問い合わせください。

製品評価版をご希望の際は、ご使用のOSおよび開発言語の種類を必ずご記載ください。

EMAIL:
info@basistech.jp

電話:
03-3551-2947

本モジュール利用顧客