変数: 文字セットを表現する定義済みシンボル | |
| 以下の各シンボルは、定義済み文字セットを表現する。 | |
| MSymbol | Mcharset_ascii |
| ASCII 文字セットを表現するシンボル. | |
| MSymbol | Mcharset_iso_8859_1 |
| ISO/IEC 8859-1:1998 文字セットを表現するシンボル. | |
| MSymbol | Mcharset_unicode |
| Unicode 文字セットを表現するシンボル. | |
| MSymbol | Mcharset_m17n |
| 全文字を含む文字セットを表現するシンボル. | |
| MSymbol | Mcharset_binary |
| 正しくデコードできない文字の文字セットを表現するシンボル. | |
変数: mchar_define_charset 用のパラメータ・キー | |
| これらは、関数 mchar_define_charset() 用のパラメータ・キーとして 使われるシンボルである。 詳しくはこの関数の解説を参照のこと。 | |
| MSymbol | Mmethod |
| MSymbol | Mdimension |
| MSymbol | Mmin_range |
| MSymbol | Mmax_range |
| MSymbol | Mmin_code |
| MSymbol | Mmax_code |
| MSymbol | Mascii_compatible |
| MSymbol | Mfinal_byte |
| MSymbol | Mrevision |
| MSymbol | Mmin_char |
| MSymbol | Mmapfile |
| MSymbol | Mparents |
| MSymbol | Msubset_offset |
| MSymbol | Mdefine_coding |
| MSymbol | Maliases |
変数: 文字セットのメソッド指定に使われるシンボル | |
| これらは、文字セットの メソッド を指定するための定義済みシンボ ルであり、文字セットの Mmethod パラメータの値となることができる。 この値は関数 mchar_define_charset() の引数として使われる。
メソッドとは、コードポイントと文字コードを相互変換する際の方式のこ とである。詳しくは関数 mchar_define_charset() の解説を参照のこと。 | |
| MSymbol | Moffset |
| オフセット型のメソッドを示すシンボル. | |
| MSymbol | Mmap |
| マップ型のメソッドを示すシンボル. | |
| MSymbol | Munify |
| ユニファイ型のメソッドを示すシンボル. | |
| MSymbol | Msubset |
| サブセット型のメソッドを示すシンボル. | |
| MSymbol | Msuperset |
| スーパーセット型のメソッドを示すシンボル. | |
マクロ定義 | |
| #define | MCHAR_INVALID_CODE |
| 無効なコードポイント. | |
関数 | |
| MSymbol | mchar_define_charset (const char *name, MPlist *plist) |
| 文字セットを定義する. | |
| MSymbol | mchar_resolve_charset (MSymbol symbol) |
| 文字セット名を解決する. | |
| int | mchar_list_charset (MSymbol **symbols) |
| 文字セットを表わすシンボルを列挙する. | |
| int | mchar_decode (MSymbol charset_name, unsigned code) |
| コードポイントをデコードする. | |
| unsigned | mchar_encode (MSymbol charset_name, int c) |
| 文字コードをエンコードする. | |
| int | mchar_map_charset (MSymbol charset_name, void(*func)(int from, int to, void *arg), void *func_arg) |
| 指定した文字セットのすべての文字に対して関数を呼ぶ. | |
変数 | |
| MSymbol | Mcharset |
シンボル Mcharset. | |
m17n ライブラリは、以下の概念を区別している:
unsigned 型によって表される。無効なコードポイントはマクロ MCHAR_INVALID_CODE で表される。
|
|
マクロ MCHAR_INVALID_CODE は無効なコードポイントを与える。 |
|
||||||||||||
|
関数 mchar_define_charset() は新しい文字セットを定義し、それを name という名前を持つシンボル経由でアクセスできるようにする。 plist は定義される文字セットのパラメータを以下のように指定する。
|
|
|
関数 mchar_resolve_charset() は symbol が文字セットを示していれ ばそれを返す。 そうでなければ、symbol を文字セット名として正規化し、それが文字セッ トを示していていれば正規化したものを返す。そうでなければ、Mnil を 返す。 |
|
|
関数 mchar_list_charsets() は、文字セットを示すシンボルを並べた配 列を作り、symbols でポイントされた場所にこの配列へのポインタを置 き、配列の長さを返す。 |
|
||||||||||||
|
関数 mchar_decode() は、シンボル charset_name で示される文字セッ ト内の code というコードポイントをデコードして文字コードを得る。
|
|
||||||||||||
|
関数 mchar_encode() は、文字コード c をエンコードしてシンボル charset_name で示される文字セット内におけるコードポイントを得る。
|
|
||||||||||||||||
|
関数 mcharset_map_chars() は charset_name という名前を持つ文字セッ ト中のすべての文字に対して func を呼ぶ。呼び出しは一文字毎ではな く、連続した文字のまとまり単位で行なわれる。 関数 func にはfrom, to, arg の3引数が渡される。from と to は charset 中の文字コードの範囲を指定する。arg は func_arg と同 じである。
|
|
|
デコードされた M-text は、キーが |
|
|
シンボル Mcharset_ascii は |
|
|
シンボル Mcharset_iso_8859_1 は |
|
|
シンボル Mcharset_unicode は |
|
|
シンボル Mcharset_m17n は |
|
|
シンボル Mcharset_binary は 詳細は コード変換 参照のこと。 |
|
|
関数 mchar_define_charset() 用のパラメータ・キー. |
|
|
関数 mchar_define_charset() 用のパラメータ・キー. |
|
|
関数 mchar_define_charset() 用のパラメータ・キー. |
|
|
関数 mchar_define_charset() 用のパラメータ・キー. |
|
|
関数 mchar_define_charset() 用のパラメータ・キー. |
|
|
関数 mchar_define_charset() 用のパラメータ・キー. |
|
|
関数 mchar_define_charset() 用のパラメータ・キー. |
|
|
関数 mchar_define_charset() 用のパラメータ・キー. |
|
|
関数 mchar_define_charset() 用のパラメータ・キー. |
|
|
関数 mchar_define_charset() 用のパラメータ・キー. |
|
|
関数 mchar_define_charset() 用のパラメータ・キー. |
|
|
関数 mchar_define_charset() 用のパラメータ・キー. |
|
|
関数 mchar_define_charset() 用のパラメータ・キー. |
|
|
関数 mchar_define_charset() 用のパラメータ・キー. |
|
|
関数 mchar_define_charset() 用のパラメータ・キー. |
|
|
シンボル Moffset は
文字コード = コードポイント - MIN-CODE + MIN-CHAR ここで、MIN-CODE は文字セットの Mmin_code パラメータの値であり、MIN-CHAR は Mmin_char パラメータの値である。 |
|
|
シンボル Mmap は |
|
|
シンボル #Minherit は コードポイントがマップに含まれていれば、変換はマップ参照によって行 われる。そうでなければ、以下の式に従う。
CHARACTER-CODE = CODE-POINT - MIN-CODE + LOWEST-CHAR-CODE ここで、MIN-CODE は文字セットの Mmin_code パラメータの値であり、 LOWEST-CHAR-CODE は割り当てられたコードスペースの最も小さい文字コー ドである。 |
|
|
シンボル Msubset は
CHARACTER-CODE = PARENT-CODE (CODE-POINT) + SUBSET-OFFSET ここで PARENT-CODE は CODE-POINT の親文字セット中での文字コードを 返す擬関数であり、SUBSET-OFFSET は Msubset_offset パラメータで与 えられる値である。 |
|
|
シンボル Msuperset は |
mule-aist@m17n.org