[Pandora-jp] 2バイトの文字列の扱い

KIKUCHI Koichiro koichiro-ml @ hataki.jp
2012年 10月 10日 (水) 11:33:16 JST


三反田さま

菊地です。

2012年10月9日 15:12 "三反田@ひむか流通ネットワーク" <santanda @ himuka.ne.jp>:
[...]
>> pandora_agent.confで指定してるい文字コードと2バイト文字列の文字コードは一致していますか?
> →agent.confでは、以下の通りコメントアウトされてました。(標準のままです)
>  OSの文字コードは、EUC-JPです。
>  #encoding       UTF-8

encoding 行をコメントアウトしている場合、pandora_agent のデフォルトの ISO-8859-1 が使われますので
EUC-JP の文字を XML に含めることはできません。 (Pandora FMS 4.0.2 以降は UTF-8 がデフォルトです)

EUC-JP の場合、encoding に x-euc-jp-jisx0221 か x-euc-jp-unicode を指定して下さい。
両者の違いは、EUC-JP の「―」(EM DASH)をUnicodeの「―」(EM DASH)にマップするか「―」(HORIZONTAL
BAR)にマップするかの違いです。

また、こちら(http://homepage3.nifty.com/hippo2000/perltips/xml/xmlenc.htm)で公開されているツールを使い、
Pandoraサーバを稼動させているサーバ上で euc-jp 用のマップファイルを作成することで、encoding に EUC-JP と
書くことも可能です。

このあたりは、Pandora FMSの事情というよりは、Pandora FMS がXMLのパースに利用している XML::Parser の事情となります。


--
菊地宏一郎


Pandora-jp メーリングリストの案内