[Pandora-jp] 2バイトの文字列の扱い
KIKUCHI Koichiro
koichiro-ml @ hataki.jp
2012年 10月 10日 (水) 11:33:16 JST
三反田さま
菊地です。
2012年10月9日 15:12 "三反田@ひむか流通ネットワーク" <santanda @ himuka.ne.jp>:
[...]
>> pandora_agent.confで指定してるい文字コードと2バイト文字列の文字コードは一致していますか?
> →agent.confでは、以下の通りコメントアウトされてました。(標準のままです)
> OSの文字コードは、EUC-JPです。
> #encoding UTF-8
encoding 行をコメントアウトしている場合、pandora_agent のデフォルトの ISO-8859-1 が使われますので
EUC-JP の文字を XML に含めることはできません。 (Pandora FMS 4.0.2 以降は UTF-8 がデフォルトです)
EUC-JP の場合、encoding に x-euc-jp-jisx0221 か x-euc-jp-unicode を指定して下さい。
両者の違いは、EUC-JP の「―」(EM DASH)をUnicodeの「―」(EM DASH)にマップするか「―」(HORIZONTAL
BAR)にマップするかの違いです。
また、こちら(http://homepage3.nifty.com/hippo2000/perltips/xml/xmlenc.htm)で公開されているツールを使い、
Pandoraサーバを稼動させているサーバ上で euc-jp 用のマップファイルを作成することで、encoding に EUC-JP と
書くことも可能です。
このあたりは、Pandora FMSの事情というよりは、Pandora FMS がXMLのパースに利用している XML::Parser の事情となります。
--
菊地宏一郎
Pandora-jp メーリングリストの案内