Windows 機種依存文字の変換

[上に] [前に] [次に]
B-Cus 1999/12/09(木) 23:38:47
機種依存文字が嫌いなので、丸1→(1) などのように変換してみようと
思ったのですが、こんな感じでうまくいってますか?
 http://X68000.startshop.co.jp/~68user/tmp/replace-char.cgi
 http://X68000.startshop.co.jp/~68user/tmp/replace-char.txt
今の環境は機種依存文字が表示されないので、うまくいっているのかどうか、
さっぱりわかりません。

今のところ13区のみに対応してます。Mac の機種依存文字は未対応です。
# http://www2d.biglobe.ne.jp/~msyk/charcode/kisyuizon/msgotic.html
# http://www.ryukyu.ad.jp/~shin/jdoc/ikenai-moji.html

あと、9〜12,14-15区ってどういう文字が入ってるんですか?

それと、誰かがこーゆーのを作って配布してるなら、そっちを
使いたいので、ご存知の方 紹介していただけますか。

\n 1999/12/10(金) 00:11:14
おーさすがB-Cusさんですねぇ
Winでちゃんと変換が確認できました。

>あと、9〜12,14-15区ってどういう文字が入ってるんですか?
うちの環境では、該当区画は中点(・)となり、文字が出ないの
で不明です。Macだと何か割り当てられているのでしょうか?

ちぃっと比べてみたら Win と Unix では13区の違いだけの様
ですね。

[E-Mail] [HomePage] 1999/12/10(金) 00:12:25
おぉ、B-Cus さんが質問している!早速、一部協力します。
ちょっとだけ、試してた範囲でおかしなものは。。。
丸上→Tel
丸中→上
丸下→中
丸左→下
丸右→左
明治→(代)
大正→明治
など。
全てを試さないと全貌が明らかになりませんが、時間がないので
とりあえず。

Syn [E-Mail] 1999/12/10(金) 00:14:54
9 〜 15 区はこんな感じです。
http://www.din.or.jp/~syn/9-12.gif
http://www.din.or.jp/~syn/13-15.gif

「MS ゴシック」のフォントでは上のように出ました。
NEC 系のフォントならもっと出るのかな?

B-Cus 1999/12/10(金) 04:45:30
どもども。9〜12,14〜15区はどうやら何もないようですね。

> http://X68000.startshop.co.jp/~68user/tmp/replace-char.cgi
> http://X68000.startshop.co.jp/~68user/tmp/replace-char.txt
途中から1文字ずれてしまうのを直しました。89〜92区も対応しました。
と言っても、ちゃんと変換するのは i,ii〜以降のみで、その他は
ゲタ(〓)に変換します。

全部入力するのは面倒でしょうから、各区の端だけ、つまり
SJIS の 8740(丸1),877E(平成),8780("),879C(∪) や
EEEF(i),EEFC("かな? つぶれていてよくわからない) を入力したり、
 http://www.ryukyu.ad.jp/~shin/jdoc/ikenai-moji.html
を丸ごとコピったりして、ずれている部分があったら教えていただけますか。

> ちぃっと比べてみたら Win と Unix では13区の違いだけの様ですね。
13区に加え、89,90,91,92区が違います。

文字コードの偉い人が言わはるには、
 JIS で有効なのは1〜94区。よって、115〜119区は UNIX (X Window System)で
 扱うのは難しい。
 115区〜119区(相当)の字(IBM拡張文字)は、89区〜92区(NEC選定IBM拡張文字)
 と13区(NEC特殊文字)でまかなえる。
だそうで。とはいえ、nkf では JIS の95区以降は JIS に変換
できなかった記憶があります。

へにか 1999/12/10(金) 08:37:15
こんな感じで良いですか?
8740 to 879f http://free.prohosting.com/~henika/8740_9f.gif
eeef to eefc http://free.prohosting.com/~henika/eeef_fc.gif
試した環境
win95 + AnHttpd 1.22c + IE5

B-Cus 1999/12/10(金) 19:09:04
[[解決]]
なるほど。

IE は、機種依存文字で、なおかつ JIS X 0208 に含まれているものは、
JIS X 0208 の方を送るようですね。例えば機種依存文字の
√(EUCで0xADF5) をコピー&ペーストしても、機種依存文字でない
√(EUCで0xA2E5) を送信するようです。さらに
 http://www2d.biglobe.ne.jp/~msyk/charcode/kisyuizon/13-14ku.html
の未定義領域 (例えば m^2 から平成の間)は、
最初から・(全角中黒 EUC の0xA1A6)を送るらしいと。

で、Win+NN4 を借りて試してみたのですが、こちらは
何も考慮せずそのままのコードを送信してました。

それはそれとして、どうやらうまく変換できているようですね。
ありがとうございました。

[上に] [前に] [次に]