なぜ文字化けするのですか?

[上に] [前に] [次に]
石井秀和 [E-Mail] [HomePage] 1998/01/10(土) 17:20:12
ホームページのソースを見るとどうしても文字化けしてしまうのですが
どうしたらよいのですか?

sekikawa [E-Mail] [HomePage] 1998/01/10(土) 21:59:27
Mac、ウインドウズなどで標準の文字コードはシフトJISですが、html
を記述する場合はJISで書かれています。

JISに対応したエディターを使えば読めると思います。

かものはし 1998/01/12(月) 11:23:37
nkfで変換してみては?

B-Cus 1998/01/12(月) 14:14:09
どういう状況でソースを見ているのかわからないのですが、
 <META HTTP-EQUIV=.. charset=x-sjis">
と書いてあるのに文字コードはEUCを使っている、などというときは
文字が化けることがあります。


ところで、文字化けで思い出したんですけど、とほほさんへ。

meta http-equivのcharsetは、x-euc-jp、x-sjisはNNの間違った実装で、
規格上はeuc-jp、shift-jisが正しい。しかしNN2.0あたりでは
euc-jp、shift-jisが解釈されない、と認識しているのですが
どうでしょうか。

ALM [E-Mail] [HomePage] 1998/01/20(火) 03:39:27
 私のプロバイダーのローカルニュースグループで出た話なのですが、x-euc-jp、x-sjisのハイフンは、実際はアンダースコアが正しい「らしい」です。
 その方のメッセージを無断で転載します。
(以下転載)
詳しくは、
http://www.isi.edu/div7/iana/descript.html
から、"Character Sets" を落として来て見てください。

  ただ、x-sjis や x-euc-jp でも、メジャーなブラウザは解釈して
しまいます。実質上通用するんですが、正式にはこっち、と言うこと
です。
  ただし、私はなんだか文字化けするので、ソースに落として、
CHARSET=x-sjis を指定している meta タグを消したら化けが直った
事はあります。ただ、再現性が無いのでアレですが。
(NetscapeNavigator 4.04 for Linux ix86)

私的には正式にオッケーな方がより危険度は少ないと思ったわけです。
(以上転載)
 どんなもんでしょ?

 ついでに質問したいのですが、Shift JIS にもかかわらず、iso-8859-1 を指定する、というのは問題有るでしょうか?
 とりあえず、日本語のページを作り、その複製として英語版を作っているもので、たまに全角のスペースなどを見落としたりすることがあるんです。
 iso-8859-1 を指定しておくと、Netscape Navigator 3.0j では欧文フォントで表示させられるので、文字化けが起こり、発見が容易になるもので。

さと 1998/01/20(火) 13:58:55
 JISコードで書かれたソースを見たときには $ や % がたくさん表示されます。EUCコードの方はちょっと憶えていません。
 テキストエディタで、これらのコード変換を行ってくれるものがありますのでそういったものを使ってみるのもいいと思います。わたしはビレッジセンターのWZ Editor3を使用しています。
 また、METAタグに用いる文字コードですが、現在の正式なコードは
  シフトJIS = Shift_JIS
  日本語EUC = EUC-JP
 です。また、今までの x-euc-jp や、x-sjis は規格が確定する前の暫定コードです。
NN2が出た当初はまだコードが確定していなかったため、暫定コードで認識するようにしてあるみたいです。
当然の事ながら、Shift_JIS や EUC-JP 用のコードは認識できない(知らないんですから)ので、文字化けを起こす場合があります。
 私が文字化けを起こさない工夫というのは何ですが、今は文字コードを指定しないようにしています。
 なまじコード指定をすると完全に見れなくなってしまう事が起こりますから。

さと 1998/01/20(火) 14:00:49
 付け足し:シフトJISのコードはアンダースコアです。WEB上では表示されないことがあるのを忘れていました。

さと 1998/01/20(火) 14:03:30
 もう一つ(すいません)
 http://www.isi.edu/in-notes/iana/assignments/character-sets
ダイレクトですが、ここに私が参照した文字コードセットの一覧があります。
41KBのファイルですので、ちょっと時間がかかりますが。問題の日本語コードはかなり後ろの方です。

ALM [E-Mail] [HomePage] 1998/02/08(日) 07:49:08
 Netscape Navigator 3.0[ja] では、EUC、JIS で書かれた HTML のソースを見ようとすると、文字化けが起こるようですね。

 「オプション」→「全般の設定」→「アプリケーション」にある「ソースの表示」を EUC や JIS も表示できるテキストエディターなどに設定しておけば、ちゃんと見られるようになります。
 「メモ帳」はダメのようです。
 私は「秀丸エディタ」を設定しました。

hiro-kim 1998/02/09(月) 10:35:16
WWWページのHTML文をエディタで見たときの文字化け,ではなく,WWWブラウザの文字化けについてなのですけれど。

『日経インターネットテクノロジー』(日経BP社)が 1997.12号で特集記事を載せていますので,要点だけざっとご紹介しておきます。

■7bitJIS,シフトJIS,EUC,Unicode のMIME表記はそれぞれ ISO-2022-JP, Shift_JIS, EUC-JP, UTF-7/UTF-8。大文字小文字の区別はない。

■RFC2070で規定された文字コード判別処理の手順の標準は次のとおり。Com4.0, IE4.0もこの方法。
(1) HTTPヘッダの"Content-Type:text/html;charset=ISO-2022-JP"をチェックする。
  NCSAのWWWサーバの場合は,mime.typesファイルや .htaccessファイルで設定。
  HTTPヘッダに文字コード情報を載せられないWWWサーバもある。
(2) HTML文中のMETAタグ <META HTTP-EQUIV="Content-Type" Content="text/html;charset=ISO-2022-JP">
(3) HTML文中の文字コードの自動判別。
  最初に英数字が続くようなHTML文書では文字化けが発生する可能性がある。
  <HEAD>タグ内で <!- ->を使ってEUCやシフトJISにしかない文字コードを数文字以上埋め込むとブラウザの自動判別を助ける(EUC:0xA1??の記号など。シフトJISならば 0x81??の記号か)

■原則として(1)(2)の順に優先するが,METAタグと本文のコードが異なっても本文が長い場合に自動的にリフレッシュして正しく表示された。(3)の分析次第では(1)(2)の指定を覆すこともありうる。

■ジャストシステムのJustViewは,HTTPヘッダ・METAタグを見ない。本文の文字コードの自動判別だけ。

hiro-kim 1998/02/09(月) 12:27:27
HTTPヘッダの指定というのは,例えばHTMLページを生成するCGIプログラムを書くときに,冒頭で空行とともに出力するあの一行のことです。

「とほほのCGI入門」→「CGIスクリプトのヘッダ」
http://www.tohoho-web.com/wwwcgi.htm#CgiHeader

もしかするとピンとこない人もいるかなと,ちょっと気になったので念のため。

匿名希望 1998/03/26(木) 07:07:18


匿名希望 1998/03/26(木) 07:31:36


飯塚 1998/03/27(金) 20:20:20
ところで、ときどき「ISO-2022-JPは自動判別の意味」ということを書いてるヤツあるらしいですね。
この人は相当怒っている(ふざけている)ようなので、興味のある方は読んでみてください。
http://www.pro.or.jp/~fuji/horrible/horrible.kanji.html

とほほ 1998/03/28(土) 00:41:18
むむむ・・・結局、

(1) 何も指定しない
  シフトJISやEUCだと文字化けが発生することがある。
(2) charset=x-sjis を指定する
  Lynxブラウザで確実に文字化けが発生する。
  Linux用NN4.0でも文字化けが発生することがあるようだ。
(3) charset=Shift_JIS を指定する
  仕様的には正しいが、NN2.0で確実に文字化けする。
(4) 文書はすべてJISで記述する
  NN3.0などの[ソース表示]で文字化けが発生する。

うーん、困ったものですね。私もとりあえずは、さとさんと同じ、
(1)に改宗してみたいと思います。

お助けマン 1998/04/05(日) 04:04:10
ネスケなら、ソース表示をネスケに設定すれば、
文字化けしないで見ることが出来ます。
「全般の設定」から→「アプリケーション」を選んで「ソースの表示」の所の右のほうの
「Netscapeを利用」というチェックボックスを入れれば、
HTMLソースをNetscapeで文字化けなしで、しかもカラフルで見やすくみれます。
MACでの場合しか知らないんですが、お助け情報になるでしょうか?

[上に] [前に] [次に]