HTML文書に半角カタカナを含めてはいけないのか?

[上に] [前に] [次に]
おか 2000/05/16(火) 20:47:08
 HTML文書に半角カタカナを含めてはいけないのでしょうか?

<META HTTP-EQUIV="Content-Type" Content="text/html; charset=SJIS">

と指定しておけば問題ないと理解しているのですが、なにか問題が
発生する場合はあるでしょうか?

 CGIでは問題があるというのを聞いた事はありますが、これは
CGIの問題でしょうし、サーバー側はサーブレットを使用すれば
UNICODEですので問題ないと理解しています。

 HTML4.0仕様書やRFC2070などを読み問題がないと判断している
のですが私の理解が足りないのでしょうか?

2000/05/16(火) 21:40:07
結論から言うと、HTML文書には半角カナを含めても基本的に全く問題ありません。
ただ、問題があるとすれば、UNIX系の一部の端末が半角カナを表示できないことでしょうか。

また、文字コードセットにISO-2022-JPを指定した場合は半角カナは使えません。
しかし、ShiftJISやEUC-JPならば、上記のことを除き基本的に問題はないはずです。

ただし、
><META HTTP-EQUIV="Content-Type" Content="text/html; charset=SJIS">
これは、charsetの設定が間違ってます。
正しくは、
<META HTTP-EQUIV="Content-Type" Content="text/html; charset=Shift_JIS">
です。

dddd 2000/05/17(水) 20:08:50
>ただ、問題があるとすれば、UNIX系の一部の端末が半角カナを表示できないことでしょうか。
それはなんというUNIXですか? 具体的に教えてください。

2000/05/17(水) 20:39:40
さぁ?
仕事で見かけたことがあるだけなので、具体的に何という端末なのかは知りません。
ただ、実在するのは確かです。
Telnetによる端末エミュレートでは正常に表示されたので、その端末の特性かもしれません。

おか 2000/05/17(水) 20:44:41
> これは、charsetの設定が間違ってます。
> 正しくは、
> <META HTTP-EQUIV="Content-Type" Content="text/html; charset=Shift_JIS">
> です。

 ご指摘ありがとうございます。JavaのCanonical Nameが癖になっていたのか、
お恥ずかしい限りです。問題なく動作していたので見過ごすところでした。

 いろいろなページで半角カナはご遠慮くださいというのを見るにつれ、私は
なにか重大な事を見落としているのではと心配になり質問をしてみたしだいです。

 もうひとつ、古いブラウザなどでは漢字コードの判定を誤る可能性がある
という話も聞きましたが、これはいつの時代の話かをご存知の方はいません
でしょうか?

 私は、Windows(IE4,NN4.06以上),MAC(IE4.5,NN4.06以上)と環境を限定
してWebページを作成しているのですが、NNの制限はこれでいいのか今一つ
確信がもてないでいます。

dddd 2000/05/17(水) 20:56:01
その程度で、
>ただ、問題があるとすれば、UNIX系の一部の端末が半角カナを表示できないことでしょうか。
こういう表現になってしまうものなのでしょうか。
まあこだわりませんが。

B-Cus 2000/05/17(水) 22:33:28
・理論上 SJIS の半角カナと、EUC の区別を完璧に行うことはできない。
 よって、端末やエディタ (例えば mule-2.3 based emacs 19.34.1 (設定次第かも))
 によっては化ける。Windows で化けないのは、SJIS だと決め打っているから。
・そのまま ISO-2022-JP に変換することができない。よって、fj には流せない。
・平仮名は「あ」なのに、片仮名は「(半角カナの)ア」なの?
 (ま、これについてどう思うかは個人の自由)
・新規文書には半角カナを使わないよう、規格 (規格の名前は失念) により
 推奨 (だっけ?) されている。

という点について気にしなくてもよい状況なら、使っても問題ないでしょう。

みんこ 2000/05/17(水) 23:37:51
ポスペで半角カナのメール開くと化けますね〜。
HTML文書ならなおのこと。
勿論ポスペを気にしない環境なら以下同文です。

D.D. 2000/05/17(水) 23:44:07
> もうひとつ、古いブラウザなどでは漢字コードの判定を誤る可能性がある
>という話も聞きましたが、これはいつの時代の話かをご存知の方はいません
>でしょうか?
今でも誤ったりしてるみたいですが。

>ポスペで半角カナのメール開くと化けますね〜。
ていうか、メールで日本語を使うならばISO-2022-JPが定説です。

dddd 2000/05/17(水) 23:48:46
>そのまま ISO-2022-JP に変換することができない。よって、fj には流せない。

なんで此処でnewsを出す必要があるのか?

ふじ 2000/05/17(水) 23:50:15
> いろいろなページで半角カナはご遠慮くださいというのを見るにつれ、
これってもしかして、フォームへの入力についてだったりしますか?
# 違ったら以下は無視してください。

フォームに入力されたデータがどの文字コードでサーバに送られるかは
ブラウザに依存するので(最近のブラウザではHTMLの文字コードに合わせるようですが、
規定は無いはず)、受け手では文字コードを判別しなくてはなりません。

が、B-Cusさんも仰っているようにSJISの半角カナ文字列とEUCの漢字
は原理的に区別できない場合があるので、CGIプログラムなどを書く側
とすれば非常に厄介。→「半角カナは御遠慮ください」と書きたくなる。
てことでは。

おーなーしぇふ 2000/05/17(水) 23:54:22
>いけないのでしょうか?
これに対する答えとしては「いけないとはいえない」となる
でしょうか……。

けれども、半角カタカナの使用に対する一般的なアドバイスと
しては「使用しないほうが良い」となります。理由としては
『使っていいことは何もない』こととなるようです。

詳しくは以下のページを参考にされると良いかと……(^^)
『日本語フォントや文字コードについて』:
http://www.zukeran.org/shin/jdoc/

※このページの、上から3項目『いわゆる「半角カナ」問題』が
そうです。

dddd 2000/05/18(木) 00:03:19
>> いろいろなページで半角カナはご遠慮くださいというのを見るにつれ、
>これってもしかして、フォームへの入力についてだったりしますか?
># 違ったら以下は無視してください。
違わないだろうけど、いろいろなページでってのが味噌だと思う。
わけもわからず「半角カナを使うと全世界の人に迷惑がかかる(謎)」
とか思い込んでる人たちのページとか。

D.D. 2000/05/18(木) 00:06:15
>理由としては
>『使っていいことは何もない』こととなるようです。
容量が小さくなるんだとかいう人(誰)とかもいそうなので油断できません。iモード派(謎)とか。

dddd 2000/05/18(木) 00:06:29
>けれども、半角カタカナの使用に対する一般的なアドバイスと
>しては「使用しないほうが良い」となります。理由としては
>『使っていいことは何もない』こととなるようです。
それは御意。
ただ、むしろ質問者のおか氏がなぜ「使ってはいけないのか?」と
いう点にこだわりを見せているのかのほうが気になるんだけど。
誰かに「半角カナ使うなよばーか」なんて言われちゃったとか(謎)。

dddd 2000/05/18(木) 00:08:58
>容量が小さくなるんだとかいう人(誰)とかもいそうなので油断できません。iモード派(謎)とか。
i-modeはシフトJISだけって決められてるから全く問題なし。
アプリケーション側もシフトJISに決め打ちできる。

D.D. 2000/05/18(木) 00:24:24
>i-modeはシフトJISだけって決められてるから全く問題なし。
>アプリケーション側もシフトJISに決め打ちできる。
それはそうなんですが、そこからいろんなとこ(何処)に飛び火(謎)しないかなぁとか。
まあ、僕はあまり気にしないのですけど。

おーなーしぇふ 2000/05/18(木) 01:02:28
※以下参考まで……:

>古いブラウザなどでは漢字コードの判定を誤る可能性がある
文字コード指定との関連でいえば、NN2.0xでは

<META HTTP-EQUIV="Content-Type" Content="text/html; charset=Shift_JIS">

では文字化けします。これは、NN2.0xの時にはまだ「charset=Shift_JIS」と
いう設定がなく、代わりに「charset=x-sjis」となっていたためで、上記の
場合は、指定することでかえって自動判別機能も不能になるという……(^^;)

<META HTTP-EQUIV="Content-Type" Content="text/html; charset=x-sjis">

ならNN2.0xでも文字化けしませんが、仕様書と照らし合わせるならば
「正しくない」となるでしょうか……
※でも私はこちらを指定してますが(笑)

dddd 2000/05/18(木) 01:57:03
>仕様書と照らし合わせるならば
そもそもmetaのcharsetではなく、はじめからHTTPヘッダを使えば
いいだけ。

2000/05/18(木) 02:37:24
なんだか、盛り上がってるなあ。

ところで、みんこさんの言ってることの意味が全く分かりません。
ポスペで半角カナが化けることと、HTML文書に半角カナを使うことと
何の関係があるんでしょうか?

>『使っていいことは何もない』こととなるようです。
これは御意です。
また、
>わけもわからず「半角カナを使うと全世界の人に迷惑がかかる(謎)」
>とか思い込んでる人たちのページとか。
こういう人や、
>誰かに「半角カナ使うなよばーか」なんて言われちゃったとか(謎)。
こういう人の攻撃を事前に避けるために半角カナを使わないと言うのは
それなりに無難な選択しかと思われます。

ちなみに、俺もあまり半角カナを見るのは好みませんが。

みんこ 2000/05/18(木) 09:55:57
>ポスペで半角カナが化けることと、HTML文書に半角カナを使うことと
>何の関係があるんでしょうか?

ポスペでHTML文書開くと化けますので
そーゆー場合に使用していただきたくないかなと。
HTML文を開くのがネットワークブラウザだけとも限らないので。
いや勿論ここでこういう話をされてる方々は
こんなしょーもない場合を想定してる訳ではないと
承知の上ですが、そういう条件の人が見てる人にはいるかなあと。
…多いんですようちのペットに半角カナ読ませようとする人…。

D.D. 2000/05/18(木) 11:06:41
>HTML文を開くのがネットワークブラウザだけとも限らないので。
ていうか、例えばWindows付属のペイントでHTML文書を開こうとしても開けませんが、それはHTML文書に未対応なもので開こうとする人(誰)が悪い(謎)ということになるはずです。だから
>ポスペでHTML文書開くと化けますので
>そーゆー場合に使用していただきたくないかなと。
は却下(謎)。

みんこ 2000/05/18(木) 11:51:24
> それはHTML文書に未対応なもので開こうとする人(誰)が悪い

あー、そーですね。 この場合はHTML文書で半角カナの場合でした。
切り分けちゃダメですね。

それだけだとアレなので過去ログから似たようなタイトルを探してみました。
対ロボット用METAタグで半角カナ入れて、
その後に文字コード指定でシフトJIS指定したら
ロボットはシフトJISと認識しますかね。EUCと思われないですかね。

http://www.tohoho-web.com/lng/199708/97082001.htm
http://www.tohoho-web.com/lng/199712/97122000.htm
../199903/99030029.htm
../199903/99030095.htm
../199809/98090083.htm

dddd 2000/05/18(木) 14:33:51
そんなの、ロボットにどう認識されるのか不安に思うくらいの
キーワード書くほうが悪いだけじゃん。

dddd 2000/05/18(木) 14:35:33
>HTML文を開くのがネットワークブラウザだけとも限らないので。

あなたそれ、日本語に対応してないソフトで開くから日本語使うな
とか言い始めるのと同じだよ。

みんこ 2000/05/18(木) 16:30:59
> ロボットにどう認識されるのか不安に思うくらいのキーワード書くほうが悪い
分かって書いてるんだから分かってん。
環境限定で、書き順限定で、他の環境への影響ヌキでならOK
という状態だと、分かる人ならいいけども
「誰でも使って良し」とは言い切れないんじゃないかと思って
いろいろ変な環境条件並べてみてるだけですわ。

> 日本語に対応してないソフトで開くから日本語使うなとか言い始めるのと同じ
自分だけに限れば「ポスペで開くからHTMLメールは勘弁★」
とは言いたいかも。ダメかなあ。ダメですか。
HTML文書、という条件で話してるから、ブラウザじゃなくて
メーラーで使う場合もあるかなと思ったんですがね。

> いろいろなページで半角カナはご遠慮くださいというのを見るにつれ
これだけ見ると、世間一般全てシフトJISで書いたページや
HTMLメールが読めるメーラー持つ人ばかりではないから…
じゃないかと思うんですが。
一番大きいのは、「そか、ネットは半角カナ使っていいんだ★」
と、状況認識なしで思いこむ人を作りたくないからかも。
文字化けはしない、させないに越した事はないと思うんで。

とここまで書いて、HTMLで半角カナを使いたがる状況を
思い出しました。…絵文字…。

dddd 2000/05/18(木) 17:13:53
>一番大きいのは、「そか、ネットは半角カナ使っていいんだ★」
>と、状況認識なしで思いこむ人を作りたくないからかも。
ていうか使っていいんだよ。全く問題ない。使い方を間違わなければね。
むしろ不正確な知識で「使ってはいけない」と思い込んでいるやつらが、
その不正確な知識を根拠にして、半角カナを使った人に対して「半角カナ
使うんじゃねーよバカ」とか言うような事態はあってはならないと思う。
だから、「使っていい」ということをまず知って、次に「使うメリットは
あまり無く、むしろデメリットのほうが大きいことが多い」ということを
認識させたほうがいい。単純に「半角カナはご遠慮ください」と書いて
あったら、「なんで使っちゃ駄目なの?」という疑問がわくのは自然だと
思うし、たいがいは、「なんで?」って聞いてもろくな答えが返って来ない。
むしろページ作者の側がもっと正確な知識を備えて欲しいくらいだ。

wwwでは、どの文字コードで符号化するかどうかの話なのだから、
半角カナを含む文字コードであれば使っても全く問題ない。
mailやnewsでは、ISO-2022-JPが(デファクト)スタンダードだから、
それしか正しく解釈できないクライアントもいる。8ビットを落とす
古いサーバもある。だけどもそのためのMIMEなのだから、宛先との
合意を得たうえで、きちんとbase64とかで固めてやればいいだけ。
wwwではどうかという話なのにも関わらず、なぜかmailやnewsの話が
出てきてわけわかんなくなる。

>とここまで書いて、HTMLで半角カナを使いたがる状況を
>思い出しました。…絵文字…。
はぁ? 何いってんの。MS UI Gothicで見てみな。全角とか半角とか
何のことだかさっぱりわかんなくなるよ。
半角カナは使っても全く問題ないけど、i-modeとかみたいなパケット
単位で課金されるようなシステムでない限りは、殆ど意味がない。

Syn [E-Mail] 2000/05/18(木) 17:20:41
> 対ロボット用METAタグで半角カナ入れて、
> その後に文字コード指定でシフトJIS指定したら
> ロボットはシフトJISと認識しますかね。EUCと思われないですかね。

RFC 2070 や HTML 4.01 では、 <meta http-equiv="content-type">
で文字コードを指定する場合は、それ以前に ASCII 以外の文字を
置かないようにしましょう、となっているようです。

RFC 2070 (日本語訳) :
(http://www.asahi-net.or.jp/~bd9y-ktu/HTML2x.html)
> どの文書に於いても、コード化体系の示唆を以下の様に文書頭部
> (ヘッダー)のできるだけはじめに含むことは可能です:
> <META HTTP-EQUIV="Content-Type"
>   CONTENT="text/html; charset=ISO-2022-JP">
> これは絶対安心といえるものではありませんが、メタ要素が解析
> される迄は少なくともただASCII文字のようにASCII値オクテット
> があるだけ、といったコード化体系の場合はうまく働くでしょう。

HTML 4.01 (日本語訳) :
(http://www.asahi-net.or.jp/~sd5a-ucd/rec-html40j/translation/charset.html)
> 符号化方法に関するMETA宣言を用いるのは、当該の符号化方法が
> ASCII文字をASCIIコードと同じコードで記すような場合に限定す
> る必要があります。(少なくともMETA要素が解析されるまでの間
> に現れる字句について。)

dddd 2000/05/18(木) 17:33:28
>自分だけに限れば「ポスペで開くからHTMLメールは勘弁★」
>とは言いたいかも。ダメかなあ。ダメですか。
そもそもHTMLメールに限らずとも、ISO-2022-JPのプレーンな
テキスト以外の日本語のメールは、相手の合意のうえで出すべき
なので、勘弁だと思ったら出してきたやつにそう言ってやればいい。
メーリングリストやニュースとかでHTMLメールが叩かれるのは、
それにActiveXが仕込まれてたらどうするとかそういう以前の
話で、「相手が不特定多数なので合意が得られないから」という
部分が大きいと思われる。

おか 2000/05/18(木) 17:44:16
> ただ、むしろ質問者のおか氏がなぜ「使ってはいけないのか?」と
> いう点にこだわりを見せているのかのほうが気になるんだけど。

 ことの発端はデータベースに登録されている半角カナをそのまま表示
してよいのかでした。全角に変換するのならばなぜ変換が必要なのかを
明示する必要があります。
 よく分からんがとにかく変換するというのでは説得力がなさすぎます
ので。

 テストをしてみた限りでは問題がない(検査項目が不十分かもってのは
ありますが)、規格でも禁止されていない(と読みとった)となると後は
メジャーな環境(Win,MAC)や実装(IE,NN)で問題があるのかと思ったわけ
でして…。

> 誰かに「半角カナ使うなよばーか」なんて言われちゃったとか(謎)。
 その程度の問題なら楽なんですけどね。junetの黎明期から文字コードに
関する議論は見てきましたが、最近はJavaの普及もあってUNICODEの知識
まで求められるようになって大変です。

dddd 2000/05/18(木) 17:47:50
> ことの発端はデータベースに登録されている半角カナをそのまま表示
>してよいのかでした。全角に変換するのならばなぜ変換が必要なのかを
>明示する必要があります。
なるほど。変換するように作っといたほうが良いよ。
DBの新規データは半角禁止にしたりとか。

> その程度の問題なら楽なんですけどね。junetの黎明期から文字コードに
>関する議論は見てきましたが、最近はJavaの普及もあってUNICODEの知識
>まで求められるようになって大変です。
それはむしろJavaよりXML絡みだと思うな。

dddd 2000/05/18(木) 17:50:35
ふと思ったけど、文書中には含めたくないけどどうしても半角カナを
使いたい、だったら、表示に関してなら数値実体参照にすればいいので、
そうして下さい>該当者(誰)

2000/05/18(木) 17:59:46
> 誰かに「半角カナ使うなよばーか」なんて言われちゃったとか(謎)。
ま、半角カナが嫌いな人間(俺含む)がいる以上、こういうことを言う
馬鹿もいるんでしょうね。いや、俺は言いませんけど。

ちなみに、全角アルファベットでだらだら書いてあるのも嫌いです。
いや、短ければかまわないんですけど。

まあ、別にこだわりません。使いたければ使って下さい。

ま、俺みたいな人間の中にたまにああいう馬鹿が混じってるから、結局
半角カナは使わない方が無難であるぐらいの結論に落ち着くんでしょうね。

dddd 2000/05/18(木) 18:54:36
だからといって、
>一番大きいのは、「そか、ネットは半角カナ使っていいんだ★」
>と、状況認識なしで思いこむ人を作りたくないからかも。
このような何も知らないBG系にとっては一見正しそうに見えるかも
しれないが、実は全くもって不正確な発言を許してしまうと、
何か嘘を吹き込まれても、誰もそれを修正できない状況に
陥ってしまいます。どうしたらいいですか(謎)とほほさん(誰)。

B-Cus 2000/05/18(木) 20:42:16
> なぜかmailやnewsの話が出てきてわけわかんなくなる。
僕は、コンテンツに含まれる文字の種類によって「web ではOK」とか、
「メールでそのまま送ってはダメ」なんてことを いちいち考えたく
ないので半角カナも補助漢字も使わない、と。

それらが問題にならないような状況なら、半角カナを使っても
いいんでない、と言っているわけです。

D.D. 2000/05/19(金) 00:02:15
>それらが問題にならないような状況なら、半角カナを使っても
>いいんでない、と言っているわけです。
ていうか
>そのまま ISO-2022-JP に変換することができない。よって、fj には流せない。
とかいう特殊な状況をわざわざ例示する意味なんてないでしょ。

B-Cus 2000/05/19(金) 00:21:39
何が言いたいのかよくわかりませんが、fj を出したことが
気に入らないんですか?
# 別に特殊な状況とは思いませんけど。

そのときは ISO-2022-JP と言えば fj が思い浮かんだので
書いたまでですが、それが不適当と言われるなら「ISO-2022-JP に
変換することができないので、メールでそのまま送ることが
できない」と言い替えましょう。

もし「ISO-2022-JP に変換できないというのは半角カナの
欠点ではない」ということなら、それは考え方の違いでしょうね。

D.D. 2000/05/19(金) 01:10:02
そもそも、最近ではfjとかを使う人は少数派だという印象がありますが、それはともかくとして、メールでも同じだと思った。
質問者(誰)は
>HTML文書に半角カタカナを含めてはいけないのでしょうか?
と聞いてるのにmailやnewsを出してくるのは筋違いだというかおかしいというか。もしかして、みんな(誰)を混乱させたいのですか?

dddd 2000/05/19(金) 05:45:10
HTML文書というだけではwwwとは限定できないじゃないか系の
突っ込み(謎)を想定してあらかじめ書いておけば、metaの
charsetを強調しているという時点でHTTPはおおよそ間違い
ないので、つまりwwwなことをわかればよろしい(謎)>該当者(誰)

それに、
>CGIでは問題があるというのを聞いた事はありますが、これは
>CGIの問題でしょうし、
と言っているのだから、mailやnewsを出してアプリケーション的に
どうだとかいうのは問題の焦点ではないことをハナっから明示して
いるし、まあ
>サーバー側はサーブレットを使用すれば
>UNICODEですので問題ないと理解しています。
これはいまいち意味不明な部分もあるけど。

ワイ 2000/05/19(金) 10:30:09
> と聞いてるのにmailやnewsを出してくるのは筋違いだというかおかしいというか。
WWWでの半角かな使用に関して、
/*
そのドキュメントを流用してメールやnetnewsで送ろうとした場合、変換する必要が生じる。
故に文書の再利用性が失われるので、たとえWWWであろうとも使用してはいけない。
*/
……という意見もあるようです。
っていうかこの場合、ドキュメント執筆者と流用者どっちが気をつけるべきなんでしょうか?

2000/05/19(金) 11:11:39
常にBASE64で変換すれば問題なし。

Fuji.♪ [E-Mail] [HomePage] 2000/05/19(金) 11:16:58
メールで流用したいなら添付なりポインタ示すなりしてやればいいだけでは。

それに、「メールで引用したりする時に変換する必要性がないように→じゃ、元々のリソースは日本語の文書ならISO-2022-JPで書かなきゃダメじゃ?→じゃあ半角カナなんてないじゃないから問題ないでしょ」という話の展開も可能です。
そもそも「変換することで再利用性が失われる」のであれば、Shift-JIS/EUC-JPで書くこと自体許してくれなさそうですよね。 :-)

dddd 2000/05/19(金) 11:36:09
>/*
>そのドキュメントを流用してメールやnetnewsで送ろうとした場合、変換する必要が生じる。
>故に文書の再利用性が失われるので、たとえWWWであろうとも使用してはいけない。
>*/
ソースのURLとかあったら教えてくらはい。
っつーかそのためのMIMEだってこのスレッドでも書かれまくり済み
だと思うのだけど、なぜ文の上っ面しか読まない?

dddd 2000/05/19(金) 11:38:46
>ドキュメント執筆者と流用者どっちが気をつけるべきなんでしょうか?
はぁ?
wwwで使うことを考えて作られたものをmailで使いたいんなら
そりゃ流用する側の問題でしょ。普通に考えりゃ当たり前じゃん。

とほほ 2000/05/20(土) 00:28:32
議論が続いているようですが・・・

(1)Shift_JISと明記している分には、規格的には問題ない。
(2)ブラウザ側の実装にもよるが、文字化けする可能性が多少高くなる。
(3)半角カナに未対応のメディアに流用する場合に注意が必要となる。
(4)半角カナに未対応のソフト(翻訳とか要約とか)で扱う場合も注意が必要。
(5)精神的に嫌いな人もいる。
(6)WindowsやMacでブラウジングしている分にはほとんど問題発生しないね。
(7)半角カナに泣いているUNIXユーザもいた。(今もかどうかは知らない)
(8)でも、i-modeなどだと、積極的に使うべきなのかも。

・・・などなどいろいろありますが、これらのことをデメリットと判断
する/しないは、個人の自由なんではないでしょうか。

「BASE64に変換すればよい」と考える人も、「BASE64に変換しなく
ちゃいけない」と考える人もいろいろいる訳で・・・
この判断の部分を人におしつけようとすると、またまた宗教戦争が
はじまっちゃいそうですね。

D.D. 2000/05/20(土) 01:04:48
いや、だから質問者の意図するとこを汲まない人(誰)がいるのですが。

qqq 2000/05/20(土) 02:09:15
ここに行けば全てが円満解決(´ー`)v
http://cgi.way.direct.ne.jp/hyd-board/

age [E-Mail] 2000/05/20(土) 03:33:37
あまり面白くないけどアゲ。

dddd 2000/05/22(月) 01:21:03
>この判断の部分を人におしつけようとすると、またまた宗教戦争が
>はじまっちゃいそうですね。
HTTP上のHTML文書で半角カナを使っていいかどうかの話にどうして
宗教が絡みますか?(ピュア)

D.D. 2000/05/22(月) 01:40:43
とほほさん(誰)的には
「ソフトウェアの違法コピー」
とかの問題でも宗教が絡むとか思っているような気も。

しなのむし 2000/05/22(月) 02:14:20
>フォームに入力されたデータがどの文字コードでサーバに送られるかは
>ブラウザに依存するので(最近のブラウザではHTMLの文字コードに合わせるようですが、
>規定は無いはず)、受け手では文字コードを判別しなくてはなりません。
>が、B-Cusさんも仰っているようにSJISの半角カナ文字列とEUCの漢字
>は原理的に区別できない場合があるので、CGIプログラムなどを書く側
>とすれば非常に厄介。→「半角カナは御遠慮ください」と書きたくなる。

自分もこれで困った経験があり、未だ良い解決策を知りません。
ページにたった一文字SJISの半角カナが混じっているだけで
jcode.plを通して記録したデータが化けることがあります。

SJISのみと分かっている状況なら問題ないのでしょうけどね。

dddd 2000/05/22(月) 02:21:09
>自分もこれで困った経験があり、未だ良い解決策を知りません。
ていうか、そういう話についてのスレッドではありませんし。

しなのむし 2000/05/22(月) 21:25:03
>ていうか、そういう話についてのスレッドではありませんし。

どの文字コードなのか、はっきり判別出来ない場合がある以上
HTML文書に半角カタカナを含めると
好ましくない結果を招く場合もあると言っているわけです。

2000/05/22(月) 23:16:03
↑スレッド元発言参照

dddd 2000/05/23(火) 05:16:53
>どの文字コードなのか、はっきり判別出来ない場合がある以上
>HTML文書に半角カタカナを含めると
>好ましくない結果を招く場合もあると言っているわけです。
意味不明です。文書作成者がシフトJISでエンコードと明示して
半角カナを含めているのだから、アプリケーションがそれをどう
解釈するかとは関係ないはずですが。

しなのむし 2000/05/23(火) 20:49:40
>いろいろなページで半角カナはご遠慮ください

これは、やっぱりフォームへの入力についてですよね?
CGIの問題は別みたいに書いていますが
CGIのフォームがあるページもHTML文書なわけで
それにシフトJIS半角カナが使われていると
その後にフォームから渡るデータが化けることがあります。

>文書作成者がシフトJISでエンコードと明示して
>半角カナを含めているのだから、

(シフトJISでエンコードとはどういう意味でしょうか?)

各ブラウザがどのようにして、文字コードを判別し、何の影響を受けるのかが
はっきり判りませんが

文書作成者が意図して
<META HTTP-EQUIV="Content-Type" Content="text/html; charset=Shift_JIS">
としようが
<!-- あ(MOJIBAKE TAISAKU) -->
としようが
Content-type: text/html; charset=Shift_JIS
としようが
シフトJISの半角カナとEUCの誤認識は起きる時には起きます。


# 自分としては真剣におかさんにレスをつけているのですが
# どうも、横から曲げられてしまうので、しつこくなってしまいました。
# これで最後ということで。

2000/05/23(火) 21:01:36
質問者は、
>私は、Windows(IE4,NN4.06以上),MAC(IE4.5,NN4.06以上)と環境を限定
>してWebページを作成しているのですが、
といってるので、METAやHTTPヘッダあたりをちゃんと指定すれば多分大丈夫だと思いますが。
まあ、断言はできませんけど。
><!-- あ(MOJIBAKE TAISAKU) -->
は、HTML4.01あたりで「やるな」と書いてあったような気がします。

>CGIのフォームがあるページもHTML文書なわけで
>それにシフトJIS半角カナが使われていると
>その後にフォームから渡るデータが化けることがあります。
意味が全く分からないんですが、フォームやCGIはこの際何の関係もないと何度言ったらわかりますか?

dddd 2000/05/23(火) 21:12:46
をーい、誰かわからせてやってくれよ (わらひ

しなのむし 2000/05/23(火) 21:55:48
>意味が全く分からないんですが
>フォームやCGIはこの際何の関係もないと何度言ったらわかりますか?

偽氏へ

申し訳ないが、これ以上、分かりやすく言えないので
分かる人にだけ分かれば良いとしか言えません。
たとえ、あなたからは元発言からずれてると思える発言でも
こちらとしては、後々誰かの参考になるだろう
と思える情報だからこそ投稿している訳なのですから
それをわざわざ、関係あるとか無いとか指摘されたくありません。


>をーい、誰かわからせてやってくれよ (わらひ

dddd氏へ

言動のいくつか、はっきり言って不快です。
大人げのあるマナーで頼みます。

dddd 2000/05/23(火) 22:08:11
言いたい放題だなあ。
いちいち指摘しませんでしたが、んなこといったら、僕だってたとえば
># どうも、横から曲げられてしまうので、しつこくなってしまいました。
コレなんか、非常に不愉快だったんですけど。
んで、あなたは
>CGIのフォームがあるページもHTML文書なわけで
このよーに述べてらっしゃいましたが、そもそも質問者のおかさんは
>CGIでは問題があるというのを聞いた事はありますが、これは
>CGIの問題でしょうし、
だと認識しているうえで、
>HTML文書に半角カタカナを含めてはいけないのか?
という質問をしているわけです。
あなたはこの質問に対してひとつでも「含めてよい」「含めてはいけない」の
確固たる根拠となる回答をしたのでしょうか?
僕から見れば横に曲げてんのはあなたのほう。
ま、こだわりませんが。

B-Cus 2000/05/23(火) 22:21:01
> CGIでは問題があるというのを聞いた事はありますが、これは
> CGIの問題でしょうし、
元質問者の「CGIでは問題がある」というのはちょっと意味が
わかりませんでしたが、もし「文字コードの誤認識という
問題がある」ということなら、という仮定の上で。

CGI プログラムが半角カナを誤認識するのなら、ブラウザも
誤認識することもあるでしょうから、すなわち「半角カナの問題」
であり、「半角カナのデメリット」なのではないんですか?
このスレッドでそれらの点について触れることは、そんなに
いけないことなんでしょうか?

SJIS の HTML に半角カナを含めるのは、規格として問題ないことは
わかっています。念のため。

dddd 2000/05/23(火) 22:34:37
>CGI プログラムが半角カナを誤認識するのなら、ブラウザも
>誤認識することもあるでしょうから、すなわち「半角カナの問題」
>であり、「半角カナのデメリット」なのではないんですか?
そうですね。しかしながら、「シフトJISやEUC-JPやUCS-2/UCS-4とか
なら半角カナを使っても全く問題ないが、i-modeのようなパケット
単位で課金喰らうような特殊な環境でない限りは、EUC-JPとの判別が
難しいなどの要因から使うことに意味(意義)は殆どなく、どうしても
使いたいのなら数値実体参照にしてはどうだろうか」ということは、
このスレッドで既に述べられまくり済みなのです。ちゃんと質問の発言から
順に読んでいれば、既に述べられまくり済みのことと殆ど変わらないことを
改めて書く必然ってのは無いと思います。
既に述べられまくり済みのことに対する意見としてならまだしも。
特に、しなのむしさんの場合は「自分としては真剣におかさんにレスを
つけている」ということらしいのですが、そのわりには「HTML文書に半角
カタカナを含めてはいけないのか?」に対する回答は見受けない気が
しました。
それに、質問者のおかさんは、なぜ仕様や規格としてどうなのかという
ことを知りたいのかという事情もきちんと発言されているわけです。
ラウンジは発言番号が出なくてどれって示しにくいので引用しますが、
> ことの発端はデータベースに登録されている半角カナをそのまま表示
>してよいのかでした。全角に変換するのならばなぜ変換が必要なのかを
>明示する必要があります。
> よく分からんがとにかく変換するというのでは説得力がなさすぎます
>ので。
>
> テストをしてみた限りでは問題がない(検査項目が不十分かもってのは
>ありますが)、規格でも禁止されていない(と読みとった)となると後は
>メジャーな環境(Win,MAC)や実装(IE,NN)で問題があるのかと思ったわけ
>でして…。
というわけです。
さらに、おかさんはJUNETの黎明期から文字コード議論を見てきたと
まで言っているではないですか。半角カナがどういうものなのかと
いうのは重々思い知っていることと思われます。

>このスレッドでそれらの点について触れることは、そんなに
>いけないことなんでしょうか?
いけないとは誰もいってないし、上にも書いたようにそれらについては
既に触れられまくり済みで述べられまくり済みだということです。

B-Cus 2000/05/23(火) 23:40:17
では、しなのむしさんの発言は本題と無関係なわけではなく、
しなのむしさんの発言が不適当というわけでもないんですね。
それがわかれば十分です。

dddd 2000/05/23(火) 23:49:34
質問とは無関係でしょうね。

dddd 2000/05/23(火) 23:58:31
というか、本題(質問の主旨)とは無関係だろうし、回答としては
不適当だろうけど、ラウンジ的には問題ないだろうし、別に
誰も発言するなとも言ってないのだから構わないんじゃない?
という感じです。だからこそ「こだわりません」なのですが。

ヒソカ 2000/05/24(水) 00:05:09
今回の案件において
おか氏は規格も充分承知された上でCGIも使わない。
Windows(IE4,NN4.06以上),MAC(IE4.5,NN4.06以上)
と環境を限定して、問題の発生の有無を確認されています。
っつーことで・・・・

匿名希望 2000/05/24(水) 00:15:22
いつもこのラウンジはとても参考にさせていただいています。
場所によってはとてもよい雰囲気で解決に向かっています。
しかし、ddddさんはここに訪れている方々に恨みでもあるのでしょうか?
不適切で不愉快な発言があり過ぎです。
即刻態度、文脈を修正して下さい。
でないと正しくこのラウンジを利用されている方々に失礼です。

とほほさん、このような発言誠に申し訳ありませんでした。
これからもこの場所は有難く利用させていただきます。

dddd 2000/05/24(水) 00:18:30
匿名希望さんは僕に恨みでもあるのでしょうか?

D.D. 2000/05/24(水) 00:19:31
匿名希望ってウザイ。不適切で不愉快です(謎)。

質問の意味を曲解したり、事実に反するようなこととか書くからつっこまれるんだよ。

> 匿名希望 2000/05/24(水) 00:24:34
文脈???????

B-Cus 2000/05/24(水) 00:55:25
# 丸くおさめようとしても、うまくいかんもんだなぁ :-)

本題に無関係かつ回答として不適当。なのにラウンジ的には
問題がない、と。わかりませんねぇ。

> ラウンジ的には問題ないだろうし
問題ないなら
> をーい、誰かわからせてやってくれよ (わらひ
こんなこと書かなきゃいいのにね。

D.D. 2000/05/24(水) 01:08:15
ラウンジってそういうところだからでは?

dddd 2000/05/24(水) 01:25:42
>本題に無関係かつ回答として不適当。なのにラウンジ的には
>問題がない、と。わかりませんねぇ。
まだわかんないの?
つまりしなのむしさんの無関係かつ不適当な発言に対して
「意味不明だ」とか「関係ないって何度いったらわかるんだ」とか
コメントした、偽さんや僕のほうが、たとえ本題に関係あって回答と
して適当な発言をしていたとしても、ラウンジ的には問題アリに
なっちゃうってこと。

使用上の注意にちゃんと書いてあるでしょ。
>また、誰かが問題のある発言を行った場合も、決して注意したりしないでください。

これを言い換えればつまり、
「誰かが嘘を書いても決してそれを訂正することが出来ない」
ということになるんだよね。特に、「半角カナは駄目」系の
不正確な知識のほうが蔓延してるよーな話題のときなんて、
指摘&訂正するほうが大変なの。出入り禁止覚悟なわけ。

しなのむし 2000/05/22(月) 02:14:20 に対するコメントの
dddd 2000/05/22(月) 02:21:09 コレとか、
しなのむし 2000/05/22(月) 21:25:03 に対するコメントの
ヒ 2000/05/22(月) 23:16:03 とか dddd 2000/05/23(火) 05:16:53 とか
読んでどうよ? 普通に配慮した書き方になってると思うんだけどね。
だけどそれに対する表現が、
># 自分としては真剣におかさんにレスをつけているのですが
># どうも、横から曲げられてしまうので、しつこくなってしまいました。
コレだよ? 失礼な言い草だと思わない?
だからお返しに
> をーい、誰かわからせてやってくれよ (わらひ
って書いてやったら、さも自分は全然悪くないと言わんばかりに
>言動のいくつか、はっきり言って不快です。
>大人げのあるマナーで頼みます。
こう来たもんだ。
お返しなんかしなけりゃいいじゃねえか、という指摘もあるかもしれない。
でも僕は不快だと名指しで言われるまでは、しなのむしさん個人を
批判はしてなかったんだけど。せっかくこだわってなかったのにさ。


匿名希望氏へ

申し訳ないが、これ以上分かりやすく言えないので
分からないやつには説明しても無駄としか言えません(わら

dddd 2000/05/24(水) 01:28:27
あ、ちなみに
>ヒ 2000/05/22(月) 23:16:03 とか dddd 2000/05/23(火) 05:16:53 とか
と言っても、ヒさんと僕は別人物なので誤解なきよう。

ヒソカ 2000/05/24(水) 01:38:47
B-Cus氏に正義の仲裁役させてあげれば?  > D.D. and dddd

私は匿名希望氏の発言に悪意を感じ、非常に不快に思いました。
ラウンジというもともと匿名性の発言を許される場に置き、
通常使用しているニックさえも隠蔽し、他の発言者に対し
名指しで批判をするのは言葉尻をどう繕おうとも卑劣であり、
悪意を感じざるを得ません。こういった行為は体裁をどう繕おうとも
某2ch系掲示板等における*****(表現が不適切なので敢えてここには
書きませんが・・)というような書き込みと意図は変わらないでしょう。

2000/05/24(水) 01:52:23
>B-Cus氏に正義の仲裁役させてあげれば?  > D.D. and dddd
B-Cusさんにその権利はないはずです。(わら

ところで、唯一仲裁の権限が持たされているとほほさんはスーパーマン
でなければならないと思うんですが、どうなんでしょう、そこのところ。

ヒソカ 2000/05/24(水) 02:13:16
当然権利が有ればこのコメントは不必要なはず。
> B-Cus氏に正義の仲裁役させてあげれば?  > D.D. and dddd
B-Cus氏が善意と自分で信じておられるようなので、このコメントに
なった訳だよね。

> ところで、唯一仲裁の権限が持たされているとほほさんはスーパーマン
> でなければならないと思うんですが、どうなんでしょう、そこのところ。
とほほ氏がスーパーマンであるわけがありませんが、この板を無くすことも
出来る権限はあるわけです。彼は彼なりにそうあろうとしているはずだし、
そう努力していただかなくてはこまるわけです。

彼に対する批判をする権利はもちろん、参加者全員が持っているのは事実
だし、それに対して実力行使(だまって消す)をする権限を彼はもっているわけです。

マナーの問題を別にすれば、消されるのを覚悟の上でどんな批判だってできるはず。
単なる誹謗中傷はするほうが惨めなだけだけれどもね。

dddd 2000/05/24(水) 02:22:14
まあ、とほほさんから見たら、レッドカード所持者の僕が
悪いに決まってるんだと思う。


ていうか、早く解決チェックしてください(わら

ヒソカ 2000/05/24(水) 02:30:52
お互い目をつけられていますからね。
判断はとほほ氏の主観に委ねられるんですから、
どうしようもないでしょう。

ただ、読んだ人が今までのやり取りをどうとるかまで変える
権限はだれももっていないはず・・

自分の正義を信ずるならそれでヨシ。

dddd 2000/05/24(水) 02:32:09
>ところで、唯一仲裁の権限が持たされているとほほさんはスーパーマン
>でなければならないと思うんですが、どうなんでしょう、そこのところ。
仲裁なんかどうでもいいから、とほほさんがこのスレッドで羅列した
(1)〜(8)を何とかして欲しい。(ピュア)
だってwwwとmailがごちゃ混ぜなんだもん。全然まとめになってない。

>「BASE64に変換すればよい」と考える人も、「BASE64に変換しなく
>ちゃいけない」と考える人もいろいろいる訳で・・・
コレなんかマジで意味不明だし…。

2000/05/24(水) 02:33:14
少々辛辣ですが‥‥‥
> この板を無くすことも出来る権限はあるわけです。
それじゃ、根本的解決になりませんよ。
それで一体誰が納得しますか?
> 彼は彼なりにそうあろうとしているはずだし、
> そう努力していただかなくてはこまるわけです。
努力されても無意味です。
このラウンジで起こるあらゆるトラブルを1人で解決するためには現時点で
スーパーマンでなければなりません。
違いますか?

> 単なる誹謗中傷はするほうが惨めなだけだけれどもね。
御意。
むしろ、笑い飛ばした方が楽しめます。(謎)

ヒソカ 2000/05/24(水) 02:42:35
> このラウンジで起こるあらゆるトラブルを1人で解決するためには現時点で
> スーパーマンでなければなりません。
> 違いますか?
彼がこのラウンジを自分の思い通りの発言で埋めたいのであれば
そういうことになりますね。

私はもうこのスレッドは放棄します。
このスレッドからは技術的興味はもうみたせないでしょう。

dddd 2000/05/24(水) 02:55:05
>このスレッドからは技術的興味はもうみたせないでしょう。
んだね。

D.D. 2000/05/22(月) 01:40:43 の発言で終わってたというか、
とほほさんの回答待ちのスレッドだったのに。

ま、こだわりませんが。

2000/05/24(水) 02:59:56
なんか、脱線が激しくなってきたような気がするので、質問者の意図を
酌んだ上でこのトピックの内容に俺の知識を加味してまとめてみます。

・META要素やHTMLヘッダなどで文字コードを指定すれば高い確率で文字化けを押さえる
 ことが可能。

>  いろいろなページで半角カナはご遠慮くださいというのを見るにつれ、私は
> なにか重大な事を見落としているのではと心配になり質問をしてみたしだいです。
 という質問者の危惧は、基本的にフォームの入力に関わることなのでこの際無関係。
・HTMLファイルに直接半角カナを記述せずに数値文字参照を使うと有効。
 また、この方法ならばISO-2022-JPでも使える。
・META要素には下記のような問題点があるので、HTTPヘッダの指定の方が無難。
 ・Proxyサーバを通したときに、文字コードが矛盾を起こすことがある。
 ・UTF-8などのコードには無意味。
 ・HTML5などでは、META要素による指定を、原則無視する動きがあるらしい。
反論などは、いくらでも受け付けます。

D.D. 2000/05/24(水) 03:09:12
>> この板を無くすことも出来る権限はあるわけです。
>それじゃ、根本的解決になりませんよ。
>それで一体誰が納得しますか?
つーか、ラウンジの閉鎖が再現されるのもありえるわけで。

[上に] [前に] [次に]