プロフィール

kosaki

Author:kosaki
連絡先はコチラ

ブログ検索
最近の記事
最近のコメント
最近のトラックバック
リンク
カテゴリー
月別アーカイブ
RSSフィード
FC2ブログランキング

スポンサーサイト このエントリーをはてなブックマークに追加

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。


スポンサー広告 | 【--------(--) --:--:--】 | Trackback(-) | Comments(-)

レガシーエンコーディングなオフ会 このエントリーをはてなブックマークに追加

今日、ミラクルリナックスの吉岡さん主催の
「文字コードヲタクで集まってピザとビールを楽しむ会」に参加してきた。
(うそ、本当はレガシーエンコーディング変換機能の開発オフラインミーティング

ちょっと(だいぶ)遅刻してしまいご迷惑をおかけしてしまったのだが、
いやー、ヲタク同士の極めて濃ゆい会話を堪能させていただいた。
普段リアルで顔を会わせる面子で文字コードで盛り上がるなんて不可能だから
こういう集まりは素直にうれしい。


さて、あの場で酒の勢いでいろいろと放言してしまったのだが、
たぶん、今日の酒の量だとほとんどの人は明日には忘れ去られていると思うので
改めてこのブログで意思表明をしたい。


・ISO2022-JP-MSは撤回してほしい、世の中で求められているのは
Outlook Expressが送ってくる拡張ISO2022-JPを受信できることであって
それ以外のエンコーディングは必要ない。
スジがいいとか悪いとかは関係ない。CP5022xでいいじゃん。
現実重視!
・英語ホームページを作って欲しい。アメリカ人の
「なぜUnicode.orgに登録されているマッピングテーブルではダメなの?」
という疑問に答えることはコミュニティに受け入れられる上で極めて重要。
(あってるかどうか自分では確認できないコードをacceptしろと言われるメンテナ
の気持ちを考えよう。そら嫌がるよ)
また、ドキュメントがなければ結局新規ソフトはどんどん森山さん実装と
非互換の実装をしていくので事態はどんどん悪化していく。
・今回開発したレガシーにやさしい変換方式は、
Unicode.orgに登録されているマッピングテーブルと同じファイル形式でも
公開してほしい。
世の中のソフト会社のi18n対応ってのは極めて冷遇されていて、1流の技術者は
コア部分の開発、2流の技術者がnlsサポートみたいなアサインは珍しくない。
するとどうなるかというと、現状、Unicode.orgのマッピングテーブルからコードを
自動生成して対応する。みたいな話は腐るほどある
(特に僕が以前いた組み込みの世界のミドルウェアでは)
だから、ファイルフォーマットに不備があろうがなかろうが、Unicode.orgの
形式重要。ある種のデファクトだから。
・日本の技術者にも、なんでこんなにマッピングがいるのか理解していない技術者は
腐るほどいる。
だから、レガシーエンコーディングWikiに、これこれこういう状況ではxxという
ソフトがこういう送り方をしてくるから受信側でこの変換方式をしていしないと
非互換になって困ってしまうんだ、的な使い方の情報必要。
これがないとマッピングテーブルが増えた分だけ混乱して、
間違った使い方をする人が必ず出てきて非互換がより悪化する
・これはコミュニティの働きかけの問題になってしまうが、
現在の、Windows互換にしようと思ったら、
xxというソフトではCP932と指定する必要があり、
yyというソフトではSJIS-msと指定する必要があり
zzというソフトではMS932と指定する必要があり
また、別のソフトではCP943Cと指定する必要があり、
かつそれをやってもxという文字とyという文字は変換ルールが違うので
文字化け。という状況は無くさなければならないという強い意志をもって欲しい。
(現状、バッドノウハウの塊)
私はWindows31Jと指定したときにソフト・言語によらずマッピングルールが一意に
定まる世界を望む。
そうでなければ、相互運用など出来ない。名前重要!
同じものに同じ名前が付くように働きかけをして欲しい。
・今回進めているレガシーエンコーディングプロジェクトを知らない人はまだ
いっぱいいる。
(てゆーか、僕は知らなかったっす(><;)
もっと宣伝、宣伝。


無論、僕も出来る範囲でお手伝いさせていただきますゆえ・・・


ところで、僕はeucJP-msとCP50932がなぜ両方必要なのかをまだ理解できてません。
だれか教えてくださませ。
お願い


P.S. 芝野いいんちょーと初めて議論させていただきました。やっぱいいんちょーは違うぜ




委員長! ランキング!
関連記事


文字コード | 【2006-05-18(Thu) 00:35:06】 | Trackback:(5) | Comments:(4)
コメント

おや、ここまで委員長まみれにしているのに、アフィリエイトが山名沢湖にならない。マイナーすぎた?
2006-05-17 水 10:39:30 | URL | 革命の日々 #- [ 編集]

ども、先日はありがとうございました。
さて、eucJP-msとCP51932の違いですけれど、森山さんのblogに記述があります。
http://msyk.at.webry.info/200511/article_2.html
これに相当する表を早くWikiに載せてほしいなー、と思っているのですが・・・。
2006-05-18 木 10:48:42 | URL | なるせ #XGYnbBQ. [ 編集]

あ、Wikiにもあった(’’
http://legacy-encoding.sourceforge.jp/wiki/index.php?%B3%C6%A5%AD%A5%E3%A5%E9%A5%AF%A5%BF%A5%BB%A5%C3%A5%C8%A4%CE%C2%D0%B1%FE%B4%D8%B7%B8
ですね
2006-05-18 木 10:52:55 | URL | なるせ #XGYnbBQ. [ 編集]

失礼しました。

えとですね。それは理解したうえで、CP51932だけだと、困るのはだれ?
という問いかけのつもりでした。

芝野委員長の言葉を借りればJIS X 212 なんて誰も使ってないんだから、忘れればいいじゃん。


すくなくとも、IBM拡張漢字とJIS X 212を同時に使っている例って知りません。

であるならば、xxというソフトがeucJP-msですでに大量のデータを蓄積しているから無視できない。という事情があって、それについてコンセンサスが得られてないと後々混乱するんじゃないのー?
というのが意図。

あ、補足。
当日も発言した記憶がありますが、僕は文字コード変換をつくるだけだと、世の中の大多数のエンジニアは使い方がよく分からないから、ちゃんと使い方も啓蒙していかないと、
ひょんげな使い方をされて、よけい混乱するんじゃないのー。
という立場なのね。

ちなみにそういう立場に立って、wikiのCP50932とCP50220には想定使用例の一文を入れましたよん
2006-05-18 木 18:40:52 | URL | 革命の日々 #- [ 編集]
これを見てちゃぶ台をひっくり返したくなった。革命の日々! レガシーエンコーディングなオフ会今日、ミラクルリナックスの吉岡さん主催の「文字コードヲタクで集まってピザとビールを楽しむ会」に参加してきた。(うそ、本当はレガシーエンコーディング変換機能の...
【2006-05-18 Thu 11:57:10】 | 404 Blog Not Found
 「~」がメールで化けてるのが気になるし。  吐きだすRSSも「~」の向きが逆で気持ち悪いし。 ――ってなことを http://sourceforge.jp/projects/legacy-encoding/ (のメーリングリスト) http://blog.livedoor.jp/dankogai/archives/50498948.html http://mkosaki.b
【2006-05-18 Thu 23:37:09】 | 浅倉卓司@blog風味?
他人様のブログのコメント欄でうだうだやるのもなんなので,ここで続ける.昨日,はてなダイアリーを見ていて気づいたことは,はてなでは,JIS X 0212 補助漢字の利用ができる (推奨はしていないまでも,少なくとも禁止はしていない) ということだ.はてなでは,livedoor bl
【2006-05-19 Fri 23:02:13】 | numa's diary
あらかじめ言っておくけど、わたしは文字の専門家ではない。文字の専門家ではないが、コンピュータがデータとして文字を扱う以上、文字を表現する手段として文字コードというものを考えないわけにはいかない。一時期文字コードというものに関わったことはあるにはあるがあ
【2006-05-24 Wed 07:49:10】 | 未来のいつか/hyoshiokの日記
最近Legacy Encoding Projectのメーリングリスト(参加はコチラからどうぞ)でEUCの相互運用性(interoperability)を改善しようって話が盛り上がってる。で、最近ヒトサマのBlogを見ているとBlog界も
【2006-05-28 Sun 18:15:19】 | 革命の日々!
  1. 無料アクセス解析
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。