スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

青い空のJIS X 0213(第3水準、第4水準の訳者注)対応

青い空を更新しました。

第3水準と、第4水準の訳者注の対応をしたので軽くメモしておきます。
※[#「火+華」、第3水準1-87-62]
というやつです。
以下詳しい用語のミスとかはあまり気にしないでください。


せっかく「面、区、点」が指定してあるので、
そこから直接charを作れればよかったんですが簡単には作れないようです。


ISO-2022-JP-2004のコード値を求めることにし、
そこから変換テーブルを利用してUnicodeのコード値を求める方法としました。


JIS X 0213の符号化方式毎の変換テーブルが
http://x0213.org/codetable/
に公開されていますので、その内から第3、第4水準の物を変換テーブルとして実装しました。
※公開していただいた方々にはとても感謝です。


ISO-2022-JP-2004の他に
Shift_JIS-2004
EUC-JIS-2004
もありますが、Shift_JISは変換ルールがちょっと面倒なところ、EUCはISOと同じくらい簡単なんですが、
EUCってのもねぇということで、ISOにしました。



一部サロゲートペアを必要とする文字については除外としました。
もともとテキストのみ対応のだったので、まったくこのあたりは考慮していませんでした。
※文字ごとの処理をしているところを見直すのはそれなりに手間なので切り捨てとしました。


※Java6だとCharSetでやっぱりこのあたりはまだ定義されていないですね。
androidはどうなんだろ?といっても新しいバージョンで対応されても下位互換考えるとちょっと使えないですね。
関連記事

コメントの投稿

非公開コメント

スポンサードリンク
アプリ一覧
最新記事
最新コメント
最新トラックバック
検索フォーム
月別アーカイブ
カテゴリ
RSSリンクの表示
リンク
QRコード
QR
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。