トップ «前の日記(2009-10-28) 最新 次の日記(2009-10-30)» 編集

日々の破片

著作一覧

2009-10-29

_ ISO-2022-JP

久々にISO-2022-JPなフィールドに出会う。

PCKに変換するとして、どう扱うのが良いだろうか。

先頭と末尾にKI/KO付けて既存のエンコーダ(iconvとか)やクラスライブラリ(new String(ki + field + ko, Charset.forName("iso-2022-jp")).getBytes("windows-31j")みたいなやり方(確認していないのでAPIは怪しい))を使うか?

でも、単純にシフトしたほうが安い早いうまい(?になったり例外になったりする心配ないわけだし)のではないか、とか。

で、この場合は元の文字セットが変わることはないってのが条件だから後者だな。

本日のツッコミ(全3件) [ツッコミを入れる]
_ naruse (2009-10-29 09:40)

CP50221を使ってください

_ naruse (2009-10-29 09:53)

よくよく読むとISO-2022-JPじゃなくて、JIS X 0208が7bitでつっこんであるという話ですか。<br>それだったらiconv実装にもよりますが、iconv -f JIS_C6226-1983 -t SJISとかあったりはしますが、<br>まぁ、後者の方が無難ですかねぇ、JIS X 0208外の拡張部分が非IBM非NECな外字でも救いやすいでしょうし。

_ arton (2009-10-30 07:49)

どうもありがとうございます。<br>>JIS X 0208が7bitでつっこんであるという<br>ですです。で、iconvにiso-2022-jpを指定したら通ったから、JIS X0208の7ビットエンコーディングをiso-2022-jpというのかなと思ったのでした。<br>あと、試してみましたがJIS_C6226-1983は未定義でした(Solaris10)。


2003|06|07|08|09|10|11|12|
2004|01|02|03|04|05|06|07|08|09|10|11|12|
2005|01|02|03|04|05|06|07|08|09|10|11|12|
2006|01|02|03|04|05|06|07|08|09|10|11|12|
2007|01|02|03|04|05|06|07|08|09|10|11|12|
2008|01|02|03|04|05|06|07|08|09|10|11|12|
2009|01|02|03|04|05|06|07|08|09|10|11|12|
2010|01|02|03|04|05|06|07|08|09|10|11|12|
2011|01|02|03|04|05|06|07|08|09|10|11|12|
2012|01|02|03|04|05|06|07|08|09|10|11|12|
2013|01|02|03|04|05|06|07|08|09|10|11|12|
2014|01|02|03|04|05|06|07|08|09|10|11|12|
2015|01|02|03|04|05|06|07|08|09|10|11|12|
2016|01|02|03|04|05|06|07|08|09|10|11|12|
2017|01|02|03|04|05|06|07|08|09|10|11|12|
2018|01|02|03|04|05|06|07|08|09|10|11|12|
2019|01|02|03|04|05|06|07|08|09|10|11|12|
2020|01|02|03|04|05|06|07|08|09|10|11|12|
2021|01|02|03|04|05|06|07|08|09|10|11|12|
2022|01|02|03|04|05|06|07|08|09|10|11|12|
2023|01|02|03|04|05|06|07|08|09|10|11|12|
2024|01|02|03|04|05|06|07|08|09|10|

ジェズイットを見習え