[雑記] Javaで入力された文字コードを判別する方法

Pocket

完全に個人的な雑記

javaでHttpURLConnectionとかを使って、サイトを読み込ませたときに入力された文字列の文字コードを判別する方法。

InputStreamReader(InputStream,"JISAutoDetect")
はUTF-8を判別できない。

juniversalchardetで判別してやるとほとんど問題なくエンコードを判別することができる。(幾つかテストしてみたが、全て問題なかった)

InputStreamはいったんByte配列に流し込んで、それを複製して再度InputStreamに戻してInputStreamReaderに通すと良い。→ ByteArrayInputStream()っていうメソッドがある。

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

One thought on “[雑記] Javaで入力された文字コードを判別する方法

  1. 研究開発

    クッキーで保護されてるページをダウンロードする方法

    IDをcookieで認証しているなら、この方法で認証をクリアできます。多分

    Reply

Leave a Reply to 研究開発 Cancel reply