完全に個人的な雑記
javaでHttpURLConnectionとかを使って、サイトを読み込ませたときに入力された文字列の文字コードを判別する方法。
InputStreamReader(InputStream,"JISAutoDetect")
はUTF-8を判別できない。
juniversalchardetで判別してやるとほとんど問題なくエンコードを判別することができる。(幾つかテストしてみたが、全て問題なかった)
InputStreamはいったんByte配列に流し込んで、それを複製して再度InputStreamに戻してInputStreamReaderに通すと良い。→ ByteArrayInputStream()っていうメソッドがある。
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
クッキーで保護されてるページをダウンロードする方法
IDをcookieで認証しているなら、この方法で認証をクリアできます。多分