JTidyはSAXじゃなくてDOM
前回SAXとDOMの違いを調べてみました。
昨日、JTidyでヤフーをDOM解析しようとしていたので、
JTidyはSAXとDOMのどちら?と思って調べたら、DOMでした。
JTidyの日本語サイトに書いてあること、
自分の直面している問題に対して、どストライクなんですよね。
↓↓以下、日本語おかしいですがGoogle翻訳しました。
『その場合は、HTML Tidy Java ポート、HTML 文法チェッカおよびかなりのプリンターです。その非 Java のいとこのようなその場合は不正と障害のある HTML をクリーンアップするためのツールとして使用できます。さらに、その場合は実際の html DOM パーサーを提供します。』
HTML文法に不正があってもDOM解析してくれる。
っていう認識でいいんですよね?