Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?
The Validator.nu HTML Parser is an implementation of the HTML parsing algorithm in Java. The parser is designed to work as a drop-in replacement for the XML parser in applications that already support XHTML 1.x content with an XML parser and use SAX, DOM or XOM to interface with the parser. Low-level functionality is provided for applications that wish to perform their own IO and support document.
Introduction Parsing and traversing a Document Input Parse a document from a String Parsing a body fragment Load a Document from a URL Load a Document from a File Parse large documents efficiently with StreamParser Extracting data Use DOM methods to navigate a document Use CSS selectors to find elements Use XPath selectors to find elements and nodes Extract attributes, text, and HTML from elements
ちょっと大量のHTMLファイルをチェックする作業があって、grep/Perl One Linerで頑張るのも厳しいよなぁと思い、HTMLファイルをJavaでパースしてどうにかしようと思い立ちました、今日。 で、JavaでHTMLパーサといえば、個人的にはパッと思い浮かぶのがNekoHTML。 CyberNeko HTML Parser http://nekohtml.sourceforge.net/ が、いかんせんこれは古い。HTML5にも対応していませんし。 よって、他のパーサを探してみました。2つほど見つかったので、ご紹介します。 HTMLをパースするので、以下のような閉じタグがないHTMLもパースできなければなりません。 index.html <!DOCTYPE html> <html> <head> <title>タイトル</title> </head> <body> <div i
HTMLをパースして画像をダウンロード&表示する方法 HTMLをパースするいい感じのライブラリを見つけたので、 ついでに別のライブラリを使ってパースした画像パスを元に画像をダウンロード&表示させるということをしてみました。 今回はAsyncTaskLoaderを使ってWikipediaのHTMLを取得し、 imgタグの画像をImageView(実体はWebView)に表示させる。 今回使用したライブラリ JSOUP(HTMLパーサ) http://jsoup.org/ Android Query(jQueryのように) https://code.google.com/p/android-query/ 実装 public class MyActivity extends ActionBarActivity implements LoaderManager.LoaderCallbacks<Do
つくって覚えるJava入門のコーディングも飽きてきたので一時中断して、前からずっとやりたかったWeb画面の抽出のコードを書くことにしました。 PC用のWebページをAndroidで見やすく表示するようなアプリ、ありますよね。 いずれあんなアプリを作りたいと考えています。 具体的な処理は、URLからHTMLのタグ情報を取ってきて、解析、整形してWebViewに表示、という流れになると思います。 上記のようなWebから画面情報を抽出する処理をWebスクレイパーと呼ぶそうです。 そこで便利なのが、「tagSoup」 こいつでWebスクレイパーを実現します。 ググればいっぱい情報が出てきますので、それを参考にコーディング。 http://www.google.co.jp/からHTMLを引っ張ってきてリストに表示するだけのコードです。 AndroidManifest.xmlのPermissionsに
TagSoup - Just Keep On Truckin' Index Introduction Tagsoup 1.2.1 released Taggle, a C++ port of TagSoup, available now TagSoup 1.2 released What TagSoup does The TSaxon XSLT-for-HTML processor Note: TagSoup in Java 1.1 Warning: TagSoup will not build on stock Java 5.x or 6.x! TagSoup as a stand-alone program SAX features and properties Other TagSoups and related things More information Introductio
About Joda-Time provides a quality replacement for the Java date and time classes. Joda-Time is the de facto standard date and time library for Java prior to Java SE 8. Users are now asked to migrate to java.time (JSR-310). Joda-Time is licensed under the business-friendly Apache 2.0 licence. Features A selection of key features: LocalDate - date without time LocalTime - time without date Instant
日経ソフトウエア2006年10月号 特集1「Rubyで仕事がラクになる!」 Part4「RubyによるJavaソースコード生成」 補足用特設ページ このページは日経ソフトウエア2006年10月号特集1「Rubyで仕事がラクになる!」のPart4「RubyによるJavaソースコード生成」の補足用特設ページです。本誌では誌面の都合上,説明しきれなかった「テンプレート・エンジンを利用したコード生成部分のリファクタリング」「テストの改良」「Maven2による自動生成ツールの実行自体の自動化」について説明しています。本誌の該当記事をまだご覧でない方は,まずそちらをお読みになってから,このページにお越しください。 テンプレート・エンジンを利用する 本誌の記事ではツールの機能を一通り実装しましたが,ここでは少しコードを見直してみたいと思います。 作成したツールの最終的な出力はソースコードなので,どうして
原文(投稿日:2009/09/03)へのリンク SpringSourceのSpring Roo、Skyway Builder Community Edition 6.3、Blu AgeのM2Springといった最近リリースされたコード生成ツールを見ると分かるのは、エンタープライズJavaアプリケーションの開発におけるコード生成の役割に再び関心が集まっているということだ。 コード生成も含んだモデル駆動開発(MDD)は、ますます関心を集めつつある。それは一般的なJavaアプリケーションで自動生成できるものがいくつもあるからだ。一般的なウェブJavaウェブアプリケーションはDAOのようなクラス、XMLのマッピングファイル、SpringやLog4Jの設定ファイルを利用するが、これらはどれも自動生成が向いている。 Rooは双方向型のコード生成フレームワークで、Springベースのウェブアプリケーショ
Atlas Device SDKs are deprecated. Refer to the deprecation page for details. As of September 2024, Atlas Device SDKs are deprecated. Atlas Device SDKs will reach end-of-life and be removed on September 30, 2025. The Atlas Device SDKs are made up of two parts: the on-device database and Atlas Device Sync. The on-device database will continue to exist as an open source project. Atlas Device Sync is
JavaでJSONをエンコード、デコードするために使われるライブラリのうち、JSONICとJacksonについてのメモです。 Java SE 8とJAX-RSを使ったRESTful Webアプリケーションの開発をターゲットとして、ライブラリをJSONICからJacksonへ変更した際のポイントをまとめました。 ただし本エントリは、JSONICからJacksonへの移行を推奨するものではありません。 リファレンス どちらも基本的にアノテーションを使って出力方法をカスタマイズします。 JSONICの場合、アノテーションは org.arnx.jsonic パッケージにあり、Jacksonの場合アノテーションは com.fasterxml.jackson.annotation パッケージにあります。 特定のフィールドを除外する
We’re getting things ready Loading your experience… This won’t take long.
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く