「Java」正規表現式でhtmlタグを削除するメモ

投稿者: | 2017年6月17日

サンプルコード

public class StrReplaceDemo {

public static void main(String[] args) {
String str = ” <table border=’1′ cellpadding=’1′ cellspacing=’1′><tr><th rowspan=’2′>都市</th><th colspan=’2′>東京</th><th>大阪</th></tr><table>”;
/**
* html置換
*/
String subStr = str.replaceAll(“\\&[a-zA-Z]{0,9};”, “”).replaceAll(“<[^>]*>”, “\n\t”);
/**
* htmlタグを削除後文字列
*/
System.out.println(“htmlタグを削除後文字列:” + subStr);
}

}

カテゴリー: Java