MLDN
课程咨询[孔老师]QQ 1031143579孔老师QQ课程咨询留言 课程咨询[徐老师 ]QQ 945313230
徐老师QQ课程咨询留言
课程咨询[刘老师 ]QQ 514543793
刘老师QQ课程咨询留言
java培训
北京java培训
魔乐培训 高端JAVA培训 魔乐科技JAVA培训 -=> 资源中心 -=> JAVA SE技术专区 -=> JAVA网络编程 -=> 正文

Java实现抽取网页信息

 发布日期:2008-12-1 9:10:00 发布者:[IT电子教育门户]   评论:[]  浏览:

使用正则表达式及字符串操作,抽取网页信息,实现代码如下:

/* 去script */
public static String trimScript(String content) {
String regEx = "<script[^>]*>[^<]+</script>";
Pattern p = Pattern.compile(regEx);
Matcher m = p.matcher(content);
String result = content;
if (m.find()) {
result = m.replaceAll("");
}
return result;
}
/* 去除注释*/
public static String trimComment(String content) {
String regEx = "<!--[^-]*-->";
Pattern p = Pattern.compile(regEx);
Matcher m = p.matcher(content);
String result = content;
if (m.find()) {
result = m.replaceAll("");
}
return result;
}

/* 去除标签 */
public static String trimTag(String content) {
String regEx = "<[^>]+>";
Pattern p = Pattern.compile(regEx);
Matcher m = p.matcher(content);
String result = content;
if (m.find()) {
result = m.replaceAll("");
}
result = result.replace(" ", "").replace(">", "").replace(
">", "");
return result;
}

/* 根据起始位置和结束位置,截取字符串 */
public static String subString(String start, String end, String content) {
int iStart = content.indexOf(start);
int iEnd = content.indexOf(end);
if (iStart < iEnd) {
return content.substring(iStart, iEnd);
}
return null;
}

java视频教程
JAVA核心_76投票程序讲解
 JAVA核心_76投票程序讲..
JAVA核心_75对象序列化练习
 JAVA核心_75对象序列化..
JAVA核心_74对象序列化
 JAVA核心_74对象序列化..
JAVA核心_73字符编码
 JAVA核心_73字符编码 ..
JAVA核心_72Scanner
 JAVA核心_72Scann..
相关文章 推荐文章
如何用Java实现FTP服务器[2.11]
Java获取URL对应的资源[1.9]
Java获取网络主机信息 [1.9]
JAVA反射机制的简单应用[12.2]
Smartupload组件[11.11]
如何用Java实现FTP服务器
在Java EE Server中实现W..
Java获取URL对应的资源
Java获取网络主机信息
JAVA反射机制的简单应用
热门文章
“网络蚂蚁”的Java实现
Java实现利用搜索引擎收集网址的程序..
分页算法(一)
一个完整的Socket例子
读取网络文件
建立推拉门式菜单
JavaScript(一)
用Javascript仿163邮箱网盘..
用JSP+JavaScript打造二级..
在Java Web应用中如何实现任务有..
今日更新
如何用Java实现FTP服务器
在Java EE Server中实现W..
Java获取URL对应的资源
Java获取网络主机信息
JAVA反射机制的简单应用
Java实现抽取网页信息
Smartupload组件
分页算法(二)
分页算法(一)
JavaScript(二)
 评一评
正在读取…
  姓名:
  评论:
    
【注】 发表评论必需遵守以下条例: !!!
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款
关于我们 | 商务合作 | 招聘信息 | 客服中心 | 服务条款 | 免责声明 | 网站导航 QQ留言
Copyright 2009 魔乐培训MLDN.CN all rights reserved 版权所有 京ICP备07008611号