服务器之家:专注于服务器技术及软件下载分享
分类导航

PHP教程|ASP.NET教程|Java教程|ASP教程|编程技术|正则表达式|C/C++|IOS|C#|Swift|Android|JavaScript|易语言|

服务器之家 - 编程语言 - Java教程 - Java 获取Html文本中的img标签下src中的内容方法

Java 获取Html文本中的img标签下src中的内容方法

2021-05-06 11:39安_shuai Java教程

今天小编就为大家分享一篇Java 获取Html文本中的img标签下src中的内容方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

如下所示:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
/**
  * 得到网页中图片的地址
  * @param sets html字符串
  */
 public Set<String> getImgStr(String htmlStr) {
  Set<String> pics = new HashSet<String>();
  String img = "";
  Pattern p_image;
  Matcher m_image;
  String regEx_img = "<img.*src\\s*=\\s*(.*?)[^>]*?>";
  p_image = Pattern.compile(regEx_img, Pattern.CASE_INSENSITIVE);
  m_image = p_image.matcher(htmlStr);
  while (m_image.find()) {
   // 得到<img />数据
   img = m_image.group();
   // 匹配<img>中的src数据
   Matcher m = Pattern.compile("src\\s*=\\s*\"?(.*?)(\"|>|\\s+)").matcher(img);
   while (m.find()) {
    pics.add(m.group(1));
   }
  }
  return pics;
 }

以上这篇Java 获取Html文本中的img标签下src中的内容方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。

原文链接:https://blog.csdn.net/xyajia/article/details/77648413

延伸 · 阅读

精彩推荐