Android Jsoup 网络爬虫抓取网页数据---新手学习详细教程!

Jsoup这个问题说实话困扰了我很久,其实我们先用Java把它写出来,会更加的容易理解。

jsoup官方文档: http://www.open-open.com/jsoup/
jsoup库下载地址:https://jsoup.org/download

大家先导入jsoup库

我先用eclipse给大家先用java写一篇,之后我会教大家如何抓取网络数据后放入Listview中。

我们的目标站点:http://www.68zyw.cn
这里写图片描述
我们要获取红色框中的内容

第一步:这个是jsoup获取网站源码的一个方法

   try
        {   
            Document doc = Jsoup.connect("http://www.68zyw.cn").get();
                  System.out.println(doc);

        }
        catch (IOException e)
        {
    }

我们可以先把它打印出来看结果。
这里写图片描述

很明显,这就是http://www.68zyw.cn的网站html的源码

我们接着写

第二步:
这里写图片描述

我们发现这个标签中

有我们想要的内容
所以我们可以这样写

        try
        {   
            Document doc = Jsoup.connect("http://www.68zyw.cn").get();
            Elements elements=doc.select("header.entry-header");
            System.out.println(elements);

        }
        catch (IOException e)
        {}

我们把elements打印出来
这里写图片描述

果然这就是这个标签中的内容

我们继续写:

  try
        {   
            Document doc = Jsoup.connect("http://www.68zyw.cn").get();
            Elements elements=doc.select("header.entry-header");
            System.out.println(elements);    
            for(int i=0;i<elements.size();i++) {
                String url=doc.select("header.entry-header").select("h2.entry-title").select("a").get(i).attr("href");
            System.out.println(url);
            }

        }
        catch (IOException e)
        {}

我们一步一步往里面爬,get(i) 相当于就是获取到每一个标签内的内容,因为此时这些重复标签变成了一个数组类型,我们要一个一个取出来
结果图:这里写图片描述

好了,其他内容也都是一样的!!!

第一次写文章,希望大家支持!

下一次会出一个把这些数据放入Listview中!其实大家也可以自己去试一试!!!

不懂的可以留言。。。

原文链接:加载失败,请重新获取