链接

https://git.oschina.net/jsper/MovieDownload.git

项目参考链接

网页分析

我们使用正在播出的电视剧《暗战危城》的页面来说明如何获取页面信息
如下图所示，在浏览器的开发者工具中，我们审查《暗战危城》页面的元素的时候，可以看到其head标签中含有大量的meta元素，我们只要能够提出出meta的信息就可以获取到电视剧的剧名、简介、海报等信息。

如下图所示，页面中还包含了最近更新：,更新周期：,演员：等信息。

下图红色箭头的部分都是可以点击，调用浏览器或者迅雷进行下载的UI按钮。

审查上面图中的第18集的所在的li的元素，截图如下

可以看到，只要我们根据li提取出第一个span标签下的input标签和后面两个span标签的a标签就可以获取到http下载路径和迅雷下载路径

关于多线程的使用

ExecutorService pool = Executors.newFixedThreadPool(100);
Runnable runnable = () -> {

    //线程要进行的操作
};
//线程池调度线程
pool.execute(runnable);

上面的代码创建了一个大小为100的线程池，线程池自动调用线程，并维持线程的声明周期。

项目对应的POM

<!-- https://mvnrepository.com/artifact/org.jsoup/jsoup -->
<dependency>
    <groupId>org.jsoup</groupId>
	<artifactId>jsoup</artifactId>
	<version>1.10.1</version>
</dependency>
<!-- https://mvnrepository.com/artifact/org.apache.httpcomponents/httpclient -->
<dependency>
	<groupId>org.apache.httpcomponents</groupId>
	<artifactId>httpclient</artifactId>
	<version>4.5.2</version>
</dependency>

程序运行结果

爬取电视剧页面

爬取电影页面

java爬取80s电影网站的视频信息

2016-10-31
java

java爬取80s电影网站的视频信息

链接

项目参考链接

网页分析

关于多线程的使用

项目对应的POM

程序运行结果

java爬取80s电影网站的视频信息

链接

项目参考链接

网页分析

关于多线程的使用

项目对应的POM

程序运行结果

谢谢打赏~