采集北京市政百姓信件内容的具体步骤

发布时间 2023-09-04 23:25:56作者: yesyes1

1、新建一个能够存储数据的文件夹

2、进入到edu1文件夹里面,将webmagic所需要的jar包上传上去

(压缩包网址在这里:https://github.com/code4craft/webmagic/releases/tag/WebMagic-0.7.3)

如图所示:

之后将jar包解压:

tar -zxvf webmagic-0.7.3-all.tar.gz

它压缩好之后,是出来了一堆jar包;

3、在IDEA新建项目

然后右键pachong1的项目名,新建一个名为libs的文件夹:

4、将解压出来的jar包放置到libs文件夹目录下

之后选中所有的jar包,进行如下操作:

之后选择libraries,再选择+号,再选择java:

然后选中我们刚刚导入进去的jar包,最后再apply,再ok即可:

5、新建一个名为my.webmagic的包

6、在这个新建的包下面,新建一个名为Getgov的class的类

7、代码的编写

暂时省略一下