主要功能
(1)定向采集目標網站內容,并直接發布。
(2)可以設置對應入庫的分類。
(3)可以自定義文章的標簽。
(4)可以自定義替換標題、文章內容。
(5)自動另存為圖片到本地。
(6)自動刪除內容中的所有鏈接。
(7)加入百度翻譯,可以將內容翻譯成英文。
(8)腳本定時自動增量功能。
插件截圖如下
?
如何安裝WordPress采集插件WP-JPost?
方法一:在后臺插件中直接搜索“wp-jpost”
方法二:在WordPress插件官網下載,然后上傳安裝
https://wordpress.org/plugins/wp-jpost/
相關推薦:《WordPress教程》
如何添加采集任務?
任務名
命名請使用英文字母數字組合.?例:douban。
抓取目標網站域名(網址以/結束)
這里填寫目標網站首頁的地址,以/結束。?例:https://www.douban.com
抓取目標網站列表頁
列表頁一般都是二級頁面,是欄目的具體展示頁,一般是用頁內跳轉的鏈接。?例如:https://www.douban.com/group/meituikong/
入庫目標分類ID
WordPress?后臺?--?文章?--?分類目錄?--?編譯你想入庫到的分類?--?查看瀏覽器地址欄的地址。? 例:/wp-admin/term.php?taxonomy=category&tag_ID=38...?這里的tag_ID=38,這個38就是我們需要填寫的值。
標簽
WordPress?入庫時,寫入文章的標簽值。多個標簽請使用,分割(英文狀態的逗號分隔)?例:WordPress,LaoJi,wp-jpost。
目標網站a鏈接元素
分頁格式
列表頁中第二頁區別列表頁的地方。例:?列表頁地址:https://www.douban.com/group/meituikong/? 翻頁后變成:https://www.douban.com/group/meituikong/discussion?start=8850? 那么這里就填寫:discussion?start={page}?這里的?{page}?就是翻頁變化的地方。
分頁最大值
這里填寫翻頁后最后的page值。例:?http://147hub.com/page/2052?這里翻頁的最大值,即填寫:2052
獲取單頁標題、目標單頁獲取元素 :title
內容頁中標題、內容的標簽值。同jQuery選擇器方法。下面我們具體得講述一下怎么選擇元素。
首先我們需要使用chrome、firefox之類的瀏覽器。這些瀏覽器都具有調試等功能。我們這里以Firefox為例。?
首先分析代碼,以下元素標簽可以是div , h3 ,title ,span , p 等。 例:…元素標簽>,那么我們應該則填入:元素標簽.classname。 例:…元素標簽>,那么我們應該則填入:元素標簽#classname。?
步驟:
1、網頁空白處右擊 — 查看元素 。 下面會彈出一個調試器出來。
內容搜索值 、內容替換值(可以批量多個替換)
比如標題正文中帶有一些原來的字符串,我想替換成我的,或者不要了。 注意:這里如想替換成一樣的值,可以直接寫一個。如每個替換成不同的則需要對應填。
例:?
搜索值:- 摔角資料, – 賽事新聞 – 摔角網, – 賽事戰報, – 摔角網?
替換值:?
搜索值:搜索1,搜索2,搜索3?
替換值:替換1,替換2,替換3 注意這里要一一對應。例如搜索2去要替換成空則替換值也需要留空(替換1,,替換2),否則就不能對應替換了。