簡數(shù)采集器助手是一款數(shù)據(jù)采集工具,是新一代的網(wǎng)站文章采集和發(fā)布平臺,它完全在線配置和使用云采集,功能強大,操作簡單,配置快捷高效。
軟件特色
簡數(shù)不僅提供網(wǎng)頁文章采集、數(shù)據(jù)批量修改、定時采集、定時定量自動發(fā)布等基本功能,還集成強大的seo工具,并創(chuàng)新實現(xiàn)了規(guī)則智能提取引擎、書簽一鍵采集發(fā)布等特色功能,大幅提升了采集配置和發(fā)布效率。
采集簡單,發(fā)布更輕松:支持一鍵發(fā)布到WorpPress、帝國、織夢、Z-Blog、Discuz、Destoon等CMS網(wǎng)站系統(tǒng),還可以發(fā)布到自定義Http接口。
另外還支持特定文章的“一鍵快速采集”,包括:微信公眾號文章、今日頭條、新聞泛采集、淘寶聯(lián)盟商品。
如果殺毒軟件誤報毒,請參閱安裝文件夾中的報毒說明,添加白名單放心放行即可。
使用方法
采集步驟第一步:創(chuàng)建采集任務(wù)
點擊左側(cè)菜單按鈕“創(chuàng)建采集任務(wù)”,輸入采集任務(wù)名和要采集的”列表頁“網(wǎng)址,如:https://www.cnblogs.com/ (這里首頁即作為列表頁:內(nèi)容含有多個詳情頁即可),詳情頁鏈接可不填,系統(tǒng)會自動識別。
如下圖:
輸入后點擊 ”下一步“
第二步:完善列表頁的智能抽取結(jié)果(可選)
系統(tǒng)會先采用智能算法獲取需要采集的詳情頁鏈接(多個),用戶可以雙擊打開檢查,如果不是想要數(shù)據(jù),可以點擊“列表提取器”進行手動指定,只需要在可視化界面上用鼠標點擊。
智能獲取結(jié)果如下圖:
另外:上面結(jié)果中,系統(tǒng)也智能發(fā)現(xiàn)了翻頁規(guī)則,用戶可以設(shè)置要采集多少頁。也可以稍后在任務(wù)中的“基本信息&入口網(wǎng)址”--》“按規(guī)則生成網(wǎng)址”項中進行配置。
列表提取器 打開后如下圖:
第三步:完善詳情頁的智能抽取結(jié)果(可選)
上一步獲取了多個詳情頁鏈接后,繼續(xù)下一步,系統(tǒng)會使用其中一個詳情頁鏈接來智能抽取詳情頁數(shù)據(jù)(如:標題,作者,發(fā)布日期,內(nèi)容,標簽等)
詳情頁智能抽取結(jié)果如下:
如果智能抽取的內(nèi)容非想要的,那么可以打開"詳情提取器"進行修改。
如下圖:
可以在左側(cè)對各字段進行修改或增加刪除等。
還可以對每個字段進行詳細設(shè)置或數(shù)據(jù)處理(雙擊字段即可):替換,提取,過濾,設(shè)置默認值等等,
如下圖:
第四步:啟動運行
完成后,即可啟動運行,進行數(shù)據(jù)采集了: