電話:0471-3256803
青城OA-協同辦公系統
軟件截圖

2-引導頁.jpg  TIM截圖20180330094921.png  TIM截圖20180330094858.png  TIM截圖20180330094736.png  TIM截圖20180330094712.png

青城OA協同辦公系統的功能主要包括公文處理、公告發布、通訊錄、信息查詢、日程管理和郵件提醒等功能。其中公文處理為主要功能包括新建公文、公文處理批復、公文流轉、公文查閱和建立公文列表等功能。


網絡爬蟲

網絡爬蟲實現互聯網數據的實時采集,支持用戶快速的在頁面上選取配置爬蟲規則,或上傳爬蟲腳本能夠快速生成爬蟲任務,并且能夠方便的查看爬蟲統計報表,以及能及速查詢爬取到的數據;對爬蟲任務進行管理,可以暫停,停止,刪除,修改等,提供對爬取到的數據進行初步清洗等,并對外提供接口供各類數據存儲結構(Mysql,Oracle,Hadoop,Mpp等)調用;監控網絡爬蟲運行情況,實時反饋并記錄各類異常信息,并且能夠干預異常任務的運行狀態;負責解析爬蟲腳本,支持HTML頁面的分布式數據爬取,能夠獲取分頁數據、多層嵌套網頁數據,點擊事件回調數據,超鏈接多層下鉆數據等;支持反監控技術杜絕爬取不了數據的可能。并且支持定制化模塊可以對非HTML頁面進行抓取,并且支持高速緩存技術。


系統架構

網絡爬蟲軟件是一個自動下載網頁的程序,它根據既定的抓取目標,有選擇的訪問網頁與相關的鏈接,獲取所需要的信息,無需安裝任何軟件,挖掘互聯網數據、配置規則簡單(支持循環翻頁、集合、點擊事件、模擬賬號登錄)支持分布式采集、定時循環采集、有效的防范IP被封,支持采集數據導出,并且能夠對接各種主流存儲結構的面向主題爬蟲。

網絡爬蟲產品結構分為四個層次:用戶應用層、運行管理層、監控管理層、分布式爬蟲核心,其中運行管理層又包括CAS單點登錄系統、并且可以對接多種存儲結構。



文章分類: 大數據