PDFact是一款智能交互的PDF閱讀平臺,能更方便的提取結(jié)構(gòu)化信息,從而降低信息(即當前文檔提供的 Fact)的獲取成本,通過一些信息點聯(lián)接到更多相關信息(更多的Fact),以提高閱讀信息時的收益。
功能介紹
PDFact 提供什么功能?
PDF 閱讀工具的基本功能,如文本選取(快捷鍵 Tab)、高亮注釋、書簽、打印等。
PDFact 提供了表格模式 (Ctrl+T):我們則將一套有線表格的解析算法內(nèi)嵌到了 PDFact 里面,使得您可以像操控 Spreadsheet 一樣與結(jié)構(gòu)化的表格進行交互。您可以對整個表格進行拷貝,也可以按住鼠標選取多個相鄰的單元格單獨拷貝。Ctrl+T 后用下面的元素周期表試一下!
無線表格也是 PDF 文檔中很常見的元素,但因其表現(xiàn)形式多樣,我們需要在服務器端進行檢測和切割。當您遇到無線表格時,點擊上方工具欄的 即可。
排名 電影名稱 總票房
1 戰(zhàn)狼 2 56.39 億2 哪吒之魔童降世 49.34 億3 流浪地球 46.18 億在框選模式 下(Ctrl+Q),您可以選定一個區(qū)域截圖復制,或者識別內(nèi)部的文字(OCR)。
我們還開發(fā)了信息發(fā)現(xiàn) 的功能。當您打開一篇 PDF格式的專業(yè)文檔時,PDFact 會嘗試用一個精心篩選的內(nèi)置詞典進行離線文本匹配,并劃線標出可提供額外信息的詞匯;其中,點擊上市公司名稱可展開股票信息(如格力電器)、點擊知識點可展開百科內(nèi)容(如 IGBT)。我們嘗試采用這種方式讓您在不中斷閱讀體驗的前提下獲得更多相關信息。再次點擊 可以關閉該功能。