微软 Ubuntu wordpress Windows 程序员 apache Python shell 编程 linux 云计算 nginx Android Firefox centos mysql google java 开源 php

《善用佳軟:高效能人士的軟件應用之道》一2.5 PDF:跨平臺文檔解決方案

本節旨在介紹最實用的、以免費軟件為主的PDF相關工具,同時消除對PDF的常見誤解,較為系統地介紹PDF應用操作,包括PDF虛擬打印機、格式轉換、閱讀及註釋、屬性及頁面編輯、圖文編輯等。

1.關於PDF及本節內容的一些基本說明
(1)關於PDF。

什麽是PDF?PDF是由Adobe公司發明的文件格式,是Portable Document Format的縮寫,意為“便攜文檔格式”。它已成為事實上的電子文檔標準,越來越多的電子出版物、軟件說明書、填報表格都采用PDF格式。

為什麽要用PDF格式?

為了通用:把一篇文章轉成PDF後,讀者無論是用Unix還是用Windows,無論是否安裝有中文字體,都可以正常閱讀。

為了美觀:你精心排版的文件轉成PDF後,對方在屏幕上看到的與你完全一樣,不會有斷行不一致或字體不一致的困擾。

為了安全:在PDF文件中,你可以設置權限密碼,不允許無權限者修改、復制、打印等。

很多時候,生成PDF還會減小文件的大小。

(2)本節內容及說明。

本節主要介紹PDF閱讀、編輯、轉換軟件及相關工具,以免費軟件為主。

下文不涉及破解PDF保護的軟件,未介紹PDF與其他格式之間轉換的軟件,不涉及非Windows環境、LaTeX等軟件。

(3)一些基本而重要的認識。

絕大多數用戶只需要閱讀PDF,而不需要生成或編輯PDF,因此對大多數人來說,只要一個PDF閱讀軟件就足夠了。

如果要“制作”PDF,正確的思路是從其他文件(比如Office、htm、rtf)“轉化”而來,而不是用想象中的“PDF生成軟件”新建→錄入內容→排版→保存而來。此類軟件的正式名稱(網上搜索時)或類別應該是PDF converter、PDF virtual printer,即轉換程序、虛擬打印機。

PDF是一種文件格式,它有不同版本:1.2、1.5……版本越高,功能越強,比如支持動畫、多媒體、附件、表單……但這些高級功能並不常用,準確地說,是極少用。作為PDF的發明者和推進者,Adobe的產品是最穩定的。但是,它也是最昂貴的、體積最大的(為了支持PDF的更多功能)。相對而言,第三方產品只支持有限的(通常也是足夠的)功能,但體積小巧、運行迅速、價格便宜。

在第三方產品中,相當多的種類都基於Adobe或GhostScript技術,另有一些基於獨立開發的技術。

要註意的是,很多國外軟件在處理中文PDF方面會有問題。很多共享軟件不註冊也能一直用,但會在PDF文件上加水印。

綜合多種軟件,可以實現完全免費的PDF解決方案。所以,請不要使用盜版!

2.PDF閱讀軟件及在線應用
再次強調一下,PDF主要用來閱讀,而不是編輯。給你一個doc、rtf、txt,通常你既可以閱讀,也可以編輯。或者說,編輯的時間比閱讀更多。但PDF不太一樣,發布PDF主要是供人閱讀,而不是供人編輯。

閱讀PDF是個很容易解決的問題,並且大多數軟件或在線應用都是免費的。針對不同用戶,善用佳軟給出如下建議。

(1)經典實用類PDF閱讀軟件。

對於經常閱讀PDF的用戶,推薦選擇下面的一款或幾款PDF閱讀軟件。它們都很經典,並且穩定。

Adobe Reader

Adobe Reader(原名Acrobat Reader)是最正宗、出道最早、“名分最正”的PDF閱讀軟件,估計它占的份額在80%以上。

軟件主頁:http://get.adobe.com/cn/reader/。

推薦指數:

優點:最穩定、最兼容。

缺點:體積太大(估計要50MB)。

結論:一般用戶不推薦;但需要用到高版本PDF功能,或其他軟件兼容性出現問題時,可選擇該軟件。

Foxit Reader

軟件主頁:http://www.fuxinsoftware.com.cn。

推薦指數:

優秀的國產軟件,近幾年異軍突起,無論軟件性能還是功能都非常值得贊賞(其界面如圖2-18所示)。


優點:體積小,僅3MB,啟動也快,綠色無須安裝,中文支持極好。

缺點:無明顯缺點。

結論:推薦。詳見善用佳軟博客,讀者可查找“小巧的PDF閱讀軟件:Foxit PDF reader”和“FoxitReader:超小超快PDF閱讀器,代替Acrobat Reader”兩篇文章。

PDF-XChange Viewer

善用佳軟極為看好的一款新秀軟件,更新迅速,進步明顯,功能特別豐富,非常推薦。相信PDF-XChange Viewer會成為Adobe和Foxit的強力競爭對手。

軟件主頁:http://www.tracker-software.com。

推薦指數:

除了上述經典的三款主流PDF閱讀軟件以外,在國外較有影響力的PDF閱讀軟件還有以下幾種。

eXPert PDF Reader:歷史較長,但國內用戶很少。部分人認為比Foxit好一些,筆者沒太用過。
Perfect PDF Reader:界面是華麗的Ribbon風格。沒怎麽使用過,不予評價。
Cool PDF Reader:小巧,僅600KB。沒怎麽使用過,不予評價。
(2)小巧新奇型PDF閱讀軟件。

對於喜歡嘗試更小巧的軟件、更新奇的操作方式的用戶,有如下推薦。

MuPDF


軟件主頁:http://www.mupdf.com。

號稱速度最快。雖不確定這點,但我至少相信它的界面最精簡——無任何菜單按鈕,全靠快捷鍵操作。有Windows版、Linux版,解壓後14.7MB。其界面如圖2-19所示。

Apvlv

軟件主頁:http://code.google.com/p/apvlv/。

Apvlv的熱鍵完全仿照Vim風格,被稱為Vim化的PDF閱讀工具,實在是跨平臺以及Vim粉絲的必備利器。如果開啟之後不會用,那就 吧。

Sumatra PDF

軟件主頁:http://blog.kowalczyk.info/software/sumatrapdf/。

比上述兩款稍為大眾一些的PDF閱讀軟件,免費、單文件、小巧(不到1MB)、支持中文。

(3)在線閱讀PDF。

如果只是偶爾使用,則無須安裝軟件,可利用在線應用輕松搞定PDF閱讀需求。

早期能在線打開PDF的網站也有不少,比如Samuraj Data、PdfMeNot。而目前最好的、最可靠的,當然要屬Google Docs閱讀器。如果你的PDF是本地文檔,則需要Gmail賬戶才能上傳到Google Docs(最大10MB)或發送到Gmail郵箱,然後就可以預覽其內容了。不僅如此,你還可以把PDF文檔發布出來,供其他人點擊鏈接閱讀。此外,Google Docs還支持在線PDF文檔生成閱讀視圖(簡單到只要登錄http://docs.google.com/gview?url=PDF地址),並發布到網頁中。

3.PDF制作軟件及在線應用
PDF是如何做出來的呢?並不是有一個特別軟件,新建一個文件後,在裏面輸入內容並保存,就成了PDF,而是通常用別的軟件編輯文檔後,輸出為PDF;或者就是將一個現成的文檔“打印”成PDF。也就是說,能生成PDF的軟件有兩類,一類是其他文件的編輯器,且具備輸出PDF功能,再一類是虛擬打印機(Virtual Printer),可以把任何能打印的文檔“打印”成PDF。前者處理的範圍有限,但生成的PDF會帶有鏈接、目錄、書簽、作者等相關信息;後者處理範圍廣,但附加信息會少一些。至於到底少哪些,視具體軟件而異。

(1)可輸出PDF的軟件。

有些Office類軟件支持PDF。

善用佳軟大力推薦的開源軟件OpenOffice.org不僅能較好地兼容MS Office格式,還比昂貴的MS Office多了一項輸出PDF功能(從2007版開始,微軟也在自己的Office套件裏面加入了PDF輸出功能)。它能把正在編輯的文書、表格、演示輸出為PDF,並且可以保留目錄、鏈接、書簽。

此外,供個人免費使用的國產軟件“WPS個人版”也能輸出PDF,並且WPS Office對MS Office的兼容性比OOo更好。

有些文本編輯器支持PDF。

PDF的主要意義,除了安全之外就是版式。因此,著名的科技排版軟件Tex理所當然可以導出PDF。你可以選用LaTeX(或進一步借助Vim、emacs等更專業的編輯器)來編輯Tex文件,並編譯為PDF等格式。

(2)PDF虛擬打印機(Virtual Printer)。

PDF虛擬打印機類軟件極多,按“出身”可分如下兩類。

第一類,來自PDF發明者Adobe的產品:體積最大,性能最穩定,兼容性最好,但絕不免費。

第二類,即“第三方”產品(傳說中的“山寨”?),又有很多種。國內用戶要註意的是,它們(尤其是體積特別小的)能否支持中文。

特別簡單的英文轉PDF工具,體積特小,但對國內用戶意義不大(往往不支持中文)。
基於Ghost Script(即GS)的產品,要先安裝這個GS軟件(約10MB),然後再安裝它們的虛擬打印機(3~10MB),通常支持中文。
自主開發(不基於GS)的通常不免費,但性能好,體積小,有的支持中文,有的不能。
當然,還有一種“手工”生成PDF的辦法,實用性不強,但深具體驗之美,具體請參看後文“PDF-t-maker:需要動手的高級免費方案”。

下面介紹幾款PDF虛擬打印機。

Acrobat:最經典也最昂貴

推薦指數:對個人用戶0%;對企業用戶100%。

Acrobat是生成PDF最穩定、兼容性最好的方案。當然,它也是體積最大、價格最高的方案。

提醒入門用戶,Adobe出品的閱讀器以前叫Acrobat Reader,是用來看PDF的,而這個Acrobat是生成PDF的。切勿混淆!或許Adobe公司也意識到了這個問題,現在把閱讀器改名為Adobe Reader了。

pdfFactory:品質一流但不免費

軟件主頁:http://fineprint.com。

推薦指數:個人用戶0%(太貴);企業用戶80%。

極好的產品!其主頁稱:pdfFactory產品提供了比其他程序更簡單、更有效率和更少花費的創建PDF文件的解決方案。pdfFactory標準版本(人民幣約500元)用來創建普通PDF文件,pdfFactory Pro(人民幣約1000元)用於需要安全的PDF(法律文檔、公司信息等)和其他高級功能的用戶。

善用佳軟認為這是一款高質量的產品,其公司FinePrint也是一家非常成功的共享軟件商。有理由猜測pdfFactory是國內個人及小企業用戶中占有率最高的PDF生成軟件。它勝過Adobe Acrobat的主要原因就是小巧(體積僅2MB量級)、易下載,對中文支持好,且國內市場也做得很好。它是共享軟件,但從技術上看,也可以長期使用,只是生成的文檔帶有廣告水印。從這一點看,雖然它聲稱是共享軟件,但也可看做是免費的廣告軟件。pdfFactory的專業版還提供了加密、把多個文檔打印到一個PDF等功能。

PDFCreator:開源世界第一推薦!

軟件主頁:http://sourceforge.net/projects/pdfcreator/。

推薦指數:開源軟件迷100%;一般用戶60%。

來自SourceForge的開源產品PDFCreator毫無疑問是開源、免費世界中影響力最大的PDF生成方案,盡管在中國可能不是這樣——或許是沒有中文主頁、安裝GS比較復雜?還是有更好的商業軟件(非正版)可用?

它對中文支持完全沒有問題(我平生只有一次在用MS Office時有漏字),擁有多界面語言(含簡體中文),支持加密,支持多種選項設置,並且有間接辦法把多個文檔打印成一個PDF。應該說,功能非常全面。除創建PDF文檔外,還可生成Postscript、Encapsulated Postscript以及PNG、BMP、JPEG、PCX、TIFF等圖形格式文件。

註意:

PDFCreator將文件打印成PDF時不支持書簽和鏈接;另外在保存時,頭信息中不要含有中文。
CutePDF Writer:最適合個人用戶

軟件主頁:www.cutepdf.com。

推薦指數:大眾用戶的首選。

CutePDF家族包括多種軟件,其中此款免費,可以滿足基本的打印生成PDF的需求。它也是基於GS的,因此,請先從CutePDF網站下載並安裝GPL Ghostscript轉換程序,然後再裝CutePDF Writer。

它只有打印生成PDF的基本功能。如果需要頁面多合一、刪頁或加頁、旋轉、調控頁面大小、更改文件信息、加密等功能,可以使用下文介紹的相關工具。當然也可以下載CutePDF Writer Companion,它與Writer無縫集成,可實現更多功能。

註意:

CutePDF Writer Companion內有廣告插件,但可選擇安裝與否。

PrimoPDF與NitroPDF

PrimoPDF與NitroPDF均出自非常專業的Nitro公司,前者是免費的PDF虛擬打印機,後者是專業的PDF套裝工具(Nitro PDF Professional 5售價$99)。PrimoPDF與前幾款免費的PDF軟件相比差不多,用戶相對較少;而NitroPDF速度快,但對個人而言價格稍高。

Nitro公司真正值得推薦的業務是在線生成PDF和網頁轉換PDF的軟件。

在線生成PDF:你上傳文件或指定的網頁到網址https://online.primopdf.com,它為你生成PDF後會發送到你信箱。這個軟件(方法)的優點是免費、無須註冊、支持中文。

pdf download:來自NitroPDF的另一款網頁轉PDF工具,可以通過在線、小書簽、瀏覽器插件等三種形式實現轉換PDF,支持中文,支持鏈接。

TinyPDF:超級小巧、支持中文

軟件主頁:www.tinypdf.com。

TinyPDF是一款非常小巧(國內網友精簡後的版本只有200KB)、無廣告、支持嵌入字體、支持中文、無須GhostScript的虛擬PDF打印機,對商業應用也免費。

doPDF:無須GS,小巧、快速、穩定、更新活躍、支持中文

軟件主頁:www.dopdf.com。

優點:安裝包小巧,僅4.3MB;支持簡體中文在內的多國語言(包括安裝過程和使用界面);不需要GhostScript或.NET;支持32位/64位系統;占用資源少。

缺點:功能選項較少(doPDF的商業版本是novaPDF Pro, 50美元,功能更豐富)。

BullZip PDF Printer:免費、強大、更新活躍

軟件主頁:www.bullzip.com。

免費軟件,基於GhostScript,支持多語言(含簡體中文),約 4MB,支持文檔加密、設定屬性、頁面旋轉、水印、插入或追加文檔。除PDF外,還可輸出png、tiff、jpeg、bmp、pcx等格式。

pdfMachine

軟件主頁:www.pdfmachine.com。

推薦指數:80%。

pdfMachine v10、v11的基本功能免費,高級功能有水印;現在v13全部有水印(共享軟件),但同時提供了pdfMachine Live——免費在線轉換文檔為PDF的服務。

筆者認為pdfMachine是一個在國內被埋沒的優秀產品!國內大網站雖有提供,但介紹的文章幾乎沒有。筆者是通過Google英文搜索而發現此軟件的。pdfMachine對中文支持極好(官方主頁直接提到了對亞洲字符的支持),我用PDFCreator打印一些文件有漏字,但此軟件完全正常。它還可以在MS office中加成add-in,點擊即可生成PDF。

其大小也只有8MB左右(2011年4月最新版本)。

go2PDF:體積最小、免費、有水印

軟件主頁:www.go2pdf.com。

優點:體積最小(下載包1.38MB)是go2PDF最大的優點,估計很多人都會率先試用它。go2PDF可以將任何東西轉化成PDF格式文檔,支持創建者添加信息、支持加密和密碼訪問,支持訪問控制以及字體嵌套和矢量字體縮放,並且支持中文。

缺點:有水印。go2PDF生成的PDF文件在頁腳處有一行藍色文字廣告“create pdf with GO2PDF for free, if you with to remove this line, click here to buy Virtual PDF Printer”。

適用場景:臨時需要下載PDF生成軟件,來制作要求不高的PDF文檔。

小結:

此類軟件中,筆者自己主用並推薦CutePDF、PDFCreator。讀者也可選擇TinyPDF、BullZip PDF Printer、doPDF等。
(3)PDF-t-maker:需要動手的高級免費方案。

筆者最初是從水木清華的illh網友處學到此方法的。它可以為Word文件生成帶鏈接和目錄的PDF。它的思路是,Word文件通過宏+ps打印機,生成PS文件;然後用Distiller生成PDF。個人覺得這個方法不太適合初學者使用(說明:最新版的MS Office已經支持另存為PDF文件)。

PDF-t-maker就是VBA的宏,下載最新版並安裝後,可在Word菜單或工具欄中調用它。

PS打印機可以選Adobe公司的免費的PS Driver:Adobe Universal PostScript Windows Driver Installer 1.0.6-Chinese Simplified(7.5MB),或其他PS打印機。

Distiller可以選gsgs8.53libps2PDF14.bat,如果運行時提示找不到gswin32c.exe,則可將其從bin目錄復制過來,或加入到路徑(註意,完整安裝的GS才會有gswin32c. exe,如果是PDFCreator自帶的GS,則很可能沒有這個文件)。

然後,在Word中按下按鈕,就可以直接生成帶目錄的PDF了。

4.圖像轉PDF
(1)常規方案:適用於無特殊需求的普通用戶。

筆者對軟件選擇有一條基本原則,就是對於偶爾的初級需求,應優先選擇已有軟件或多功能通用軟件,而不要選單一功能的專業工具。

方案 1:本文推薦的多款通用PDF虛擬打印機,都可以把多個圖片合並打印為PDF。

方案2:優秀的多功能看圖軟件IrfanView,也可以生成PDF。

(2)專業方案:FreePic2Pdf(官網:www.comicer.com)。

對於在圖像轉 PDF 方面有近乎Geek需求的用戶,筆者推薦國內高手老馬的FreePic2Pdf。

“你用過之後就會知道他的速度之快了,而且已經在盡量縮小大小的狀況下優化圖片質量了”,網友wodingdong這樣評價FreePic2Pdf。

老馬作為圖像方面的專家,見識過很多此類軟件,並把目前的圖片轉PDF軟件分為兩類:基於虛擬打印原理的和直接將圖像嵌入PDF文件的。但這兩類軟件都存在對圖像重新采樣、壓縮,從而造成圖像質量下降、PDF文件膨脹等問題。並且,它們對格式繁雜的TIFF支持不佳,於是,老馬“最終還是下定決心,以libtiff組織提供的tiff2pdf.c為基礎寫了一個圖像轉PDF引擎”,實現他自己的要求。

該軟件主要特點如下。

對TIFF文件高度支持,尤其是國內各掃描外包公司提供的非標準OJPEG壓縮的TIFF文件。
對有損壓縮數據不再重新壓縮,以免質量損失;對無損壓縮數據則壓縮成G4或zip數據以減小文件長度。
將基於虛擬打印原理的軟件的優點借鑒過來,包括指定紙張類型、指定頁邊距、圖像自動放大等,以獲取較好的閱讀效果。
支持JBig2壓縮。收費軟件支持JBig2壓縮的有好幾個,但免費軟件中大概這是第一個。
讀完上一段後,請讀者再次“自查”。如果FreePic2Pdf的描述讓你不知所雲,請退回常規方案。如果引發了你的興奮或好奇,請參閱FreePic2Pdf的軟件說明,甚至更深入地探討圖像轉PDF的問題、方法以及更多題外話。

5.PDF輔助工具
本節包括PDF的加密、合並、分割、文件信息的修改等。

(1)BeCyPDFMetaEdit:免費小巧的PDF文件信息修改工具。

軟件主頁:http://www.becyhome.de/news_eng.htm。其界面如圖2-20所示。


這款僅310KB的免費、免安裝小工具,可以用於修改頭信息、加書簽、加密碼。因此,此工具加上述基本PDF打印機,完全等同於高級PDF打印機,值得關註!

(2)mbtPdfAsm/BeCyPDFAsm:免費小巧的PDF處理工具。

軟件主頁:http://thierry.schmit.free.fr/spip/。

mbtPdfAsm是一個命令行程序,不到1MB,免費。它以合並PDF為主,兼具多種功能,如提取PDF文件信息、提取中間的某些頁、多文件合並、對新文件加密和加書簽。書簽若為中文,則亂碼,當然書簽亂碼並不影響正文。

BeCyPDFAsm是該軟件的圖形化界面,需要配合mbtPdfAsm才能使用,操作更方便。事實上,命令行不是沒有好處,比如我們可以一次加入多個書簽。下面舉一個例子。

mbtPdfAsm -mold.PDF -dnew.PDF -oa.txt

此命令行表示把old.PDF轉化為new.PDF,同時根據a.txt制作書簽。

a.txt內容形式應如下:

1 0 1 1 序

2 1 1 2 序第二頁

3 0 1 10 最後一頁

其格式為:數字1 數字2 數字3 數字4 字符串。

數字1可理解為行號1、2、3……

數字2表示本行的上級目錄的序號(上例中第2行的上級為第1行),0表示最高級目錄,無上級。

數字3表示順序號。如果第一行書簽有多個子項,此處決定其先後順序。

數字4表示頁碼。

字符串就是書簽的內容。

(3)Pdftk:免費強大的命令行PDF工具。

軟件主頁:http://www.pdflabs.com。

Pdftk是一個極其強大的工具!它可以拆分、合並、加密、解密、填表、水印、附件、編輯文件頭信息。也就是說,如果只能保留一個PDF工具,它就是不二之選。它只由一個exe組成,大小約5.6MB。

使用該軟件,一定要閱讀“應用示例”(http://www.pdflabs.com/docs/pdftk-cli-examples/),才會知道它有多強大!

6.其他PDF工具
PDF compress 3.4:http://neeviapdf.com/PDFcompress/,通過壓縮文本和圖像來減少PDF文件原來的大小。下載包約4.5MB。

PDF Info 2.02:免費,http://www.bureausoft.com/products.html。可改變PDF文件信息,包括作者、標題、主題、關鍵詞、創建者等。下載包約950KB。

PDF Watermark Creator:http://www.coolpdf.com/pdfwatermark.html,免費軟件,1.5MB,但會為PDF加入水印。此軟件及下述兩款均來自coolpdf公司。

Tweak PDF:1.3MB的軟件,用來改變PDF的壓縮率、基本信息、頁面顯示效果等,完整版需要收費。

PDF Bundle:1.3MB的軟件,用來為PDF加入附件(如ppt、zip、odt),完整版需要收費。

2.5.2 PDF壓縮技巧及PDF壓縮軟件2

盡管使用PDF壓縮的機會不多,但考慮到這方面的相關文章和軟件介紹極少,所以,這裏要總結一下PDF壓縮技巧及相關的PDF壓縮軟件,作為PDF系列的補充。

1.PDF內部的壓縮技術
PDF文件內部已經使用了如下壓縮技術。

LZW(Lempel-Ziv-Welch)與FLATE(zip,PDF v1.2):用於圖像、文本的無損壓縮。
JPEG及JPEG2000 (PDF v1.5):用於圖像的有損和無損壓縮。
CCITT(Group 3 or 4)與JBIG2 (PDF v1.4):用於黑白圖像無損壓縮。
因此,試圖讓PDF文件通過壓縮軟件(7-Zip/WinZip/WinRar)來減小存儲大小的做法,通常不會取得明顯效果,但必要情況下也不妨嘗試。比如Ni網友留言說, 7-Zip的LZMA算法對某些文件還是有很強壓縮效果的,他曾試過把50MB的PDF用7z壓縮軟件給壓縮到16MB。

2.PDF文件體積的相關因素及壓縮技巧
任何優化(或壓縮)都可以分為兩種:有損和無損。壓縮所涉及的信息,既包括能直接看到的文字、圖像,也包括不能被直接看到的字體、文件元信息等。舉個非PDF的例子,從BMP到png的格式轉換是無損的,到jpg就是有損的。對jpg優化(有損)而言,一種是降低圖像質量,一種是減少頭信息。有些比較智能的軟件,在降低圖像質量時,能對不同區域采取不同的圖像壓縮比,即:次要區域多壓縮多損失,重要區域少壓縮保持高質量。

PDF如果體積較大,通常是緣於圖像和嵌入的字體。

生成PDF時就要考慮成品大小,建議采用較少種類的、常見的字體,這樣就可以減少字體嵌入的成本,同時不影響顯示質量。另外,減少圖片的數量、尺寸、色深,采用最適合的圖像格式。

從文件體積看,可以這樣表示:PDF文件大小 = 文 + 字體 + 格式 + 圖 + 附件。因此,壓縮PDF也要從這些方面入手。

(1)PDF的字體優化原則。

優先使用標準字體。PDF默認的標準字體有五種(Times、Helvetica、Courier、Symbol、ZapfDingbats),規範的PDF閱讀器必須支持這些字體。其他字體就有可能需要全部或部分嵌入(Font Embedding)。
減少所用字體種類。若要體積小,就不要宋體、楷體、黑體一齊來了。另外,濫用字體可能也會遠離美觀而偏向花哨甚至惡俗。
少使用字體風格。對PDF而言,常規、粗體、斜體、粗斜體是四種不同的字體,需要分別嵌入,因此應盡量少用幾種。另外,對於要強調的文字,可以換用字號、顏色、下劃線、字符間距、縮進等手段實現,它們不會占用多余體積。
慎用輕型字體(比如某些華麗的藝術字體,比常規的黑體、宋體體積更大)。
(2)通常有效的PDF優化措施。

用PDF打印軟件,把PDF文件再虛擬打印為新的PDF(推薦一試,因為有大量免費軟件)。
在PDF編輯軟件中“另存為”。這裏要解釋一下:PDF是一種“增量保存(incremental updates)”格式。當你改變一些信息後,它會將這種變化“保存”在原文件的最後,這種做法速度快,但文件體積大。而“另存”則是重寫文件內容,速度稍慢,但冗余信息會被整理掉,使文件體積減小。
利用高級PDF編輯軟件中的優化按鈕。如Nitro PDF Button→Prepare→Optimize Document;Acrobat 8→Advanced→PDF Optimizer。
網友oversky補充:PDF creator、CutePDF、PrimoPDF、PDF ReDirect、Bullzip這些工具都是用GhostScript來生成PDF的。檔案大小、品質好壞都與設定有關,例如圖案的jpeg壓縮比、解析度較高的圖案是否有向下采樣(DownSampling),還有字型是否嵌入PDF。真要想制作比較小的檔案,要找可以把圖用jpeg2000壓縮的,目前個人只看到PDF-XCHANGE 4 PRO和Adobe Acrobat有這種技術。
3.壓縮軟件PDF Shrink試用手記
PDF Shrink 是原Mac平臺的PDF壓縮軟件,後來開始提供Windows和iPhone版本。2009年10月,善用佳軟得到了PDF Shrink的Windows內測版本,試用如下。

(1)下載安裝。

PDF Shrink最新版本(http://www.apagoinc.com)下載約3.2MB。運行主程序可以看到軟件的基本界面很簡單,主界面的列表是幾個預設壓縮方案。直接把PDF文件拖放到對應方案上即可,如圖2-21所示。


(2)PDF Shrink壓縮原理。

PDF Shrink users Guide.pdf(其用戶手冊)中提到:“PDF Shrink reduces the size of PDF files by optimizing the resolution and compression method of each image in the PDF file. The interface allows for setting different compression and resolution choices for color, grayscale and monochrome images.”

照此來說,PDF Shrink的優化措施只是在圖片方面,即優化(應該就是降低)分辨率、改進壓縮算法,而不涉及影響PDF大小的其他方面(比如字體嵌入)。

(3)純文本PDF壓縮測試。

原始文件:雪山飛狐.txt,ANSI編碼,264KB。

測試過程:用notepad.exe打印到如下三款PDF打印機(采用默認設置),然後,用PDF Shrink的Web方案進行壓縮。

測試結果見表2-2。


PDFCreator-優化:手工設置不嵌入字體。
結論:PDF Shrink對文字內容幾乎無法壓縮,不嵌入字體是減少文本類型PDF大小的有效手段。
(4)純圖像PDF壓縮測試。

原始文件:photo.doc。制作過程:直接在MS Word 2003中Ctrl+N新建文檔,在TC中拖放三個圖片文件(數碼相機照片,jpg,3888 x 2592像素,每張約3MB,共9.7MB)到該doc文檔,保存,得doc文件10.3MB。分別打印到如下三款PDF打印機(采用默認設置),然後,用PDF Shrink的Web方案進行壓縮。

測試結果見表2-3。


PDFCreator-優化:手工設置PDF分辨率,從默認600降到72;彩色圖像壓縮從默認自動改為jpeg最大壓縮,並設分辨率為72。
結論:總體來看,大尺寸圖像的壓縮,從doc到PDF,再到壓縮後的PDF,都有明顯效果。在本例中,文件從10MB壓為1~2MB,最終壓為50KB左右。
CutePDF Writer和PDFCreator生成的原始文件相差較多,但壓縮後大小相同。這是因為本質上它們都是用GhostScript來生成結果的。

基於GhostScript的PDF生成,可以通過參數設置降低文件大小。比如PDFCreator更改設置後直接生成的PDF為49KB,但比起PDF Shrink壓縮出的更小(39KB)的PDF,圖像質量反而較差。

(5)實際網頁測試。

原始文件:在Chrome瀏覽器中打開http://xbeta.info頁面,分別打印到如下三款PDF打印機(采用默認設置),然後,用PDF Shrink的Web方案進行壓縮。

測試結果見表2-4。


結論:PDF壓縮效果取決於圖像/文字的比例。

對於本身較小的PDF文件,最終大小首先取決於生成時的設置,其次才是壓縮。比如,本例中,用TinyPDF生成的原始文件,比壓縮後的CutePDF、PDFCreator文件更小。

2.5.3 PDF轉換Word格式的方法總結3

筆者推薦Gmail、pdftoword.com、e-PDF To Word Converter等PDF轉換Word格式的方法。

PDF無法編輯,這不是缺點,而是它的定位。雖然無法編輯,但可以進行註釋。

為什麽要將PDF轉換到其他格式?從技術角度說,是為了二次編輯和後續利用。但如果這樣做,請註意版權問題。

不過,一定要轉到Word格式嗎?不一定。如果文檔只有文字,則建議轉為txt或rtf。如果還有一些不算復雜的圖表、圖片,轉為HTML也是可以接受的。但如果格式復雜,或者你對HTML不了解,也不妨轉為Word格式。

本文以及善用佳軟全站的關註點是“原則、思考方法、解決方案”,而不是“軟件”。做個假設,如果念條咒語,或揮幾下手就能把PDF轉為Word,為什麽一定要軟件呢?

1.推薦的PDF轉換Word方案
(1)莫忘最基本的“復制/粘貼”法。

尋找“高級”辦法之前,不妨先試一下最基本的方法:打開PDF文檔,復制全文,然後在Word中粘貼。如果文檔格式不復雜,這樣得到的結果就夠用了。

(2)在Gmail、QQ郵箱中直接查看PDF格式。

Gmail很早就解決了PDF查看問題。先把PDF作為附件發送至Gmail信箱,在附件一側,點擊“view”或“查看”鏈接,進入在線PDF閱讀器後,點擊“純HTML”鏈接,即可以網頁格式顯示PDF內容。如果你一定需要doc格式,請復制HTML內容到Word。

而QQ郵箱中,PDF附件旁邊也有類似的“純文本方式查看”鏈接,只是相比Gmail,缺少文字格式。

另外,這種轉換還能破解PDF防止復制內容的限制。

優點:速度快、可信、很多人已經有Gmail信箱(沒有?那就註冊一個吧);各種語言編碼的文字都應該可以轉換。

缺點:PDF中的圖片好像有問題。

(3)號稱最精準的PDFtoWord.com在線轉換。

PDFtoWord.com號稱是目前最為精準的PDF to Word文件轉換器,出自著名的PDF解決方案供應商NitroPDF。

PDFtoWord.com是在線應用,完全免費,使用方便。操作步驟如下。

訪問pdftoword.com:①上傳PDF→②選定格式(doc/rtf)→③輸入接收郵箱。如圖2-22所示。

進入郵箱:查收轉換後的Word文檔。

Web 2.0 Share對該應用的評價是:“……Pdftoword無愧於精準之王,對中文轉換同樣很好,文字方面不多說了,大家可以自己測試。Pdftoword在排版方面確實有獨到之處,特別介紹一個細節,Pdftoword轉換後的文檔仍以段落為單位,沒有很多的換行符,而以前大多轉換器都是以行為單位,以致末尾有很多的換行符,你復制粘貼時會有許多麻煩……”

2.其他軟件或在線應用
“電腦玩物”曾做過一個測試,對比了四個在線應用。但由於測試的特殊要求“11MB,立即轉換”,只有一個應用達成了目標。因此,並未對轉換質量進行對比。

http://www.zamzar.com,多格式轉換網站,文檔上限1GB,轉換工作需要排隊等待。

http://www.pdftoword.com,上限10MB,需要等待。

http://convertpdftoword.net,文件名須為英文。

http://www.pdfonline.com/pdf2word/index.asp,速度較快,“PDF的版面樣式與文字‘基本上’都能成功轉換,但仔細檢查,就發現在一些特殊格式的地方會漏掉一兩個字沒有轉出來,但這都很好解決,只要自己補上就好”。

3.共享軟件e-PDF To Word Converter
共享軟件e-PDF To Word Converter(USD35)在把PDF轉換到Word的軟件中,也屬於效果較好的一款。其界面如圖2-23所示。


“小眾軟件”評價:“……e-PDF可以把PDF文件比較完美地轉換成Word文檔,用104頁的PDF做了測試,除了少數地方,其余都屬於完美轉換了……”

再援引另一段網上介紹:e-PDF To Word Converter是一款將PDF文檔轉換成Word文檔的工具軟件,它支持文字、圖像及其他內容的輸出。這款軟件可以脫離Microsoft Word、Adobe Acrobat或Acrobat Reader而獨立運行。完美的中文支持和原始版面轉換,基本做到了百分之百的原汁原味……目前唯一發現的不足是數字會被轉換成全角數字,不知道可否在Word中批量把數字換回半角,另外有些文字大小會小一號。試用了超多的PDF轉Word工具了,應該說這個是所見過的版面保留最好的了,雖然還是有點缺憾。

4.結論
偶爾有pdf2doc需求的網友,建議先試用在線的Gmail、PDFtoWord。如果質量不能滿足需求,或對轉換的數量、速度有更多要求,可以試用/註冊e-PDF To Word Converter等軟件。

延伸阅读

    评论