LEADTOOLS实现PDF/A文档存储系统的案例
如今,文档已不在局限于实物形态的纸质文档了,取而代之的是一些开放或特定格式的文档形态。文件格式差异化所导致的一个棘手问题就是如何存储文件以及存储在何处。很多企业都将文件存储在各地的"数据孤岛",如本地计算机、网络文件共享和云服务。随着移动设备和平板电脑的普及,这些文档格式需要进一步标准化。
同时,随着数字文档规模和种类的变化,往往很难高效而准确地查找到所需文档。此时,PDF/A标准应运而生。但是迁移所有的文件格式也是一项巨大的挑战,因为TIFF和JPEG等光栅格式除了文件名外几乎没有任何搜索功能。而文档图像处理控件LEADTOOLS Document Imaging SDKs提供的先进的文档技术可帮助你将电子文档归档为PDF/A。
全面的PDF和PDF/ A文件格式支持
LEADTOOLS提供了全面的PDF文档格式支持,先进的PDF功能包括:文本提取、超链接、书签、元数据、以及拆分和合并现有PDF文档。凭借LEADTOOLS数十年的图像压缩技术,LEADTOOLS PDF SDK提供了业界最佳的表现和最多样化的PDF压缩选项,如JBIG,JPEG 2000以及MRC(Mixed Raster Content),此外还包含一些类似的商业软件开发工具包很难找到的功能,如读取,显示,编辑和编写原生PDF注释和标记等。
光学字符识别(OCR)和转换
LEADTOOLS轻松解决了将带有混合格式的现有归档迁移至统一的PDF/A格式的归档问题。由于并非所有格式都是基于文本或可搜索,LEADTOOLS可以利用其快速和高度精确的光学字符识别技术将这些图像转换为可搜索的PDF/ A。LEADTOOLS OCR SDK拥有超过40种语言和字符集,包括英语,西班牙语,法语,德语,日语,汉语,阿拉伯语等,使其成为大型企业的可靠的解决方案。
虚拟打印
LEADTOOLS Virtual Printer不仅可以打印文档,还可以通过扫描仪和OCR将打印文档转换为可搜索的数字文档。此外,LEADTOOLS Virtual Printer还允许你归档许多其他来源的信息,包括电子邮件,传真,网站,社会媒体和几乎所有的文件格式。
HTML5 Zero Footprint Viewer
尽管PDF使用非常广泛,但是部分人仍然无法加载PDF,因此多数情况下需要安装PDF插件。然而,LEADTOOLS中提供了HTML5/JavaScript viewer,你可以创建一个真正的基于云的图像解决方案,并且无需安装和下载插件。图像处理和显示均在客户端完成,从而实现快速显示和保持UI的快速响应。
总结
有了LEADTOOLS文档图像开发包,将电子文档规范为PDF/ A已不再是一项艰巨、复杂和代价高昂的项目。转换现有文档、管理和规范PDF文档以及创建包罗万象的业务流程等一切你所需要的功能都包含在这个多平台求程序员友好的LEADTOOLS文档图像开发包中。
本文涉及的解决方案只是LEADTOOLS 在实际应用中的"九牛一毛",LEADTOOLS还提供光栅图像、医疗图像和多媒体影像等解决方案,更多信息或案例展示,请关注慧都控件网。