ORPALIS PaperScan Professional Edition 4.0.10 PaperScan扫描软件

ORPALIS PaperScan Professional Edition 4.0.10 PaperScan扫描软件是一款强大的TWAIN和WIA扫描应用程序,其核心理念是让任何人都能轻松地获取文档。PaperScan Professional Edition是一款强大而全面的工具,用于管理您企业或组织的文档:扫描、处理、进行OCR识别、加注释、压缩并以各种格式保存您的图像和PDF文件。


您更喜欢使用您扫描仪的软件来获取文档吗?使用PaperScan导入任何图像/PDF文件,在任何想象得到的单页/多页配置中排列它们,进行各种图像调整/增强,用便签、图章、荧光笔或箭头加注释,并以多种文件格式保存您的工作,包括JPEG、TIFF、PDF和JBIG2。PaperScan通用性非常广泛,而大多数扫描应用程序专门针对一个扫描仪或一个协议。

专业版功能

  • 无限批量TWAIN和WIA扫描/导入
  • 保存为单页PDF/A、TIFF、JPEG、JPEG 2000、PNG、JBIG2、WEBP
  • 保存为多页TIFF JBIG2和PDF/A
  • 发送邮件
  • 保存为PDF-OCR
  • 数字签名
  • 批量获取过程中的图像处理:自动去斜、角度旋转、去边框、去打孔、负片
  • 自动空白页移除
  • 支持使用分隔页进行扫描
  • 图像后处理:颜色调整、颜色空间转换、效果、滤镜、裁剪等...
  • 自动颜色检测
  • 支持PDF加密(读写)
  • 平板和文档馈送器支持
  • 双面扫描支持
  • 支持PDF/A符合级别和版本,作为输出格式
  • 混合光栅内容
  • 保存至本地SharePoint

版本4中的新功能

  • 支持64位驱动程序
  • 会话之间的图像自动保存
  • 增强的用户配置文件
  • 其他输出格式,包括PDF 2.0、PDF/A-4
  • 将输出保存到SharePoint Online和On-Premise
  • 大大提高了OCR的准确性和速度
  • 其他OCR输出格式,包括Word和文本
  • 单个文档中多语言的OCR识别
  • 按条形码拆分和重命名

TWAIN(Technology Without An Interesting Name)和WIA(Windows Image Acquisition)是用于在Windows操作系统中进行扫描的两种常见技术。这些技术的基础技术原理如下:

  1. TWAIN:TWAIN是一种标准的软件协议,用于连接扫描仪和计算机。它允许应用程序与图像设备(如扫描仪或数码相机)进行通信,并控制设备上的扫描功能。TWAIN协议定义了应用程序和设备之间的通信方式,包括命令和数据传输的规范。

在TWAIN技术中,应用程序通过TWAIN驱动程序与扫描设备通信。TWAIN驱动程序充当应用程序与设备之间的中间层,负责传递指令、接收扫描数据并将数据传递给应用程序进行处理。通过TWAIN技术,应用程序可以发出扫描指令、控制扫描参数(如分辨率、颜色模式等)并接收扫描后的图像数据。

  1. WIA:WIA是Windows操作系统提供的一种图像获取框架,旨在简化图像设备(如扫描仪、摄像头)的访问和操作。与TWAIN相比,WIA更加简单易用,适用于一般用户和普通应用程序的图像获取需求。

WIA技术通过Windows提供的API(应用程序编程接口)来实现图像设备的连接和操作。应用程序可以调用Windows提供的WIA API来访问连接到计算机的图像设备,执行扫描操作并获取图像数据。WIA框架包含了用于处理图像设备的驱动程序和接口,使得开发者可以更容易地实现图像采集功能。

TWAIN和WIA技术都是用于实现图像设备(如扫描仪)与计算机之间通信和数据传输的标准和框架,通过它们应用程序可以方便地实现扫描和图像获取功能。TWAIN更加灵活和功能强大,适用于专业的图像处理应用;而WIA更加简单易用,适合一般用户和普通应用程序的需求。

保存为单页PDF/A、TIFF、JPEG、JPEG 2000、PNG、JBIG2和WEBP这些格式涉及不同的图像编码和压缩技术。以下是这些格式的基础技术原理:

  1. PDF/A(Portable Document Format Archive):PDF/A是PDF的一个子集,旨在提供长期保存电子文档所需的标准格式。PDF/A格式包含文档的内容、结构、元数据和字体信息,以确保文档在未来仍然能够准确地显示和打印。
  2. TIFF(Tagged Image File Format):TIFF是一种通用的图像文件格式,支持单色、灰度、索引色和全彩色图像,以及多页和多帧图像。TIFF文件可以存储高质量的图像数据,并支持无损压缩和压缩选项。
  3. JPEG(Joint Photographic Experts Group):JPEG是一种广泛应用的图像压缩格式,适用于存储照片和真彩色图像。JPEG使用有损压缩算法,通过牺牲一定的图像质量来实现更小的文件大小。
  4. JPEG 2000:JPEG 2000是JPEG标准的扩展版本,采用更先进的压缩技术和编码方法。JPEG 2000支持更高的压缩比和更好的图像质量,同时具有逐渐渐进式传输和区域性解码等特性。
  5. PNG(Portable Network Graphics):PNG是一种无损压缩的位图图像格式,用于存储网络图形和图像。PNG支持透明度和索引色图像,避免了JPEG的一些失真问题,但文件大小通常比JPEG大。
  6. JBIG2(Joint Bi-level Image Experts Group):JBIG2是一种压缩黑白图像的标准,适用于文档扫描和存档。JBIG2通过在图像中识别和编码重复的像素模式来实现高效的压缩,通常比传统的CCITT G4压缩更有效率。
  7. WEBP:WEBP是一种由Google开发的现代图像格式,旨在提供更高的压缩率和更快的加载速度。WEBP支持有损和无损压缩,适用于Web上的图像显示和传输。

这些图像格式都具有不同的特点和适用场景,通过选择合适的格式可以根据需求平衡图像质量、文件大小和兼容性等因素。实现将图像保存为这些格式需要相应的编码和压缩算法来处理图像数据,并生成符合格式规范的文件。

保存为多页TIFF、JBIG2和PDF/A这些格式涉及不同的图像编码和压缩技术。以下是这些格式的基础技术原理:

  1. 多页TIFF(Tagged Image File Format):多页TIFF是TIFF格式的扩展,允许在单个文件中存储多个页面的图像数据。它可以包含不同类型的图像,如单色、灰度、索引色和全彩色图像,以及多页和多帧图像。多页TIFF提供了一种方便的方式来组织和存储多个相关图像。
  2. JBIG2(Joint Bi-level Image Experts Group):JBIG2是一种专门用于压缩黑白图像的标准,常用于文档扫描和存档。JBIG2利用对图像中重复像素模式的识别和编码来实现高效的压缩率。相比传统的CCITT G4压缩,JBIG2通常能够实现更高的压缩率。
  3. PDF/A(Portable Document Format Archive):PDF/A是PDF的一个子集,旨在提供长期保存电子文档所需的标准格式。PDF/A格式包含文档的内容、结构、元数据和字体信息,以确保文档在未来仍然能够准确地显示和打印。PDF/A格式也支持多页文档的存储和组织。

将图像保存为多页TIFF、JBIG2和PDF/A格式需要相应的编码和压缩算法来处理图像数据,并按照格式规范生成符合要求的文件。这些格式都适用于存储和组织多页图像文档,但它们具有不同的特点和适用场景,用户可以根据实际需求选择合适的格式来平衡图像质量、文件大小和兼容性等因素。

保存为PDF-OCR(Optical Character Recognition)涉及将扫描的图像文档转换为可搜索和编辑的文本PDF文件。以下是PDF-OCR的基础技术原理:

  1. 扫描:首先,原始文档以图像形式进行扫描,生成一个或多个图像文件(通常是TIFF或JPEG格式)。这些图像文件包含文档的页面内容,包括文字、图形和其他元素。
  2. OCR处理:接下来,通过OCR软件对扫描的图像进行处理。OCR软件通过识别图像中的文字,并将其转换为计算机可编辑和搜索的文本数据。OCR技术会识别文字的形状、大小和布局,然后尝试将其转换为字符编码,如ASCII或Unicode。
  3. 文本提取:一旦文字被成功识别并提取,OCR软件将生成一个包含文本内容的文本层。这个文本层可以与原始图像叠加在一起,形成一个可搜索和复制的文本PDF文件。
  4. PDF生成:最后,将包含文本层的图像和原始图像合并,生成一个新的PDF文件。这个PDF文件既包含原始的图像内容,又包含可编辑和搜索的文本数据,使用户可以方便地对文档进行搜索、复制和编辑操作。

通过将文档保存为PDF-OCR格式,用户可以保留原始图像的质量和布局,同时使文档内容可被计算机识别和处理。这种格式在需要对文档进行全文搜索、引用和编辑时非常有用,提高了文档的可访问性和可用性。

自动空白页移除是一种常见的文档处理技术,通常用于扫描文档或数字化文档时去除空白页,以减少文件大小和提高文档的整洁程度。以下是自动空白页移除的基础技术原理:

  1. 图像处理:首先,文档中的每一页被扫描或转换为数字图像。这些图像可以是单页TIFF、JPEG等格式,也可以是包含多个页面的多页TIFF文件。
  2. 空白页检测:针对每一页图像,通过图像处理算法进行空白页检测。这通常涉及分析图像中的像素值或颜色信息,以确定页面是否为空白。常见的方法包括计算像素密度、边缘检测、颜色分析等。
  3. 空白页移除:一旦检测到空白页,系统会自动将其从文档中移除。这可以通过删除空白页对应的图像数据或调整文档的页面顺序来实现。
  4. 文档重建:在完成空白页移除后,可以对文档进行重建,确保文档的页面顺序和完整性得到保持。如果文档是多页的,系统还会重新排列页面,以便正确显示文档内容。
  5. 保存文档:最后,经过空白页移除和重建后的文档可以保存为新的文件,通常是PDF或其他常见文档格式。保存后的文档不再包含空白页,文件大小更小,且更易于阅读和管理。

自动空白页移除技术通过自动化的方式去除文档中的空白页,提高了文档处理的效率和质量。这种技术广泛应用于办公自动化、文档管理系统和数字化档案等领域,为用户提供了更加便捷和高效的文档处理体验。

使用分隔页进行扫描是一种常见的技术,特别适用于需要将不同文档或文档部分分开的场景。以下是使用分隔页进行扫描的基础技术原理:

  1. 分隔页识别:在扫描过程中,设备会识别预先定义的分隔页,例如特定的封面页、批处理标记或特殊的分隔符号。这些分隔页的作用是指示扫描设备在识别到它们时切换到下一个文档或文档部分。
  2. 文档分割:一旦识别到分隔页,扫描设备会根据分隔页的位置和类型将文档分割成不同的部分。这可能涉及到对图像数据进行切割和分组,以确保每个部分都与相应的文档相关联。
  3. 索引和标记:分隔页也可以用于创建文档索引或标记,以便后续处理和管理。这些索引和标记可以包括文档的名称、日期、作者等元数据信息,有助于对文档进行分类和检索。
  4. 扫描设置:在扫描设备上,用户可以设置识别和处理分隔页的参数,例如识别规则、分隔动作(如切割、跳过等)以及索引信息的收集方式。
  5. 输出处理:一旦文档被分割和识别,扫描设备会根据用户设置的选项对文档进行输出,通常是保存为PDF或其他格式的文件。在输出过程中,分隔页所带来的信息通常会被用来指导文档的整理和归档。

使用分隔页进行扫描技术使得扫描设备能够自动识别、分割和处理不同的文档部分,从而提高了扫描效率和文档管理的便利性。这种技术常用于大量文档的批量处理、档案数字化和文档管理系统等场景。

双面扫描是一种常见的文档扫描技术,允许在同一时间将文档的两面内容分别扫描并保存。以下是双面扫描支持的基础技术原理:

  1. 双面传感器:双面扫描设备通常配备了两个传感器,一个用于扫描正面(正面传感器)另一个用于扫描背面(背面传感器)。这些传感器通常使用光学或CCD技术,能够准确捕获文档上的内容。
  2. 自动翻页:在进行双面扫描时,扫描设备会自动控制文档的翻页过程,以便在同一过程中完成对正反两面的扫描。这通常通过自动进纸器或双面扫描仪的机械设计实现。
  3. 同步扫描:正面传感器和背面传感器的工作需要高度同步,确保在文档通过扫描区域时能同时进行扫描。这要求设备具有精密的控制系统,能够准确地协调两个传感器的工作。
  4. 数据处理:扫描设备会将正反两面扫描得到的图像数据分别处理和存储。通常,这些数据会被整合成单个文档,正面和背面的内容按顺序排列,以便后续查看和处理。
  5. 质量控制:双面扫描设备通常会进行质量控制,确保扫描结果清晰、完整,没有漏页或错位的情况发生。这可能涉及到自动识别空白页、调整图像对比度等功能。

双面扫描技术提供了高效、方便的方式来扫描双面文档,节省了时间和人力成本。这种技术广泛应用于办公室、档案管理、数字化文档处理等领域,为用户提供了便捷而可靠的文档扫描解决方案。

PDF/A是一种特殊的PDF文件格式,旨在确保长期保存的电子文档的可靠性和稳定性。支持PDF/A符合级别和版本作为输出格式涉及以下基础技术原理:

  1. PDF/A标准:PDF/A标准由国际标准化组织(ISO)定义,旨在确保PDF文档能够长期保存并保持内容的完整性和可访问性。PDF/A标准包括不同的级别(Level)和版本(Version),如PDF/A-1、PDF/A-2、PDF/A-3等。
  2. 符合级别和版本:支持PDF/A作为输出格式时,扫描设备或软件需要能够生成符合特定PDF/A级别和版本的PDF文件。不同级别和版本的PDF/A标准有不同的要求和特性,如支持的功能、元数据要求等。
  3. 格式转换:扫描设备或软件通常会提供将扫描得到的图像数据转换为符合PDF/A标准的PDF文件的功能。这可能涉及到图像处理、文本识别、元数据添加等技术,以确保生成的PDF文件符合PDF/A标准要求。
  4. 元数据添加:PDF/A标准要求文档包含特定的元数据信息,以便确保文档的长期保存和可访问性。支持PDF/A作为输出格式的设备或软件需要能够添加必要的元数据,如文档标题、作者、创建日期等。
  5. 验证工具:为了验证生成的PDF/A文件是否符合标准要求,通常会使用PDF/A验证工具对文件进行检查。这些验证工具可以检测文件中的问题并提供修复建议,以确保生成的PDF/A文件符合标准。

通过支持PDF/A符合级别和版本作为输出格式,扫描设备或软件可以生成适合长期保存的电子文档,确保文档的可靠性和可访问性。这种技术常用于归档、数字化档案管理、法律文件存档等需要长期保存文档的场景。

混合光栅内容(Hybrid Raster Content)是一种在数字文档中同时包含矢量图形和光栅图像的技术。这种技术结合了矢量图形的优势(可缩放性、精确性)和光栅图像的优势(细节丰富、逼真度高),在许多应用领域中得到广泛应用。以下是混合光栅内容的基础技术原理:

  1. 矢量图形:矢量图形是使用数学描述图像的技术,可以无限放大而不失真。矢量图形由线条、曲线、多边形等基本元素组成,可以精确表示几何形状和文字等内容。
  2. 光栅图像:光栅图像是由像素阵列组成的位图图像,每个像素包含颜色信息。光栅图像适合表示复杂的图像内容,如照片、插图等,但放大时会出现像素化现象。
  3. 混合技术:混合光栅内容技术将矢量图形和光栅图像结合在一起,以实现图像内容的最佳表现。通常在文档中,矢量图形用于表示文字、图标、简单几何形状等,而光栅图像用于展示照片、复杂插图等。
  4. 渲染和显示:在文档生成或显示过程中,混合光栅内容技术要求系统能够同时处理矢量图形和光栅图像。系统需要根据具体情况选择合适的渲染方式,保证矢量图形的平滑显示和光栅图像的清晰呈现。
  5. 存储和传输:混合光栅内容的文档在存储和传输时需要考虑矢量数据和光栅数据的组织方式。通常会将矢量数据和光栅数据分开存储,以便灵活处理和优化文件大小。

混合光栅内容技术通过结合矢量和光栅图像的优势,提供了更加灵活和高效的图像呈现方式。这种技术常用于电子出版物、数字报纸、技术文档等需要图文并茂的应用场景,为用户带来更好的阅读和浏览体验。

按条形码拆分和重命名是一种常见的数据处理技术,通常用于对大量包含条形码信息的文件进行批量操作。以下是按条形码拆分和重命名的基础技术原理:

  1. 条形码识别:首先需要使用条形码识别技术对包含条形码信息的文件进行扫描或解析。条形码可以是一维条形码(如Code 128、Code 39)或二维条形码(如QR码、Data Matrix),通过识别条形码可以获取相关的唯一标识信息。
  2. 文件拆分:根据识别到的条形码信息,对原始文件进行拆分,将文件按照不同的条形码进行分类或分组。这样可以将具有相同条形码的文件归类在一起,方便后续的重命名和管理。
  3. 文件重命名:在拆分后,可以根据条形码信息为每个文件进行重命名。重命名可以采用包含条形码信息的命名规则,确保每个文件都有唯一的标识符,方便后续检索和识别。
  4. 批量处理:按条形码拆分和重命名通常涉及大量文件的处理,因此需要支持批量处理的工具或脚本。这些工具能够自动化完成文件拆分和重命名的过程,提高效率并减少人工操作的时间成本。
  5. 元数据管理:除了文件名,还可以考虑将条形码信息作为文件的元数据进行管理。元数据可以包括文件的创建日期、作者信息、摘要等,为文件的组织和检索提供更多的信息支持。

按条形码拆分和重命名技术可以帮助用户有效管理包含条形码信息的文件,提高文件的识别和检索效率。这种技术常用于文档管理、库存管理、档案整理等需要对大量文件进行标识和分类的场景中。

原文链接:,转发请注明来源!