5.人工校正。人工校正是OCR的最后步骤,影响OCR的处理效率。文字影像与识别文字的对照,识别文4字的候选字功能,特意标示出可能有问题的字词,都是必备的功能。人工校正一次,可以提高识别率。
随着OCR技术的广泛应用,一些大公司已意识到OCR的好处,开始在产品中捆绑OCR技术。例如,微软公司在发布的Office软件中全面配装了TH-OCR(北京文通信息技术有限公司开发);英特尔公司也确定TH-OCR为MMX技术支持项目;谷歌公司已启动OCR软件的开发工作,OCR应用进入全面爆发时代。我国的图文识别技术发展也较为迅速,如北京汉王科技、清华紫光等公司,其识别技术较为先进,开发的软件市场占有率也较高。
运用图文识别技术,可以快速发现互联网违规发布的涉密文件,大幅提升互联网涉密信息检查能力。当然,这些方法只是治标之策,唯有增强相关人员保密意识,加强信息公开保密审查,实现办公网络与互联网物理隔离等措施多管齐下,才能及时发现和有效防范互联网泄密行为,保护国家秘密安全。