信息化 频道

TH-OCR文通 打造视频文字识别引擎

  随着信息技术、多媒体技术的飞速发展,以图像、声音和视频为主的多媒体信息迅速成为信息交流和服务的主流,在Internet上,纯文字的页面也逐渐被加入多幅图像,文字信息正越来越多的以图像、视频形式出现。多元化的发展丰富了人们的生活,但同时也给需要获取文字信息的政府和电视台等行业的工作者们带来了一系列的难题。如何随时监控那些网页视频截图,网页截图,广告截图,微博截图等出现的文字,并且将视频文字转换成需要的文字形式呢?市场上的OCR产品可以解决这个问题吗?

  近期,国内外知名的OCR技术生产商、文档影像技术和应用解决方案提供商文通科技特别推出了一款针对视频文字开发的识别引擎——TH-OCR 文通视频文字识别产品,它的出现完全解决了目前OCR产品对于视频文字无法识别的问题,省却了视频文字重新输入的麻烦。

  据了解,文通视频文字识别产品不仅支持TIFF、JPEG、PNG、BMP格式图像的读取,而且还支持avi、rmvb、rm、mp4、3gp等视频格式,可以识别纯英文、简繁体中文等视频图像,另外还能对视频图像字幕进行自动版面分析,获取识别字符在原文中的位置和大小信息,并对指定区域的识别,有了这些功能,许多高层次的应用,例如视频摘要,也可以很好的被实现。它支持的开发语言也多种多样,VC,VB,JAVA,DEPHI等都可以支持文通视频文字识别产品,对于第三方开发商而言,可以根据自己的技术和产品进行开发,应用起来更加简单。

  记者了解到,如何快速从视频画面里提取出文字,整理视频资料一直是电视台媒资管理工作的烦恼。目前媒资管理工作中的编目工作都由专业人员进行,他们需要搜集包括节目主题、节目简介、责任人、甚至是某个具体台词等信息,有时甚至需要根据视频中的字幕进行抄录,这一工作占据了编目生产活动的很大比重,是整个流程中消耗人力最大、出错率最高的地方。文通视频文字识别产品应用于电视媒体数据管理工作,能够明显优化电视台等机构的媒体资产存储管理系统工作,利用这款产品对视频关键帧中的文字精准定位并进行识别并将文字从视频画面里提取出来,将其转化成可编辑的电子文档,有效提高工作速度,降低人员成本、减少人为的错误。

  值得一提的是,文通视频文字识别产品在政府舆情监控和维稳方面,也发挥着重要作用。众所周知,政府部门的舆情监控关系着国家和社会的稳定,通过甚至关键词等形式对网络上文本信息的监控,及时了解相关事件的发展状况,维护社会稳定。目前,纯文本信息比较容易抓取,但是视频、截屏上的文字的对监测识别的要求却很高,而业界普通OCR产品都不具备复杂的图像处理机制,因此这些产品都不具有精准的复杂版面文字定位和更好的文字识别效果。一位政府部门的工作人员表示,利用文通视频识别产品,对网上出现的各类图片、视频中的文字进行实时监控,在文本信息较复杂的背景下通过它对视频图像字幕进行自动版面分析,获取识别字符在原文中的位置和大小信息,及时了解全国范围内的信息动态,从而维护网络信息安全和社会的稳定。

  文通该产品的负责人向记者介绍说,随着技术的进步,OCR技术也在不断发展。我们相信,在IT时代,文通视频文字识别产品的出现,会满足不同行业对文字识别的要求,在今后的发展过程中,文通OCR技术及其产品也必将不断完善,应用领域也将更加广泛,更好地为未来科技生活服务。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
0
相关文章