猪八戒APP
控制abbyy软件自动批量PDF转word工具
成都
其他工具软件开发
需求标题
控制abbyy软件自动批量PDF转word工具
需求描述
制作一个用abbyy代替人工点击操作 OCR的软件
原因:
1.人工操作PDF转word繁琐,需**工值守,很麻烦。
2.因为abbyy,没有SDK,即使是正版也有转换次数限制。所以要做一个这种代替人工操作的软件。
第一步:通过api(url形式)获取到数据,可能是多条(不止一条)。写入到本地sqlite数据库中。
第二步:下载到本地,如果未下载成功的要记录,成功的也要记录。
第三步:代替人工点击转换,通过页数大小、文件大小预估转换等待时间,以供读取和保存。
第四步:读取并保存word文件,并检测文件是否存在,如果存在则通过api传回成功信息
第五步:将转换成功的word移动到其他文件夹,以方便其他未转换的文件继续转换(防止已转换与未转换混淆),又回到第一步——开始转换另一个文件,依次循环。
注意:
1.上面的步骤只是根据我的经验来,最终方法还要靠你自己来测试和摸索,并在实际windows2012中测试,并稳定运行1000个pdf为妙。
2.通过api未获取到数据时,不要去转换
2.支持管理员离开远程计算机windows2012后转换也可继续自动运行操作;
3.支持windows2012的多个管理员来同时操作;
4.文件大且文件页数多的,“等待转换完成”时间长,文件小的等待时间短,而不能:用很长的统一时间来等待;
5.有些原始PDF文件很糟糕,识别出来自然效果很差,看看能不能识别出这种效果差的。并将这种结果回传给网站。
(此功能熟悉者可能几下搞定,不熟悉的人就不行)
6.有些ppt/word也是扫描版,看看能不能先转为pdf,再OCR。此需求可能会放弃不做。
要求:1.不要用易语言,最好.net或者c++
2.支持windows 2012 R2
3.不能报有毒
4.不能让abbyy内存持续不断的增长
5.要兼容报错的pdf,能自动跳过
6.要兼容有密码的pdf,能自动跳过(不做)
7.要测试一下几个管理员同时OCR的情况,看网站能否能用。
资金预算:2000
对服务商要求:全国服务商
线下交易的服务商勿扰,走猪八戒平台,双方都有保障,谢谢
预算金额
¥2000元
允许参与人才数量
--
人才所在地
--
人才类型
--
工作反馈要求
无要求
期望完成日期
--
开票类型要求
无要求