需求描述
VBNET程序用来识别所有文件获取文件内容。
程序最终目的是为了识别文件里面的内容。
如果是标准的可识别的PDF文件,可以使用微软自带的相关程序来**识别PDF文件内容,输出内容。
如果是非标准的PDF文件而不能直接读取文件内容,需要**把PDF的每页转换成高清晰的图片文件,等待下一步进行图片OCR识别。
如果是其他可正常打开的word或txt文件,获取内容,输出内容。
如果是图片文件,需要使用比较强大的OCR功能,来识别文字内容,输出内容。
可以建议使用正版adobe的dll来处理相关程序,需提供清晰的安装说明文件来显示如何使用adobe的dll。