在Windows上开始使用Python OCR?

我从来没有用过python,我不知道从哪里开始。 我的目标是拍摄数字和多彩背景的图像数据,并可靠地获取识别出的正确字符。 我研究了必要的工具,并且我发现了Anaconda python发行版,它包含了我可能需要的所有可能的软件包,以及tesseract-ocr和pytesser。

不幸的是,我迷失在如何开始。 我使用PyCharm社区IDE,并试图遵循本指南:http://www.manejandodatos.es/2014/11/ocr-python-easy/掌握OCR。

这是我正在使用的代码:

from PIL import Image
from pytesser import *

image_file = 'menu.jpg'
im = Image.open(image_file)
text = image_to_string(im)
text = image_file_to_string(image_file)
text = image_file_to_string(image_file, graceful_errors=True)
print "=====output=======n"
print text

我相信我使用的Anaconda发行版有PIL,但是我收到了这个错误:

C:Usersdiego_000Anacondapython.exe C:/Users/diego_000/PycharmProjects/untitled/test.py
Traceback (most recent call last):
  File "C:/Users/diego_000/PycharmProjects/untitled/test.py", line 2, in <module>
    from pytesser import *
  File "C:Usersdiego_000PycharmProjectsuntitledpytesser.py", line 6, in <module>
    import Image
ImportError: No module named Image

Process finished with exit code 1

任何人都可以将我指向正确的方向吗?


您指向的文件说要使用

from PIL import Image

除非你使用

import Image

口译员正确地说:

ImportError: No module named Image

看起来好像你重新排列了线条

from PIL import Image
from pytesser import *

而pytesser对PIL有不正确的编码依赖。 但我不能确定你提供的代码。

链接地址: http://www.djcxy.com/p/96737.html

上一篇: Getting started with Python OCR on windows?

下一篇: Tesseract OCR, Python and Windows XP