วิธีการติดตั้ง Tesseract บน Windows

Withi Kar Tid Tang Tesseract Bn Windows



Tesseract เป็นเครื่องมือการรู้จำข้อความโอเพนซอร์ซที่ใช้ได้ฟรี หรือที่เรียกว่า OCR (การรู้จำอักขระด้วยแสง) ส่วนใหญ่จะใช้เพื่อระบุและดึงข้อความจากภาพ มันจะอ่านข้อความจากข้อมูลรูปภาพและเขียนผลลัพธ์ในไฟล์ .txt ใหม่ Tesseract ยังทำงานภายใต้ Python เนื่องจากส่วนใหญ่จะใช้เพื่อจดจำลายมือจากรูปภาพ กำลังใช้โมเดล LSTR (หน่วยความจำระยะสั้นแบบยาว) Tesseract ทำงานภายใต้ใบอนุญาต Apache 2.0

เราจะอธิบายวิธีการติดตั้ง Tesseract บน Windows อย่างละเอียดในบล็อกนี้







เริ่มกันเลย!



จะติดตั้ง Tesseract บน Windows ได้อย่างไร?

Tesseract เป็นเครื่องมือบรรทัดคำสั่งที่ใช้สำหรับการแยกข้อความจากรูปภาพ ในการติดตั้ง Tesseract บน Windows คุณต้องทำตามคำแนะนำด้านล่าง



ขั้นตอนที่ 1: ดาวน์โหลดตัวติดตั้ง Tesseract





ขั้นแรก ไปที่ลิงก์ที่ให้ไว้ด้านล่างและดาวน์โหลดตัวติดตั้ง Tesseract ตามข้อกำหนดระบบของคุณ:

https: // github.com / UB-มันไฮม์ / tesseract / สัปดาห์



ขั้นตอนที่ 2: เรียกใช้ Tesseract Installer

เยี่ยมชม ' ดาวน์โหลด ” ไดเร็กทอรีที่ดาวน์โหลดตัวติดตั้ง Tesseract ในการติดตั้ง Tesseract บน Windows ให้รันโปรแกรมติดตั้ง Tesseract โดยดับเบิลคลิกที่มัน:

ขั้นตอนที่ 3: เลือกภาษา

ตัวติดตั้ง Tesseract รองรับหลายภาษา ในการโต้ตอบกับ UI ของตัวติดตั้ง ให้เลือก “ ภาษาอังกฤษ ” เป็นภาษาของคุณและคลิกที่ “ ตกลง ”:

ขั้นตอนที่ 4: ติดตั้ง Tesseract

เมื่อทำเช่นนั้น วิซาร์ดการตั้งค่า Tesseract OCR จะปรากฏขึ้นบนหน้าจอ ในการเริ่มต้นการติดตั้ง Tesseract ให้กดปุ่ม “ ต่อไป ' ปุ่ม:

เพื่อยอมรับ “ ข้อตกลง ', คลิก ' ฉันเห็นด้วย ' ปุ่ม:

เลือก “ ติดตั้งสำหรับทุกคนที่ใช้คอมพิวเตอร์เครื่องนี้ ” และกด “ ต่อไป ' ปุ่ม:

หากคุณต้องการเพิ่มข้อมูลสคริปต์หรือรวมภาษาอื่น ให้ทำเครื่องหมายที่ช่องทำเครื่องหมายและกด ' ต่อไป ' ปุ่ม. เนื่องจากเราไม่ต้องการสคริปต์ข้อมูลเพิ่มเติมหรือภาษาใดๆ ดังนั้น เราจะดำเนินการต่อด้วยตัวเลือกเริ่มต้นที่เลือกไว้:

เลือกตำแหน่งการติดตั้งและคลิกที่ปุ่ม “ ต่อไป ' ปุ่ม:

หากคุณไม่ต้องการสร้างทางลัดในเมนูเริ่ม ให้ทำเครื่องหมายที่ ' อย่าสร้างทางลัด ” ช่องทำเครื่องหมายและกดปุ่ม “ ติดตั้ง ' ปุ่ม:

หลังจากนั้น การติดตั้ง Tesseract จะเริ่มต้นขึ้น รอจนกว่าการติดตั้งจะเสร็จสิ้นและกดปุ่ม “ ต่อไป ' ปุ่ม:

สุดท้ายคลิกที่ “ เสร็จ ' ปุ่ม:

ขั้นตอนที่ 5: ตั้งค่าตัวแปรสภาพแวดล้อม

หลังจากการติดตั้ง คุณต้องตั้งค่าตัวแปรสภาพแวดล้อมของ Tesseract ในการดำเนินการดังกล่าว ก่อนอื่นให้ไปที่ไดเร็กทอรีที่คุณติดตั้ง Tesseract และคัดลอกพาธจาก “ ที่อยู่ ' บาร์:

ค้นหา “ ตัวแปรสภาพแวดล้อม ' ใน ' สตาร์ทอัพ ” เมนูและเปิด “ แก้ไขตัวแปรสภาพแวดล้อมของระบบ ”:

ภายในการตั้งค่า ให้ไปที่ “ ขั้นสูง ” เมนูการตั้งค่าและคลิกที่ “ ตัวแปรสภาพแวดล้อม ' ปุ่ม:

เลือก ' เส้นทาง ” ตัวแปรจาก “ ตัวแปรระบบ ” และกด “ แก้ไข ' ปุ่ม:

หลังจากนั้น ' แก้ไขตัวแปรสภาพแวดล้อม ” จะปรากฏบนหน้าจอ กด ' ใหม่ ” และวางเส้นทางไดเรกทอรีการติดตั้ง Tesseract ที่คัดลอกไว้ที่นี่ สุดท้ายคลิกที่ “ ตกลง ' ปุ่ม:

ขั้นตอนที่ 6: ตรวจสอบการติดตั้ง Tesseract

ในการตรวจสอบการติดตั้ง Tesseract ให้เปิด Windows Command Prompt โดยค้นหา ' พร้อมรับคำสั่ง ' ใน ' สตาร์ทอัพ ' เมนู:

ตรวจสอบเวอร์ชัน Tesseract โดยใช้คำสั่งที่ให้มา:

> tesseract --รุ่น

ผลลัพธ์ด้านล่างระบุว่าเราได้ติดตั้ง Tesseract เวอร์ชันเรียบร้อยแล้ว ' v5.2.0 ” บน Windows:

มาดูวิธีใช้ Tesseract บน Windows กัน

วิธีการใช้ Tesseract บน Windows?

Tesseract ใช้เพื่ออ่านลายมือหรือแยกข้อความจากรูปภาพ มาดูกันว่ามันทำงานอย่างไร:

ขั้นตอนที่ 1: เลือกรูปภาพ

เลือกรูปภาพที่คุณต้องการแยกข้อความ ตามที่เราได้เลือก” 1.png ”:

ขั้นตอนที่ 2: แยกข้อความจากรูปภาพ

เมื่อเปิด CMD แล้ว ใช้ “ ซีดี ” เพื่อเปลี่ยนไดเร็กทอรีที่เก็บรูปภาพ จากนั้นเรียกใช้ ' tesseract ” คำสั่งและกำหนดชื่อไฟล์ภาพตามที่เราได้ระบุไว้ “ 1.png ” “ ข้อความ ” พารามิเตอร์แสดงชื่อไฟล์ที่ส่งออก:

> ซีดี C:\Users\anuma\OneDrive\Pictures\Saved Pictures
> tesseract 1 .png 'ข้อความ'

ขั้นตอนที่ 3: ตรวจสอบการแยกข้อความ

ในการตรวจสอบการแยกข้อความ ให้ไปที่ไดเร็กทอรีที่มีไฟล์รูปภาพอยู่ จะเห็นว่าไฟล์ที่ส่งออกไป “ ข้อความ ” จะถูกบันทึกไว้ที่นี่เช่นกัน ดับเบิลคลิกที่ไฟล์เอาต์พุตเพื่อตรวจสอบว่า tesseract แยกข้อความออกจากรูปภาพหรือไม่:

คุณจะเห็นว่าเราแยกข้อความสำเร็จโดยใช้เครื่องมือบรรทัดคำสั่ง Tesseract:

เราได้สาธิตเทคนิคการติดตั้งและใช้งาน Tesseract บน Windows

บทสรุป

ในการติดตั้ง Tesseract บน Windows จำเป็นต้องดาวน์โหลดตัวติดตั้ง Tesseract เพื่อจุดประสงค์นี้ ให้ทำตามช่วงแรกของบทความนี้ ถัดไปตั้งค่าตัวแปรสภาพแวดล้อมเส้นทางเพื่อใช้และเข้าถึง Tesseract จากพรอมต์คำสั่งของ Windows จากนั้นเลือกไฟล์รูปภาพและใช้ปุ่ม “ Tesseract ” เพื่อจดจำและดึงข้อความออกจากรูปภาพ ที่นี่ คุณได้เรียนรู้การติดตั้งและใช้งาน “ Tesseract ” บนหน้าต่าง