Tesseract เป็นเครื่องมือการรู้จำข้อความโอเพนซอร์ซที่ใช้ได้ฟรี หรือที่เรียกว่า OCR (การรู้จำอักขระด้วยแสง) ส่วนใหญ่จะใช้เพื่อระบุและดึงข้อความจากภาพ มันจะอ่านข้อความจากข้อมูลรูปภาพและเขียนผลลัพธ์ในไฟล์ .txt ใหม่ Tesseract ยังทำงานภายใต้ Python เนื่องจากส่วนใหญ่จะใช้เพื่อจดจำลายมือจากรูปภาพ กำลังใช้โมเดล LSTR (หน่วยความจำระยะสั้นแบบยาว) Tesseract ทำงานภายใต้ใบอนุญาต Apache 2.0
เราจะอธิบายวิธีการติดตั้ง Tesseract บน Windows อย่างละเอียดในบล็อกนี้
เริ่มกันเลย!
จะติดตั้ง Tesseract บน Windows ได้อย่างไร?
Tesseract เป็นเครื่องมือบรรทัดคำสั่งที่ใช้สำหรับการแยกข้อความจากรูปภาพ ในการติดตั้ง Tesseract บน Windows คุณต้องทำตามคำแนะนำด้านล่าง
ขั้นตอนที่ 1: ดาวน์โหลดตัวติดตั้ง Tesseract
ขั้นแรก ไปที่ลิงก์ที่ให้ไว้ด้านล่างและดาวน์โหลดตัวติดตั้ง Tesseract ตามข้อกำหนดระบบของคุณ:
https: // github.com / UB-มันไฮม์ / tesseract / สัปดาห์
ขั้นตอนที่ 2: เรียกใช้ Tesseract Installer
เยี่ยมชม ' ดาวน์โหลด ” ไดเร็กทอรีที่ดาวน์โหลดตัวติดตั้ง Tesseract ในการติดตั้ง Tesseract บน Windows ให้รันโปรแกรมติดตั้ง Tesseract โดยดับเบิลคลิกที่มัน:
ขั้นตอนที่ 3: เลือกภาษา
ตัวติดตั้ง Tesseract รองรับหลายภาษา ในการโต้ตอบกับ UI ของตัวติดตั้ง ให้เลือก “ ภาษาอังกฤษ ” เป็นภาษาของคุณและคลิกที่ “ ตกลง ”:
ขั้นตอนที่ 4: ติดตั้ง Tesseract
เมื่อทำเช่นนั้น วิซาร์ดการตั้งค่า Tesseract OCR จะปรากฏขึ้นบนหน้าจอ ในการเริ่มต้นการติดตั้ง Tesseract ให้กดปุ่ม “ ต่อไป ' ปุ่ม:
เพื่อยอมรับ “ ข้อตกลง ', คลิก ' ฉันเห็นด้วย ' ปุ่ม:
เลือก “ ติดตั้งสำหรับทุกคนที่ใช้คอมพิวเตอร์เครื่องนี้ ” และกด “ ต่อไป ' ปุ่ม:
หากคุณต้องการเพิ่มข้อมูลสคริปต์หรือรวมภาษาอื่น ให้ทำเครื่องหมายที่ช่องทำเครื่องหมายและกด ' ต่อไป ' ปุ่ม. เนื่องจากเราไม่ต้องการสคริปต์ข้อมูลเพิ่มเติมหรือภาษาใดๆ ดังนั้น เราจะดำเนินการต่อด้วยตัวเลือกเริ่มต้นที่เลือกไว้:
เลือกตำแหน่งการติดตั้งและคลิกที่ปุ่ม “ ต่อไป ' ปุ่ม:
หากคุณไม่ต้องการสร้างทางลัดในเมนูเริ่ม ให้ทำเครื่องหมายที่ ' อย่าสร้างทางลัด ” ช่องทำเครื่องหมายและกดปุ่ม “ ติดตั้ง ' ปุ่ม:
หลังจากนั้น การติดตั้ง Tesseract จะเริ่มต้นขึ้น รอจนกว่าการติดตั้งจะเสร็จสิ้นและกดปุ่ม “ ต่อไป ' ปุ่ม:
สุดท้ายคลิกที่ “ เสร็จ ' ปุ่ม:
ขั้นตอนที่ 5: ตั้งค่าตัวแปรสภาพแวดล้อม
หลังจากการติดตั้ง คุณต้องตั้งค่าตัวแปรสภาพแวดล้อมของ Tesseract ในการดำเนินการดังกล่าว ก่อนอื่นให้ไปที่ไดเร็กทอรีที่คุณติดตั้ง Tesseract และคัดลอกพาธจาก “ ที่อยู่ ' บาร์:
ค้นหา “ ตัวแปรสภาพแวดล้อม ' ใน ' สตาร์ทอัพ ” เมนูและเปิด “ แก้ไขตัวแปรสภาพแวดล้อมของระบบ ”:
ภายในการตั้งค่า ให้ไปที่ “ ขั้นสูง ” เมนูการตั้งค่าและคลิกที่ “ ตัวแปรสภาพแวดล้อม ' ปุ่ม:
เลือก ' เส้นทาง ” ตัวแปรจาก “ ตัวแปรระบบ ” และกด “ แก้ไข ' ปุ่ม:
หลังจากนั้น ' แก้ไขตัวแปรสภาพแวดล้อม ” จะปรากฏบนหน้าจอ กด ' ใหม่ ” และวางเส้นทางไดเรกทอรีการติดตั้ง Tesseract ที่คัดลอกไว้ที่นี่ สุดท้ายคลิกที่ “ ตกลง ' ปุ่ม:
ขั้นตอนที่ 6: ตรวจสอบการติดตั้ง Tesseract
ในการตรวจสอบการติดตั้ง Tesseract ให้เปิด Windows Command Prompt โดยค้นหา ' พร้อมรับคำสั่ง ' ใน ' สตาร์ทอัพ ' เมนู:
ตรวจสอบเวอร์ชัน Tesseract โดยใช้คำสั่งที่ให้มา:
> tesseract --รุ่น
ผลลัพธ์ด้านล่างระบุว่าเราได้ติดตั้ง Tesseract เวอร์ชันเรียบร้อยแล้ว ' v5.2.0 ” บน Windows:
มาดูวิธีใช้ Tesseract บน Windows กัน
วิธีการใช้ Tesseract บน Windows?
Tesseract ใช้เพื่ออ่านลายมือหรือแยกข้อความจากรูปภาพ มาดูกันว่ามันทำงานอย่างไร:
ขั้นตอนที่ 1: เลือกรูปภาพ
เลือกรูปภาพที่คุณต้องการแยกข้อความ ตามที่เราได้เลือก” 1.png ”:
ขั้นตอนที่ 2: แยกข้อความจากรูปภาพ
เมื่อเปิด CMD แล้ว ใช้ “ ซีดี ” เพื่อเปลี่ยนไดเร็กทอรีที่เก็บรูปภาพ จากนั้นเรียกใช้ ' tesseract ” คำสั่งและกำหนดชื่อไฟล์ภาพตามที่เราได้ระบุไว้ “ 1.png ” “ ข้อความ ” พารามิเตอร์แสดงชื่อไฟล์ที่ส่งออก:
> ซีดี C:\Users\anuma\OneDrive\Pictures\Saved Pictures> tesseract 1 .png 'ข้อความ'
ขั้นตอนที่ 3: ตรวจสอบการแยกข้อความ
ในการตรวจสอบการแยกข้อความ ให้ไปที่ไดเร็กทอรีที่มีไฟล์รูปภาพอยู่ จะเห็นว่าไฟล์ที่ส่งออกไป “ ข้อความ ” จะถูกบันทึกไว้ที่นี่เช่นกัน ดับเบิลคลิกที่ไฟล์เอาต์พุตเพื่อตรวจสอบว่า tesseract แยกข้อความออกจากรูปภาพหรือไม่:
คุณจะเห็นว่าเราแยกข้อความสำเร็จโดยใช้เครื่องมือบรรทัดคำสั่ง Tesseract:
เราได้สาธิตเทคนิคการติดตั้งและใช้งาน Tesseract บน Windows
บทสรุป
ในการติดตั้ง Tesseract บน Windows จำเป็นต้องดาวน์โหลดตัวติดตั้ง Tesseract เพื่อจุดประสงค์นี้ ให้ทำตามช่วงแรกของบทความนี้ ถัดไปตั้งค่าตัวแปรสภาพแวดล้อมเส้นทางเพื่อใช้และเข้าถึง Tesseract จากพรอมต์คำสั่งของ Windows จากนั้นเลือกไฟล์รูปภาพและใช้ปุ่ม “ Tesseract ” เพื่อจดจำและดึงข้อความออกจากรูปภาพ ที่นี่ คุณได้เรียนรู้การติดตั้งและใช้งาน “ Tesseract ” บนหน้าต่าง