การรู้จำอักขระด้วยแสง (OCR) คืออะไร?

สารบัญ:

การรู้จำอักขระด้วยแสง (OCR) คืออะไร?
การรู้จำอักขระด้วยแสง (OCR) คืออะไร?
Anonim

การรู้จำอักขระด้วยแสง (OCR) หมายถึงซอฟต์แวร์ที่สร้างเวอร์ชันดิจิทัลของเอกสารที่พิมพ์ พิมพ์ หรือเขียนด้วยลายมือ ซึ่งคอมพิวเตอร์สามารถอ่านได้โดยไม่ต้องพิมพ์หรือป้อนข้อความด้วยตนเอง โดยทั่วไปจะใช้ OCR ในเอกสารที่สแกนในรูปแบบ PDF แต่ยังสร้างข้อความในเวอร์ชันที่คอมพิวเตอร์อ่านได้ในไฟล์รูปภาพ

OCR คืออะไร

OCR หรือที่เรียกอีกอย่างว่าการรู้จำข้อความ คือเทคโนโลยีซอฟต์แวร์ที่แปลงอักขระ เช่น ตัวเลข ตัวอักษร และเครื่องหมายวรรคตอน (เรียกอีกอย่างว่าร่ายมนตร์) จากเอกสารที่พิมพ์หรือเขียนให้อยู่ในรูปแบบอิเล็กทรอนิกส์ที่คอมพิวเตอร์จดจำและอ่านได้ง่ายขึ้นและ โปรแกรมซอฟต์แวร์อื่นๆโปรแกรม OCR บางโปรแกรมทำเช่นนี้เมื่อสแกนหรือถ่ายภาพเอกสารด้วยกล้องดิจิตอล และโปรแกรมอื่นๆ สามารถใช้กระบวนการนี้กับเอกสารที่เคยสแกนหรือถ่ายภาพโดยไม่มี OCR OCR ให้ผู้ใช้ค้นหาภายในเอกสาร PDF แก้ไขข้อความ และจัดรูปแบบเอกสารใหม่

Image
Image
สแกนหนังสือพิมพ์ประวัติศาสตร์ด้วยซอฟต์แวร์ OCR

เก็ตตี้อิมเมจ

OCR ใช้สำหรับอะไร

เพื่อการสแกนที่รวดเร็วและรวดเร็วทุกวัน OCR อาจไม่ใช่เรื่องใหญ่ หากคุณทำการสแกนเป็นจำนวนมาก การค้นหาภายใน PDF เพื่อค้นหาไฟล์ที่คุณต้องการจะช่วยประหยัดเวลาได้ไม่น้อย และทำให้ฟังก์ชัน OCR ในโปรแกรมสแกนเนอร์ของคุณมีความสำคัญมากขึ้น OCR ช่วยในเรื่องอื่นๆ ด้วย:

  • การประมวลผลข้อมูลอัตโนมัติและการป้อนข้อมูล (Example: ระบบติดตามผู้สมัครงานสำหรับประวัติย่อ)
  • ทำให้สามารถค้นหาหนังสือที่สแกนได้
  • การแปลงการสแกนด้วยลายมือเป็นข้อความที่คอมพิวเตอร์อ่านได้
  • ทำให้เอกสารใช้งานได้มากขึ้นโดยโปรแกรมอ่านที่ช่วยเหลือผู้ใช้ที่มีความบกพร่องทางสายตา
  • เก็บรักษาเอกสารทางประวัติศาสตร์และหนังสือพิมพ์ในขณะที่ค้นหาได้
  • การแยกข้อมูลและโอนไปยังโปรแกรมบัญชี (ตัวอย่าง: ใบเสร็จรับเงินและใบแจ้งหนี้)
  • การจัดทำดัชนีเอกสารสำหรับเครื่องมือค้นหา
  • การรับรู้ป้ายทะเบียนคนขับด้วยกล้องจับความเร็วและซอฟต์แวร์กล้องไฟแดง
  • เครื่องสังเคราะห์เสียงพูดสำหรับผู้ที่พูดไม่ได้ – Stephen Hawking นักฟิสิกส์เชิงทฤษฎีอาจเป็นผู้ใช้โปรแกรมสังเคราะห์เสียงพูดที่เป็นที่รู้จักมากที่สุด

บรรทัดล่าง

ทำไมไม่ถ่ายรูปกันล่ะ? เพราะคุณจะไม่สามารถแก้ไขอะไรหรือค้นหาข้อความได้เพราะมันจะเป็นแค่รูปภาพ การสแกนเอกสารและเรียกใช้ซอฟต์แวร์ OCR สามารถเปลี่ยนไฟล์นั้นเป็นสิ่งที่คุณสามารถแก้ไขและค้นหาได้

ประวัติ OCR

ในขณะที่ใช้การจดจำข้อความได้เร็วที่สุดจนถึงปี 1914 การพัฒนาอย่างกว้างขวางและการใช้เทคโนโลยีที่เกี่ยวข้องกับ OCR เริ่มขึ้นอย่างจริงจังในทศวรรษ 1950 โดยเฉพาะอย่างยิ่งกับการสร้างแบบอักษรที่เรียบง่ายมากซึ่งง่ายต่อการแปลงเป็นดิจิทัล- ข้อความที่อ่านได้ David Shepard เป็นฟอนต์แบบง่ายตัวแรกที่สร้างและรู้จักกันทั่วไปในชื่อ OCR-7B ปัจจุบัน OCR-7B ยังคงใช้ในอุตสาหกรรมการเงินสำหรับแบบอักษรมาตรฐานที่ใช้กับบัตรเครดิตและบัตรเดบิต ในทศวรรษที่ 1960 บริการไปรษณีย์ในหลายประเทศเริ่มใช้เทคโนโลยี OCR เพื่อเพิ่มความเร็วในการจัดเรียงจดหมาย รวมทั้งสหรัฐอเมริกา บริเตนใหญ่ แคนาดา และเยอรมนี OCR ยังคงเป็นเทคโนโลยีหลักที่ใช้ในการจัดเรียงจดหมายสำหรับบริการไปรษณีย์ทั่วโลก ในปี 2000 ความรู้หลักเกี่ยวกับขีดจำกัดและความสามารถของเทคโนโลยี OCR ถูกนำมาใช้เพื่อพัฒนาโปรแกรม CAPTCHA ที่ใช้ในการหยุดบอทและนักส่งสแปม

ในช่วงหลายทศวรรษที่ผ่านมา OCR ได้เติบโตขึ้นอย่างแม่นยำและซับซ้อนมากขึ้นเนื่องจากความก้าวหน้าในด้านเทคโนโลยีที่เกี่ยวข้อง เช่น ปัญญาประดิษฐ์ การเรียนรู้ของเครื่อง และการมองเห็นด้วยคอมพิวเตอร์ทุกวันนี้ ซอฟต์แวร์ OCR ใช้การจดจำรูปแบบ การตรวจจับคุณสมบัติ และการขุดข้อความเพื่อแปลงเอกสารได้เร็วและแม่นยำกว่าที่เคย

คำถามที่พบบ่อย

    ฉันจะสแกนเอกสารด้วยโทรศัพท์หรือแท็บเล็ตได้อย่างไร

    บน iOS ให้เปิดแอพ Notes และสร้างโน้ตใหม่ เปิดกล้อง แล้วแตะ สแกนเอกสาร ใน Android ให้เปิด Google Drive แล้วเลือก Plus (+) จากนั้นแตะ Scan เพื่อสแกน เอกสารด้วยโทรศัพท์ของคุณ

    ฉันจะใช้ OCR ใน Adobe Acrobat ได้อย่างไร

    เปิดไฟล์ PDF ที่มีรูปภาพที่สแกน จากนั้นเลือก เครื่องมือ > แก้ไข PDF Acrobat จะใช้ OCR โดยอัตโนมัติเพื่อให้คุณแก้ไขข้อความได้ เพียงเลือกตำแหน่งที่คุณต้องการแก้ไขแล้วเริ่มพิมพ์

    OCR กับ OMR ต่างกันอย่างไร

    Optical Mark Recognition (OMR) เป็นซอฟต์แวร์ที่ตรวจจับเครื่องหมายบนกระดาษ โดยปกติแล้วจะเป็นแผ่นฟองอากาศOMR ใช้ในการประมวลผลผลการสอบ การสำรวจ แบบสอบถาม และแม้กระทั่งการเลือกตั้ง OMR ไม่สามารถถอดรหัสเครื่องหมายบนหน้าต่างจาก OCR ได้ แต่จะตรวจสอบเฉพาะว่ามีเครื่องหมายเท่านั้น

แนะนำ: