การรู้จำอักขระด้วยแสง (OCR) คืออะไร?

👤 ผู้เขียน Abigail Brown 📧 brown@technologyhumans.com.
⏱ Public 2023-12-17 07:03.
🖍 แก้ไขล่าสุด 2025-06-01 07:18.

การรู้จำอักขระด้วยแสง (OCR) หมายถึงซอฟต์แวร์ที่สร้างเวอร์ชันดิจิทัลของเอกสารที่พิมพ์ พิมพ์ หรือเขียนด้วยลายมือ ซึ่งคอมพิวเตอร์สามารถอ่านได้โดยไม่ต้องพิมพ์หรือป้อนข้อความด้วยตนเอง โดยทั่วไปจะใช้ OCR ในเอกสารที่สแกนในรูปแบบ PDF แต่ยังสร้างข้อความในเวอร์ชันที่คอมพิวเตอร์อ่านได้ในไฟล์รูปภาพ

OCR คืออะไร

OCR หรือที่เรียกอีกอย่างว่าการรู้จำข้อความ คือเทคโนโลยีซอฟต์แวร์ที่แปลงอักขระ เช่น ตัวเลข ตัวอักษร และเครื่องหมายวรรคตอน (เรียกอีกอย่างว่าร่ายมนตร์) จากเอกสารที่พิมพ์หรือเขียนให้อยู่ในรูปแบบอิเล็กทรอนิกส์ที่คอมพิวเตอร์จดจำและอ่านได้ง่ายขึ้นและ โปรแกรมซอฟต์แวร์อื่นๆโปรแกรม OCR บางโปรแกรมทำเช่นนี้เมื่อสแกนหรือถ่ายภาพเอกสารด้วยกล้องดิจิตอล และโปรแกรมอื่นๆ สามารถใช้กระบวนการนี้กับเอกสารที่เคยสแกนหรือถ่ายภาพโดยไม่มี OCR OCR ให้ผู้ใช้ค้นหาภายในเอกสาร PDF แก้ไขข้อความ และจัดรูปแบบเอกสารใหม่

สแกนหนังสือพิมพ์ประวัติศาสตร์ด้วยซอฟต์แวร์ OCR

เก็ตตี้อิมเมจ

OCR ใช้สำหรับอะไร

เพื่อการสแกนที่รวดเร็วและรวดเร็วทุกวัน OCR อาจไม่ใช่เรื่องใหญ่ หากคุณทำการสแกนเป็นจำนวนมาก การค้นหาภายใน PDF เพื่อค้นหาไฟล์ที่คุณต้องการจะช่วยประหยัดเวลาได้ไม่น้อย และทำให้ฟังก์ชัน OCR ในโปรแกรมสแกนเนอร์ของคุณมีความสำคัญมากขึ้น OCR ช่วยในเรื่องอื่นๆ ด้วย:

การประมวลผลข้อมูลอัตโนมัติและการป้อนข้อมูล (Example: ระบบติดตามผู้สมัครงานสำหรับประวัติย่อ)
ทำให้สามารถค้นหาหนังสือที่สแกนได้
การแปลงการสแกนด้วยลายมือเป็นข้อความที่คอมพิวเตอร์อ่านได้
ทำให้เอกสารใช้งานได้มากขึ้นโดยโปรแกรมอ่านที่ช่วยเหลือผู้ใช้ที่มีความบกพร่องทางสายตา
เก็บรักษาเอกสารทางประวัติศาสตร์และหนังสือพิมพ์ในขณะที่ค้นหาได้
การแยกข้อมูลและโอนไปยังโปรแกรมบัญชี (ตัวอย่าง: ใบเสร็จรับเงินและใบแจ้งหนี้)
การจัดทำดัชนีเอกสารสำหรับเครื่องมือค้นหา
การรับรู้ป้ายทะเบียนคนขับด้วยกล้องจับความเร็วและซอฟต์แวร์กล้องไฟแดง
เครื่องสังเคราะห์เสียงพูดสำหรับผู้ที่พูดไม่ได้ - Stephen Hawking นักฟิสิกส์เชิงทฤษฎีอาจเป็นผู้ใช้โปรแกรมสังเคราะห์เสียงพูดที่เป็นที่รู้จักมากที่สุด

บรรทัดล่าง

ทำไมไม่ถ่ายรูปกันล่ะ? เพราะคุณจะไม่สามารถแก้ไขอะไรหรือค้นหาข้อความได้เพราะมันจะเป็นแค่รูปภาพ การสแกนเอกสารและเรียกใช้ซอฟต์แวร์ OCR สามารถเปลี่ยนไฟล์นั้นเป็นสิ่งที่คุณสามารถแก้ไขและค้นหาได้

ประวัติ OCR

ในขณะที่ใช้การจดจำข้อความได้เร็วที่สุดจนถึงปี 1914 การพัฒนาอย่างกว้างขวางและการใช้เทคโนโลยีที่เกี่ยวข้องกับ OCR เริ่มขึ้นอย่างจริงจังในทศวรรษ 1950 โดยเฉพาะอย่างยิ่งกับการสร้างแบบอักษรที่เรียบง่ายมากซึ่งง่ายต่อการแปลงเป็นดิจิทัล- ข้อความที่อ่านได้ David Shepard เป็นฟอนต์แบบง่ายตัวแรกที่สร้างและรู้จักกันทั่วไปในชื่อ OCR-7B ปัจจุบัน OCR-7B ยังคงใช้ในอุตสาหกรรมการเงินสำหรับแบบอักษรมาตรฐานที่ใช้กับบัตรเครดิตและบัตรเดบิต ในทศวรรษที่ 1960 บริการไปรษณีย์ในหลายประเทศเริ่มใช้เทคโนโลยี OCR เพื่อเพิ่มความเร็วในการจัดเรียงจดหมาย รวมทั้งสหรัฐอเมริกา บริเตนใหญ่ แคนาดา และเยอรมนี OCR ยังคงเป็นเทคโนโลยีหลักที่ใช้ในการจัดเรียงจดหมายสำหรับบริการไปรษณีย์ทั่วโลก ในปี 2000 ความรู้หลักเกี่ยวกับขีดจำกัดและความสามารถของเทคโนโลยี OCR ถูกนำมาใช้เพื่อพัฒนาโปรแกรม CAPTCHA ที่ใช้ในการหยุดบอทและนักส่งสแปม

ในช่วงหลายทศวรรษที่ผ่านมา OCR ได้เติบโตขึ้นอย่างแม่นยำและซับซ้อนมากขึ้นเนื่องจากความก้าวหน้าในด้านเทคโนโลยีที่เกี่ยวข้อง เช่น ปัญญาประดิษฐ์ การเรียนรู้ของเครื่อง และการมองเห็นด้วยคอมพิวเตอร์ทุกวันนี้ ซอฟต์แวร์ OCR ใช้การจดจำรูปแบบ การตรวจจับคุณสมบัติ และการขุดข้อความเพื่อแปลงเอกสารได้เร็วและแม่นยำกว่าที่เคย

คำถามที่พบบ่อย

ฉันจะสแกนเอกสารด้วยโทรศัพท์หรือแท็บเล็ตได้อย่างไร

บน iOS ให้เปิดแอพ Notes และสร้างโน้ตใหม่ เปิดกล้อง แล้วแตะ สแกนเอกสาร ใน Android ให้เปิด Google Drive แล้วเลือก Plus (+) จากนั้นแตะ Scan เพื่อสแกน เอกสารด้วยโทรศัพท์ของคุณ

ฉันจะใช้ OCR ใน Adobe Acrobat ได้อย่างไร

เปิดไฟล์ PDF ที่มีรูปภาพที่สแกน จากนั้นเลือก เครื่องมือ > แก้ไข PDF Acrobat จะใช้ OCR โดยอัตโนมัติเพื่อให้คุณแก้ไขข้อความได้ เพียงเลือกตำแหน่งที่คุณต้องการแก้ไขแล้วเริ่มพิมพ์

OCR กับ OMR ต่างกันอย่างไร

Optical Mark Recognition (OMR) เป็นซอฟต์แวร์ที่ตรวจจับเครื่องหมายบนกระดาษ โดยปกติแล้วจะเป็นแผ่นฟองอากาศOMR ใช้ในการประมวลผลผลการสอบ การสำรวจ แบบสอบถาม และแม้กระทั่งการเลือกตั้ง OMR ไม่สามารถถอดรหัสเครื่องหมายบนหน้าต่างจาก OCR ได้ แต่จะตรวจสอบเฉพาะว่ามีเครื่องหมายเท่านั้น

แนะนำ:

การรู้จำอักขระด้วยแสง (OCR) คืออะไร?

สารบัญ:

OCR คืออะไร

OCR ใช้สำหรับอะไร

บรรทัดล่าง

ประวัติ OCR

คำถามที่พบบ่อย

ฉันจะสแกนเอกสารด้วยโทรศัพท์หรือแท็บเล็ตได้อย่างไร

ฉันจะใช้ OCR ใน Adobe Acrobat ได้อย่างไร

OCR กับ OMR ต่างกันอย่างไร

แนะนำ:

Conhost.exe ใน Windows คืออะไร มันทำอะไร?

แผงควบคุมใน Windows คืออะไร?

ไฟล์ ATN คืออะไร?

PSU คืออะไร? พาวเวอร์ซัพพลาย ATX คืออะไร?

การใช้ OCR ใน Microsoft Office

วิธีถ่ายและแชร์ภาพหน้าจอของ Nintendo Switch

วิธีใช้ Google สไลด์แอนิเมชั่นและการเปลี่ยนภาพ

วิธีลบบัญชี Dropbox

7 iPhone ที่ดีที่สุดของปี 2022

วิธีใช้แอพ iPhone TV

รูปแบบไฟล์เสียงแตกต่างกันอย่างไรและสิ่งนี้มีความหมายต่อผู้ฟังอย่างไร

เกมพินบอลออนไลน์ที่ดีที่สุดฟรี

What.COM หมายถึงใน URL

วิธีการส่งออกข้อมูลจากแบบฟอร์ม Word ไปยัง Excel

การตั้งค่าอีเมลของ iPhone ทำอะไรได้บ้าง

6 สุดยอดเกมมิ่งมอนิเตอร์แห่งปี 2022

อธิบายทุกมาตรฐานการชาร์จ EV และประเภทตัวเชื่อมต่อ

วิธีเปิดใช้งานโหมดเต็มหน้าจอใน Firefox

9 หูฟังที่ดีที่สุดสำหรับการวิ่ง ทดสอบโดย Lifewire

วิธีปิดเสียงหรือเปิดเสียงการสนทนาใน Gmail