OCR คืออะไร

OCR คืออะไร
ก่อนอื่นต้องรู้ก่อนว่า OCR นั่นย่อมาจาก Optical Character Recognition (OCR) ซึ่งเป็นกระบวนการของการแปลงสื่อสิ่งพิมพ์ เช่นกระดาษ นิตยาสาร สัญญา หรือข้อมูลอะไรก็ตามที่อยู่ในรูปของเอกสารกระดาษ ให้กลายเป็นเป็นข้อความ หรือให้มีความฉลาดมากขึ้นกว่าการเป็น ข้อความธรรมดา ก็คือสามารถบันทึกไปเป็นไฟล์ประมวลผลคำที่สามารถแก้ไขได้ง่าย และบันทึกเก็บไว้ได้ ด้วยเทคโนโลยีนี้ได้เปิดโอกาสให้สามารถเลือกใช้วัสดุ หรืออุปกรณ์อื่นๆเพื่อใช้ในการสำรองข้อมูล โดยพื้นที่ที่ใช้งานที่ก็ไม่ต้องมาก ซึ่งต่างกับการเก็บข้อมูลที่ยังคงอยู่ในรูปแบบของการะดาษ เทคโนโลยี OCR ได้ยังผลกระทบเป็นอย่างมากกับแนวทางแห่งการจัดเก็บข้อมูล แบ่งปันข้อมูล และ แก้ไขข้อมูล ก่อนที่เทคโนโลยี Optical Character Recognition นี้เกิดขึ้น ถ้ามีคนต้องการเปลี่ยนหนังสือให้ไปเป็นข้อมูลในโปรแกรมการประมวลผลคำ แต่ละหน้าๆของหนังสือเล่มนั้น จะต้องพิมพ์คำแล้วคำเล่าจนครบ

เทคโนโลยี OCR ต้องการทั้งฮาร์ดแวร์และซอฟต์แวร์ นอกจากนี้ ระบบ OCR ที่มีความสลับซับซ้อน จำเป็นต้องใช้แผงวงจรเพิ่มเติม ติดตั้งไว้ในอุปกรณ์คอมพิวเตอร์ หรืออุปกรณ์เพื่อการอ่านข้อมูล OCR พิเศษเหล่านี้ เช่น เครื่องสแกนเอกสารเช็ค เป็นต้น เพื่อที่จะให้สามารถจบกระบวนการต่างๆได้ด้วยตัวเอง

เครื่องสแกนชนิดใช้แสงและเลนส์ (Optical scanner) จะสแกนข้อความบนหน้ากระดาษ แล้วแตกข้อมูลตัวอักษร มาสู่อนุกรมแบบจุด ซึ่งเรียกว่า “บิตแมป” ซอฟต์แวร์สามารถอ่านอักษรที่ใช้กันทั่วไปๆได้ และแยกแยะระหว่างเส้นเริ่มต้นและสิ้นสุด บิตแมปนี้สุดท้ายจะถูกแปลไปเป็นข้อความคอมพิวเตอร์

ในขณะที่เทคโนโลยี Optical Character Recognition ได้ถูกทำให้ก้าวหน้ามากใหลายๆปีที่ผ่านมา แต่ก็ยังไม่ดีหากนำมาใช้งานกับข้อมูลประเภทลายมือหรือแบบอักษรที่มีลักษณะคล้ายกับลายมือ มีหลายๆระบบที่อยู่ในอุตสาหกรรมธนาคารที่ใช้เทคโนโลยี OCR เพื่อที่จะลองอ่านข้อมูลที่เป็นจำนวนเงินบนเช็คซึ่งใช้มือเขียน และทำงานไปพร้อมๆกับความสามารถของคอมพิวเตอร์อ่านเส้นทาง และหมายเลขบัญชี

อ้างอิงจาก
http://n2n.co.th/?page_id=113