ชุดพัฒนาเพื่องานจับข้อมูลบนอุปกรณ์พกพา

เป็นชุดที่บรรจุองค์ประกอบของซอฟต์แวร์เพื่องาน “รู้จำข้อมูล หรือ OCR” ที่ยอมให้นักพัฒนาระบบที่ทำงานอยู่บนแฟลตฟอร์มต่างๆ อาทิเช่น IOS, Android, MacOs และ Windows สามารถเอาไปใช้งาน หรือพัฒนาร่วมเพื่อเชื่อมต่อกับระบบที่มีอยู่แล้วได้ทันที โดยไม่จำเป็นต้องเปลี่ยนไปใช้โปรแกรมภาษาอื่นๆ ที่ตนเองไม่ถนัด ไฟล์เอกสารรูปภาพ ที่ผ่านองค์ประกอบซอฟต์แวร์ตัวนี้ จะถูกแปลงให้อยู่ในรูปของผลลัพธ์ที่สามารถจัดการต่อได้ และสามารถสืบค้นข้อความได้

เพิ่มพลังให้กับโปรแกรมของท่าน ด้วยคุณสมบัติด้าน OCR

  • ส่งข้อมูลบนนามบัตร เข้าสู่สมุดที่อยู่บนอุปกรณ์พกพา
  • จับคำหรือประโยคข้อความ และส่งข้อมูลได้ทันที ขณะเดินทาง
  • ได้รับข้อมูลที่จำเป็นๆ ด้วยความช่วยเหลือจากความสามารถด้านการอ่านข้อมูลบาร์โค้ด
  • อ่านข้อความจากข้อมูลต้นทางที่มีความแตกต่างของภาษา ได้หลากหลายภาษา

 ทำงานอย่างไร

  • ขั้นตอนที่1 : นำข้อมูลภาพเข้า และ เริ่มการประมวลผล
  • ขั้นตอนที่2 : วิเคราะห์โครงสร้างทั้งหมดในเอกสารภาพ หรือภาพถ่ายที่นำเข้า
  • ขั้นตอนที่3 : ดำเนินการ“การรู้จำ/จดจำ” ตัวอักขระ, รวมไปถึงการประมวลผลโครงสร้างข้อมูลเฉพาะของนามบัตร หรือ ประมวลผลข้อมูลเพื่อการอ่านข้อมูลแบบบาร์โค้ด
  • ขั้นตอนที่4: ประมวลผลลัพธ์สุดท้าย

 แพลตฟอร์มที่รองรับ

  •  iOS
  • Android
  • MacOS
  • Windows

ดาวโหลด Datasheet

Product Description 

บนพื้นฐานการยอมรับเทคโนโลยีด้านงาน OCR ที่ก้าวล้ำ ของ ABBYY ชุดคำสั่งและองค์ประกอบด้านซอฟต์แวร์เพื่องานรู้จำข้อมูลบนอุปกรณ์พกพาจาก ABBYY ได้สร้างอัลกอริทึ่มที่ซับซ้อน และ ทรงพลัง ที่ซึ่งออกแบบมาเพื่องาน ประมวลผลไฟล์รูปภาพ และ งานการจับข้อมูลอักขระที่มีความแม่นยำสูงให้เกิดขึ้นจริงบนอุปกรณ์พกพาชนิดต่างๆ และ มันยังถูกทำให้พัฒนาให้ทำงานอย่างมีประสิทธิภาพ บนความต้องการการใช้ทรัพยากรขั้นต่ำของเครื่องพกพานั้นๆ

ใครเหมาะกับ ชุดคำสั่งและองค์ประกอบด้านซอฟต์แวร์เพื่องานรู้จำข้อมูลบนอุปกรณ์พกพา

นักพัฒนาซอฟต์แวร์ และฮาร์ดแวร์, โรงงานผู้ที่ผลิตอุปกรณ์เพื่องานสแกนเอกสาร และ ประมวลผลไฟล์รูปภาพ, สำหรับนักพัฒนาระบบ หรือซอฟต์แวร์ประยุกต์บนเครื่องพีซี ที่ต้องการใช้คุณสมบัติด้านการ OCR นี้เข้าไปในซอฟต์แวร์ของตนเอง ก็สามารถที่จะทำได้เช่นกัน

ชุดคำสั่งและองค์ประกอบด้านซอฟต์แวร์เพื่องานรู้จำข้อมูลบนอุปกรณ์พกพา จากABBYY ทำอะไรได้บ้าง

มันสามารถเปลี่ยนข้อมูลตัวอักษร ที่ปรากฏบนไฟล์รูปภาพให้เป็นข้อความ หรือเป็นอักขระที่นำไปใช้งานอื่นๆต่อได้ ซึ่งแน่นอนว่ามันจะสามารถ บันทึกใหม่ แก้ไขข้อมูล หรือ ส่งข้อมูลผลลัพธ์สุดท้าย เหล่านั้นผ่านทางระบบอีเมล์ เครือข่ายสังคมออนไลน์ และ ผู้ให้บริการเช่าพื้นที่แบบออนไลน์ ก็ได้  โปรแกรมประยุกต์พื้นฐานที่นำเอาเจ้าชุดคำสั่งของ ABBYY มาใช้แปลงข้อมูล จะเป็นโปรแกรมที่เกี่ยวข้องกับการอ่านข้อมูลที่ต้นทางนั้นมาจาก เอกสารบันทึก, นามบัตร, หนังสือพิมพ์ หรือ ข้อความบนสื่อสิ่งพิมพ์ที่ถูกถ่ายจากกล้องที่ติดกับอุปกรณ์พกพา

ท่านจะได้รับประโยชน์จากชุดพัฒนาของ ABBYY ชุดนี้อย่างไร

เล็กกะทัดรัด และ ไม่ใช้ทรัพยากรมาก แต่มีประสิทธิภาพและสมรรถภาพสูง นี่คือข้อคุณสมบัติที่โดดเด่นของ ชุดคำสั่งและองค์ประกอบด้านซอฟต์แวร์เพื่องานรู้จำข้อมูลบนอุปกรณ์พกพาจาก ABBYY ด้วยคุณสมบัติต่างๆที่มีให้ใช้งานภายในชุดพัฒนาชุดนี้ ท่านสามารถนำไปพัฒนาต่อ หรือ สร้างผลิตภัณฑ์ที่มีมูลค่าแก่ลูกค้า หรือจะใช้เพื่อปรับเพิ่ม และขยายขีดความสามารถของโปรแกรมประยุกต์ต่างๆของท่านให้สามารถครอบคลุมได้ทุกๆธุรกิจ

  • ชุดคำสั่งและองค์ประกอบทางด้านซอฟต์แวร์ ก็เป็นชุดเดียวกับกับที่ใช้ในโปรแกรม  ABBYY FineReader โปรแกรมซึ่งได้รับรางวัลมากมายเกี่ยวกับเทคโนโลยีการจดจำตัวอักษร และวิเคราะห์โครงสร้างเอกสาร
  • รองรับการทำงานกับอักขระในภาษาต่างๆได้มากถึง 61 ภาษา
  • การใช้ทรัพยากรที่น้อยภายในอุปกรณ์พกพา การจัดการหน่วยความจำระหว่างประมวลผลที่เหมาะสม และ การโหลดที่มีประสิทธิภาพเพื่อสมรรถนะที่สูงขึ้น เป็นตัวประเมินประสิทธิผลที่ได้ของโมดูลตัวนี้
  • ขยายฐานตลาดลูกค้าของท่านได้ เพราะการรองรับแพลตฟอร์มที่หลากหลายชุดพัฒนาตัวนี้ ทำงานได้บน Android, iOS, Mac และ Windows
  • สร้างเอกลักษณ์ของผลิตภัณฑ์เพื่อลูกค้าภาคธุรกิจ นำไปใช้ในการแปลงข้อมูลจากนามบัตร หรือเอกสารที่มีข้อมูลบาร์โค้ด

OCR Stages 

สถานะของแต่ละขั้นตอน รายละเอียด 
ขั้นที่ 1: นำข้อมูลเข้าและประมวลผล

  ไฟล์รูปภาพจะถูกส่งไปเก็บไว้ที่หน่วยความจำ และรอพร้อมสำหรับการทำ OCR จากนั้นกระบวนการแจกแจงระหว่างข้อมูลที่เป็นพื้นหลัง กับข้อมูลที่เป็นข้อความ/ตัวอักษร จะเริ่มขึ้น ขั้นตอนการแปลงโหมดสีของไฟล์รูปภาพ จากสีให้เป็นขาว-ดำ ส่งผลให้ขนาดของไฟล์เล็กลงเป็นอย่างมาก ตามด้วยการปรับความเอียงของเอกสาร และการตรวจสอบว่าระนาบของข้อมูลถูกจัดวางได้อย่างเหมาะสมต่อการประมวลผลหรือไม่ สามารถถูกนำมาใช้งาน

ปรับแก้การเอียงของเอกสารให้ถูกต้องอย่างอัตโนมัติ

  เมื่อคุณถ่ายภาพด้วยอุปกรณ์พกพา เช่น กล้อง หรือสแกนภาพผ่านอุปกรณ์สแกนเนอร์ชนิดพกพาในระหว่างที่คุณเดินทาง ส่วนใหญ่แล้วภาพที่ได้จะเกิดการเอียง ซึ่งเป็นผลที่ไม่ดีนักหากนำไฟล์รูปภาพที่มีการเอียงเข้าสู่ขั้นตอนของการทำ OCR   ชุดพัฒนาตัวนี้จะตรวจจับ และปรับความเอียงของเอกสาร หรือรูปภาพให้ถูกต้อง จะส่งผลต่อคุณภาพของความแม่นยำในผลลัพธ์ที่ได้จากการทำ OCR บนอุปกรณ์พกพาเหล่านี้เป็นอย่างมาก

ตรวจจับระนาบที่ถูกต้องของเอกสาร

   การประมวลผลไฟล์รูปภาพในขั้นตอนแรกๆจะทำการตรวจจับระนาบของข้อมูลในเอกสาร หรือรูปภาพที่นำเข้ามา เพื่อดูว่ามันถูกจัดวางระนาบได้อย่างถูกต้องแล้วหรือไม่ เช่น ข้อมูลข้อความมันถูกเรียงเป็นแนวตั้ง หรือ แนวนอนแบบกลับหัว เป็นตัน หากมันทราบว่ามีการวางระนาบที่ไม่ถูกต้อง มันจะทำการหมุนเอกสารให้เองอัตโนมัติ โดยใช้ข้อมูลของตัวอักษรในแต่ละบรรทัด เป็นตัวแปรที่สำคัญสำหรับการหมุนเอกสารให้ถูกต้อง

 

ขั้นที่ 2: วิเคราะห์เอกสาร

   การวิเคราะห์เอกสารถือเป็นส่วนหนึ่งของชุดคำสั่งเพื่อใช้วิเคราะห์รูปภาพ มันจะตรวจจับในระดับตัวอักขระ การเชื่อมร่วมของอักขระไปสู่ประโยค จากนั้นก็ข้อความของแต่ละบรรทัด และสุดท้ายก็จะวิเคราะห์ทีละย่อหน้า  เพิ่มเติม สำหรับพื้นที่ที่ผ่านการอ่านแล้ว มันจะถูกทำให้สะอาด และข้อมูลรบกวนต่างๆจะถูกล้างออกทันที

รองรับ ยัติภงค์ (หรือเครื่องหมาย –)

   ถ้าเครื่องมือนี้พบว่ามีข้อความที่มีเครื่องหมาย – อยู่บรรทัดบน บรรทัดที่สองก็จะต้องมีข้อมูลบางส่วนที่สอดคล้องกับข้อความที่มี่เครื่องหมาย – ด้วยเช่นกัน เครื่องมือนี้จะทำการรวมข้อความให้อัตโนมัติ เช่น (Mon-) (day) ก็จะรวมเป็น Monday เป็นต้น

คงรูปแบบข้อความในหลายๆสดมภ์

   ในรุ่นก่อนๆของ ABBYY Mobile OCR Engine นี้ ข้อความในไฟล์จะถูกรู้จำจากซ้ายไปขวา และ บนลงล่างเสมอ ซึ่งส่งผลให้ผลลัพธ์ที่ได้จาก 1หน้าเอกสารก็จะกลายเป็นข้อความ 1 บรรทัดที่ยาวมากๆ   ในรุ่นที่ 4.0 ของ ABBYY Mobile OCR Engine นี้ ได้เพิ่มฟังก์ชั่นที่ชื่อว่า <<Paragraph Assembly>> ฟังก์ชั่นนี้จะทำการจำแนกกลุ่มข้อมูลให้มีลักษณะเป็น กล่องๆ จากนั้นค่อยทำการรู้จำจากบนลงล่าง และซ้ายไปขวา เช่นเดิม แต่ผลลัพธ์ที่ได้สำหรับวิธีการใหม่นี้ จะทำให้ข้อมูลไม่ถูกนำไปจัดเรียงเป็นบรรทัดยาวมันจะไม่ใช่ 1 บรรทัดและมีข้อความยาวๆ แต่มันจะถูกจัดเรียงตามสดมภ์ และยังสงวนสไตล์ของตัวอักษรไว้ได้อย่างสมบูรณ์อีกด้วย

คงรูปแบบของตัวอักษร

   ABBYY Mobile OCR Engine  ได้มีการระบุค่ารูปแบบของตัวอักษรจากข้อมูลต้นฉบับ และจากนั้นมันจะนำค่าที่ได้ ไปกำหนดใช้ให้กับข้อมูลผลลัพธ์ด้วย เช่น ตัวเอียง, ตัวหนา หรือ มีเส้นใต้ เป็นต้น

ตัวแสดงระดับความมั่นใจ

   คุณสมบัตินี้จะใช้แสดงระดับของความมั่นใจของข้อมูลตัวอักษรซึ่งผ่านขั้นตอนการรู้จำแล้ว ผู้พัฒนาจะสามารถนำเอาข้อมูลนี้ไปใช้สร้างกฎเกณฑ์ที่มีความยืดหยุ่น เพื่อนำไปพัฒนาใช้กับงาน “พิสูจน์ผลลัพธ์ด้วยการอ่าน” และ “งานตรวจคำผิด” ต่างๆ ได้ อาทิ เช่น นักพัฒนาระบบสามารถกำหนดกฎงาน ได้ว่า หากผลลัพธ์มีค่าความมั่นใจต่ำกว่า 60% ให้นำเอาผลลัพธ์นั้นๆไป เข้าสู่กระบวนการ “งานตรวจคำผิด” นั่นเอง

ตรวจสอบการสะกด

   ในขณะที่ทำการรู้จำข้อมูลข้อความจากเอกสารต้นทาง ท่านสามารถสั่งให้เครื่องมือนี้ทำการตรวจสอบคำสะกดไปได้พร้อมๆกันด้วย ก็จะส่งผลให้ผลลัพธ์ที่ได้มีความถูกต้องตามหลักไวยากรณ์ มากขึ้น

 

ขั้นที่ 3: รู้จำข้อมูลตัวอักขระ

   จากนั้น กลุ่มข้อมูลต่างๆบนเอกสารรูปภาพ ที่ผ่านการถูกตรวจสอบแล้ว จะถูกรู้จำด้วยภาษาพิเศษ และแบบแผนต่างๆที่ถูกนิยามไว้แล้ว   ถ้าฐานข้อมูลคำศัพท์มีให้ใช้งาน ข้อความก็จะถูกนำมาเปรียบเทียบกับฐานข้อมูลคำศัพท์ เพื่อให้เกิดคุณภาพการรู้จำข้อมูลโดยรวมทั้งหมดได้รับการปรับปรุง ผลลัพธ์ที่ได้หลังขั้นตอนการรู้จำข้อมูลก็คือ ชุดตัวอักษรพร้อมกับค่าพิกัดที่ตั้งในบรรทัดของตนเอง   แต่ละตัวอักษรมีระดับความมั่นใจ ซึ่งใช้แสดงถึงตัวขับเคลื่อนหลักว่ามีความมั่นใจต่อผลลัพธ์ที่ได้ออกมาสำหรับแต่ละตัวอักษรเป็นอย่างไร

2 โหมดเพื่อการรู้จำข้อมูลโหมดทำงานเร็ว – เพื่อความรวดเร็วในการรู้จำข้อมูล โหมดนี้จะเหมาะกับเอกสาร หรือรูปภาพที่มีความสะอาดชัดเจน จะช่วยลดระยะเวลาของการประมวลผลภาพและการจับข้อมูลออกจากเอกสารได้อย่างมากและได้ข้อมูลที่ถูกต้องแม่นยำอีกด้วยโหมดทำงานละเอียด – เพื่อความแม่นยำในการรู้จำข้อมูล โหมดนี้จะเหมาะกับเอกสารที่มีคุณภาพแย่ เช่น รูปที่มีความมืดดำ, มีความเอียง เป็นต้น ซึ่งแน่นอนว่าจะต้องใช้เวลาในการประมวลผลที่นานกว่าโหมดแรก เพื่อให้ได้ผลลัพธ์ที่ถูกต้องเหมาะสมที่สุดเพื่องานอ่านนามบัตร (เลือกใช้งาน)

   ผลลัพธ์ที่ได้หลังจากขั้นตอนการจับข้อมูล มันจะเป็นโครงสร้างของข้อมูลที่มีนัยเกี่ยวกับเจ้าของนามบัตร และพร้อมที่จะถูกดึงออกมาใช้งานได้ทันที

   ความสามารถนี้อนุญาตให้มีการเรียกข้อมูลต่างๆ จากภาพนามบัตร อาทิเช่น ชื่อ, ชื่อสกุล, ตำแหน่งของเจ้าของบัตร, หมายเลขโทรศัพท์, อีเมล์, ชื่อบริษัท, เว็บไซต์ และ รหัสไปรษณีย์ ได้ ในปัจจุบันด้วยคุณสมบัติที่มีเทคโนโลยีเพื่อการอ่านข้อมูลบนนามบัตรได้ถึง 23 ภาษาแล้ว

เพื่อการรู้จำข้อมูลบาร์โค้ด (เลือกใช้งาน)

   เป็นฟังก์ชั่น หรือคุณสมบัติที่ตระเตรียมไว้เพื่อการอ่านข้อมูลบาร์โค้ดทั้งแบบ 1 มิติ และ 2 มิติ โดยการอ่านบาร์โค้ดผู้ใช้งานจำเป็นต้องระบุพิกัด หรือบริเวณให้ระบบทราบว่าด้วยว่า ตรงไหนคือที่อยู่ของข้อมูลบาร์โค้ดที่สนใจ

 

ขั้นที่ 4: ส่งออกผลลัพธ์ของการประมวลผล  

   ผลลัพธ์ที่ได้จากการรู้จำข้อมูล สามารถที่จะนำไปเข้าสู่กระบวนงา นอื่นๆ หรือ ส่งออกให้อยู่ในรูปแบบผลลัพธ์ต่างๆ ผู้พัฒนาสามารถควบคุมผลลัพธ์ของการ OCR ได้ทั้งหมด