13
ระบบ OCR สาหรับการจาแนกแบบฟอร์มอย่างอิสระ A system for OCR free identification of forms .. ศุภรัตน์ อภิวงศ์โสภณ บทคัดย่อ ระบบ OCR สาหรับการจาแนกแบบฟอร์มอย่างอิสระสามารถดาเนินการโดยอิสระจากการกาหนดโครงสร้างของ แบบฟอร์ม ฉะนั ้นระบบนี ้สามารถแยกประเภทการเติมแบบฟอร์มใด ๆ หรือสาหรับเอกสารที่ทราบรูปแบบการ อ้างอิงที่ยังไม่ถูกเติมข้อมูล อย่างไรก็ตามระบบการจาแนกแบบฟอร์มสามารถทาการแยกประเภทถูกทาโดยการหา สาเนาของคุณลักษณะส่วนของบรรทัดตัวอักษรของแต่ละรูปแบบที่อ้างถึงในการเติมแบบฟอร์ม Abstract A system for OCR free identification of forms can runs independently form any restrictions on form structure. Consequently, this system can classifies any type of filled form or document for which an empty reference pattern is known. However, the system for OCR free identification of forms can classification is done by searching counterparts of characteristic blocks of text lines of each reference pattern in the filed form. 1. แนะนา โดยปกติผู้อ่านแบบฟอร์มจะออกแบบเครื่อง อ่านแบบฟอร์มโดยเฉพาะสาหรับแต่ละอัน พัฒนา สาหรับแต่ละกระบวนการอัตโนมัติ การมองขอบเขต บริการความคาดหมายในคาสั่งตามเป้าหมายโดยตรง ของกระบวนการ ความแตกต่างของลายมือที่น่าสนใจ ทั ้งที่มันเห็นโดยปกติใช้ scanner ที่มองไม่เห็นสี เช่น ส้มหรือเขียว ส่วนใหญ่เอกสารยังคงพิมพ์ด้วยสีดา (หรือเทา) บนพื ้นสีขาว นอกจากนั ้นระดับการแยก ประเภทต่าง ๆ ตามปกติจะขึ ้นกับขอบเขตของ ประเภทเอกสาร มันแบ่งขอบเขตของแบบฟอร์ม เอกสารด้วยหลาย ๆ เอกสารก่อนพิมพ์ที่มีขอบเขต เหมือนกัน สาหรับตัวอย่างเช่น โปรแกรมใบประกัน ชีวิตเป็นเอกสารที่มีรูปแบบอิสระ เช่นจดหมายทาง ธุรกิจ ซึ ่งมีความซับซ้อนต่อการคาดเดาที่ตั ้งของ ขอบเขตที่น่าสนใจ การปรับปรุงระบบสู่การรับ เอกสารประเภทใหม่ใกล้เคียงเป็นไปไม่ได้ด้วยเหตุผล ที่ว่าความแตกต่างกันในแต่ละเงื่อนไขและรูปแบบ ของสิ่งที่นาเข้ามา การเปลี่ยนไปสู่ขอบเขตใหม่ไม่รวม การแลกเปลี่ยนข้อความ แต่โดยมากการจัดการแหล่ง ความรู้ที่ใช้เป็นเรื่องยุ่งยาก ขณะที่การออกแบบพัฒนาแบบเดิมสาหรับ ระบบการวิเคราะห์เอกสารในปีใกล้ ๆ นี ้ มี ประสิทธิภาพสูง เรารู้สึกต้องการระบบที่ก้าวสู่การ ยอมรับขอบเขตที่ต่างกันและการเปลี่ยนแปลงไป ในทางที่มันจะเรียนรู้เฉพาะเงื่อนไขแบบของประเภท เอกสารที่หลากหลายสาหรับการแยกประเภทในไม่ช้า นี ในทางอักษรศาสตร์ ตัวอย่างของผู้อ่าน แบบฟอร์ม Casey และ Ferguson มีแผนการสามอย่าง ในการจดจาแบบฟอร์ม แบบแรกง่ายต่อการจับคู่ ตัวเลขที่กาหนดขึ ้นของการเติมแบบฟอร์ม ถ ้ามันยังอยู

A system for OCR free identification of forms€¦ · อธิบายการแสดงแบบฟอร์มและแสดงวิธีการสร้าง

  • Upload
    hatuyen

  • View
    213

  • Download
    0

Embed Size (px)

Citation preview

ระบบ OCR ส าหรบการจ าแนกแบบฟอรมอยางอสระ A system for OCR free identification of forms

น.ส. ศภรตน อภวงศโสภณ

บทคดยอ

ระบบ OCR ส าหรบการจ าแนกแบบฟอรมอยางอสระสามารถด าเนนการโดยอสระจากการก าหนดโครงสรางของแบบฟอรม ฉะนนระบบนสามารถแยกประเภทการเตมแบบฟอรมใด ๆ หรอส าหรบเอกสารททราบรปแบบการอางองทยงไมถกเตมขอมล อยางไรกตามระบบการจ าแนกแบบฟอรมสามารถท าการแยกประเภทถกท าโดยการหาส าเนาของคณลกษณะสวนของบรรทดตวอกษรของแตละรปแบบทอางถงในการเตมแบบฟอรม

Abstract

A system for OCR free identification of forms can runs independently form any restrictions on form structure. Consequently, this system can classifies any type of filled form or document for which an empty reference pattern is known. However, the system for OCR free identification of forms can classification is done by searching counterparts of characteristic blocks of text lines of each reference pattern in the filed form.

1. แนะน า

โดยปกตผอานแบบฟอรมจะออกแบบเครองอานแบบฟอรมโดยเฉพาะส าหรบแตละอน พฒนาส าหรบแตละกระบวนการอตโนมต การมองขอบเขตบรการความคาดหมายในค าสงตามเปาหมายโดยตรงของกระบวนการ ความแตกตางของลายมอทนาสนใจ ทงทมนเหนโดยปกตใช scanner ทมองไมเหนส เชนสมหรอเขยว สวนใหญเอกสารยงคงพมพดวยสด า (หรอเทา) บนพนสขาว นอกจากนนระดบการแยกประเภทตาง ๆ ตามปกตจะขนกบขอบเขตของประเภทเอกสาร มนแบงขอบเขตของแบบฟอรมเอกสารดวยหลาย ๆ เอกสารกอนพมพทมขอบเขตเหมอนกน ส าหรบตวอยางเชน โปรแกรมใบประกนชวตเปนเอกสารทมรปแบบอสระ เชนจดหมายทางธรกจ ซงมความซบซอนตอการคาดเดาทต งของขอบเขตทนาสนใจ การปรบปรงระบบสการรบ

เอกสารประเภทใหมใกลเคยงเปนไปไมไดดวยเหตผลทวาความแตกตางกนในแตละเงอนไขและรปแบบของสงทน าเขามา การเปลยนไปสขอบเขตใหมไมรวมการแลกเปลยนขอความ แตโดยมากการจดการแหลงความรทใชเปนเรองยงยาก

ขณะทการออกแบบพฒนาแบบเดมส าหรบระบบกา รว เ ค ร า ะ ห เ อกสาร ใน ป ใกล ๆ น มประสทธภาพสง เรารสกตองการระบบทกาวสการยอมรบขอบเขตทตางกนและการเปลยนแปลงไปในทางทมนจะเรยนรเฉพาะเงอนไขแบบของประเภทเอกสารทหลากหลายส าหรบการแยกประเภทในไมชาน

ในทางอกษรศาสตร ตวอยางของผ อ านแบบฟอรม Casey และ Ferguson มแผนการสามอยางในการจดจ าแบบฟอรม แบบแรกงายตอการจบคตวเลขทก าหนดขนของการเตมแบบฟอรม ถามนยงอย

แบบ ทสองว ธการ พนฐานบนเสนแนวต งและแนวนอนของแตละแบบฟอรม ถามนอยและ แบบทสามใชขอมลของรปแบบส าหรบแยกความแตกตาง เชน สวนของขอความและบรรทดขอความ

ท งทวธการทหนงและสองใชประโยชนได พวกเขาตองการเงอนไขเฉพาะ ดงนนพวกเขาก าหนดโปรแกรมโดยใชว ธการทหนงจะเปนประโยชนมากกวา โดยเฉพาะถามตวเลขมาก ๆ ทเตมลงในเอกสาร เชนตวอยางของแบบฟอรมเลกนอยดวยตวเลขระบ วธการนถกตดสนโดยเสนขดในแนวตงใชเปนประโยชน ถาแบบฟอรมปรากฏอยางชดเจนและเฉพาะในขนสง Garris และ Grother ใชวธการน และ Ishitani ไดปรบปรงมนโดยเปรยบเทยบและคนหากลมของบรรทดทตอเชอมกน Ting etal และ Lam etal พฒนาสองลกษณะของแบบฟอรมทนาสนใจบนพนฐานของประเภทมมทเชอมตอกบเสนตามล าดบเพอแยกแบบฟอรมทถกเตมดวยการตดสนใจทคลายกน วธการทสามเปนวธทยากเพราะมนเปนไปไมไดทจะแยกขอมลลายมอออกจากขอมลแบบฟอรมตนฉบบจนกวาจะรประเภทของแบบฟอรม ท งทระบบการจ าแนกแบบฟอรม มวธการบนพนฐานตามแบบ เรามการพฒนาทางส าหรบขามปญหาน

รปท 1 แสดงสถาปตยกรรมของระบบการจ าแนก

แบบฟอรม รปท 2 ตวอยางของ empty forms (a-c) และสมพนธ

กบ fill forms (d-f) โดยหลกการระบบจะท างานโดยอสระจาก

ขอมลในตนฉบบใด ๆ เมอเทยบกบโครงสรางบรรทดในแบบฟอรมตนฉบบ แทนทจะใชขอมลรปแบบใหเปนประโยชนส าหรบการแยกประเภทในไมชา ตวอยางของแบบฟอรมกอนทจะมการเตมขอมลและ

เมอมการเตมขอมลลงในแบบฟอรมถกแสดงในรปท 2(a) ถง (f) ยงกวานนมนไมอยในประเภทแบบฟอรมเ ดยวกน แตตดสนประเภทแบบฟอรมหลาย ๆ ประเภทในเวลาเดยวกน

ระบบการจ าแนกแบบฟอรมประกอบดวย 4 องคประกอบหลก ๆ ดรปท 1 สวนประกอบการแบงรปแบบจะใหสวนของ

บรรทดขอความ สวนประกอบในการ เ รยน ร ถก เ ลอกให

สมพน ธ กบ ส วนโคร งส ร า งของแต ล ะแบบฟอรมตนฉบบส าหรบสรางแบบไวอางอง

พนฐานความรจะรวบรวมทกแบบอางอง การแยกสวนประกอบจะเปรยบเทยบการ

แสดงการเตมแบบฟอรมดวยแตละแบบอางองและการตด สนใจประ เภทของการ เ ตมแบบฟอรม กระดาษทมโครงสรางตามน : สวนทสอง

อธบายการแสดงแบบฟอรมและแสดงวธการสรางแบบอางองของแบบฟอรมทมการเตม ในสวนทสาม พนฐานของเกณฑในการแยกประเภทสวนประกอบจะถกแนะน าและอธบายดวยการใชตวอยาง สวนทเพมเตมผลการทดลอง พสจนการเขาถงอยางสมบรณ สวนทหนงสรปเอกสารและเคาโครงทจะกระท าตอในอนาคต 2. แสดงแบบฟอรมและการเรยนรแบบฟอรม

สวนนจะอธบายพนฐานความคดแรกของ ระบบการจ าแนกแบบฟอรม และอภปรายความตองการส าหรบการเรยนรและแยกประเภท

2.1 ความคดพนฐาน

เปาหมายของระบบการจ าแนกแบบฟอรม ตดสนประเภทของการเตมแบบฟอรมทไมร ส าหรบ

เปาหมายทเราจดเกบน าหนกโครงสรางทางกายภาพของทก ๆ แบบฟอรมทอาจจะจ าแบบทอางองในพนฐานความร หลงจาก scan แบบฟอรมทยงไมไดเตมดวยความละเอยด 300 dpi (dot per inch) แบบอางองจะถกสรางในสามขนตอน แบงบรรทดขอความ แบงกลมขอความ ตดสนคณลกษณะรปแบบ

ตอมาการจ าแนกเมอไมรจกแบบฟอรมทเตมแลวจะแสดงตอระบบการจ าแนกแบบฟอรม จะตดสนตามความเหมาะสมของส าเนาและใหชอแบบฟอรมหรอปฏเสธแบบฟอรมท เ ตมแลวน น ซงไม รจก (unknown)

ปญหาของลกษณะเฉพาะ เราไดมการอภปรายค าศพท ‚unknown‛ ในรายละเอยดทมากขน ในทนค าวา ‚unknown‛ หมายถงการพจารณาครงแรก เรารวาไมมอะไรแยกจากต าแหนงของ pixel สด าและสขาวในแบบฟอรมทเตมแลว นคอความแตกตางจากปญหาการแยกประเภทตามปกต เพราะเราไมรคณลกษณะของ Object ในการแยกประเภท ดงนนเราไมสามารถด าเนนการตอไปและเปรยบเทยบแบบฟอรมทไมรจากกลมของรปแบบอางอง

อยางไรกตามเพราะการแยกคณลกษณะส าหรบแตละรปแบบในพนฐานความรไดเปนทรจก เราทราบวาอะไรคอสงทเราคนหา ในทางเดยวกนระบบการจ าแนกแบบฟอรม ไดน าโครงสรางทางกายภาพของแตละรปแบบอางองและคนหาภายใตเงอนไขรปแบบทคลายคลงกบในแบบฟอรมทเตมแลว

2.2 การแสดงแบบฟอรม

บางคณลกษณะทส าคญของแบบฟอรมทเตมแลวและส าเนาทยงไมถกเตมอยบนพนฐานส าหรบการพจารณาของเรา : แตละ pixel สด าในแบบฟอรมทยงไมไดเตม

เปนสด าในการเตม 1 แบบฟอรมทเตมแลวประกอบดวย pixel สด า

มากมาย pixel สขาวในแบบฟอรมทเตมแลวเปนสขาว

ในแบบฟอรมทยงไมเตม ในทางความรสกส าหรบการแยกประเภท

อาจจะตรวจสอบจากความสมพนธเหลาน อยางไรกตามการกระท าจะถกตอง ถาแตละรปแบบฟอรมจะไมหมนเปลยนแปลง มนรบประกนวาแตละ pixel ในแบบฟอรมทย งไมถกเตมเหมอนกบ pixel ในแบบฟอรมทถกเตม

เหนไดชดเงอนไขนจะไมบรรลได ถาการ scan ท าสนสดอยางระมดระวง ในค าสงเพอหลกเหลยงความแตกตาง เราพจารณาเงอนไขของแบบดวยความรสกนอยทสดเพอกลาวถงปญหา ในขนตอนแรกเราเกบโครงสรางบรรทดขอความของแบบฟอรม นคอการสรางแบบอางองของแบบฟอรมทยงไมไดเตมบนพนฐานการแบงบรรทดขอความ

2.2.1 คณลกษณะบรรทดขอความ

โดยทวไปกลมของบรรทดขอความจะอยในต าแหนงทแยกกนอยางพอเพยงและไมก ากวมโดยอธบายแตละแบบฟอรมทไมถกเตม การยอมรบคอถาสองแบบฟอรมมโครงสรางบรรทดขอความทเหมอนกน อยางไรกตามความนาจะเปนส าหรบกรณทใกลกบศนย

ส าหรบการเปลยนแปลงไปสการแสดงบรรทด เราใชการแบงเขาใกล เรยกวา ‚LayEx‛ พฒนาท

DFKI โดยท LayEx ใหการแบงบรรทดขอความและมมทเอยงของรปเอกสาร

ส าหรบการแสดงเงอนไขแบบเฉพาะของแบบฟอรมทย งไมไดเ ตม โดยแยกตามกลมของบรรทด L = {l1 , l2 , … , li , … , lm} เราพจารณาสคณลกษณะของขอความแตละบรรทด li : ต าแหนงดานบน T(li) , ต าแหนงดานซาย L(li) , ขนาดในแนวตง ydim(li) และ ขนาดในแนวนอน xdim(li) รปท 3 แสดงความหมายของคณสมบตตางๆ

รปท 3 ความหมาย T(li), L(li), ydim(li) และ xdim(li) เงอนไขของระบบการจ าแนกแบบฟอรม ตอง

ประกอบดวยขอความหนงบรรทดและตองอยในทศทางเดยวกน เชน แนวนอน เพราะ LayEx ท างานอยางอสระจากทศทางของขอความ มนไมใหการแบงแบบทถกตองหลงจากหมน แตแบบดงเดมจะตดสนวาเ อยง เ งอนไขซงกลาวในขางตนท เ กยวของกบความหมายนหมายถงวาในกรณทอยในมมเดยวกนส าหรบแตละขอความทกบรรทด ดงนนคณสมบตสบรรทดใหคาทตรงกบมมเอยงตามทก าหนด

ปญหาอนเกดจาก Center Of Rotation (COR) จดศนยกลางการหมนเพราะไมถกตอง COR มอทธพลตอการเปลยนแปลงในแนวต ง และ/หรอ แนวนอนของแบบฟอรม ในค าสงเพอการหมนทถกตอง เราใชศนยกลางของหนาเพอลดความเปนไปไดมากทสดในการเปลยนแปลงเพราะ COR ไมถกตอง ในกรณทเกดขนจรง COR มระยะมากมสดใน

การสมมตจดศนยกลาง เชน ความจรง COR อยทขอบของหนา

การบนทก COR ไมถกตองมอทธพลตอคาของการเปลยนแปลงเพอรบการเทากนของแบบฟอรม สวนของการเฉไมมผลกระทบตอคณภาพของระบบการจ าแนกแบบฟอรม แตเพมคาความคลาดเคลอนส าหรบการยอมรบความเปลยนแปลง (ดหวขอยอยท 3.1) อยางไรกตามสมมตวามมเอยงถกตองและ COR เปนสวนประกอบ จดศนยกลางหนาไมจ าเปนทจะรบประกนวาไมมการเปลยนแปลง เชนแบบฟอรมเปลยนแปลงโดยปราศจากความเอยง

สมมตเรามโครงสรางแบบของทงแบบฟอรมทเตมและแบบฟอรมทไมถกเตมแลวเราสามารถระบสถานะทขนาดแนวตงของขอความแตละบรรทดในแบบฟอรมทถกเตมวามความยาวอยางนอยเทากบความยาวเดมในแบบฟอรมทไมถกเตม แบบนกเหมอนกนในแนวนอน

อยางไรกตามมสองปญหาหลกเพราะตวเลขทสงสดของบรรทด 1. มนท าใหล าบากในการหาบรรทดขอความใน

แบบฟอรม ท เ ตมแลว ท ตรงกบบรรทดขอความในแบบฟอรมทยงไมไดเตม

2. มน ย า กต อก า ร ระ บบ รรทด ขอ ค ว าม ทเกยวเนองกบการแยกประเภทของแบบฟอรมทเตมแลวในไมชา ในค าสงทจะแกปญหานเพอลดเวลาในการ

คนหา ภายหนาเราจะศกษาระดบกลมขอความ

2.2.2 การสรางกลมขอความและความสมพนธของกลมขอความ

ตอไปนเราต งเปาการคนหาทางทจะอธบายความสมพนธของกลมในล าดบการแสดงลกษณะ

พเศษทปรากฏในแบบฟอรมทไมไดเตม เรามการวเคราะหทเทยงตรงของการแบงบรรทดขอความในล าดบ cluster ภายในกลม ดงนนเราสมมตวาบรรทดขอความ lj,i ประกอบดวย 1 block bj = {lj,1 , lj,2 , … , lj,m} ถาเงอนไข 3 ประการขางลางนถกตอง ขอความทกบรรทด lj,i มขนาดตวอกษรเทากน ระยะหางระหวาง 2 บรรทดตดกนมคาเทากน ขอบเขตของขอความทกบรรทด L(lj,i) ของ

block bj เทากน บน ท กว า เ ง อนไข น ข นกบกลยท ธ ท ใ ช

algorithm ในการแบงเหมอนกน ในกรณของเราและในหลาย ๆ การเขาถงแบบอน ๆ เงอนไขนเปนเกณฑพนฐานส าหรบการแบง block และถกใชโดย FromClas เพอตดสนการแบง block ส าหรบเอกสาร ตวอยางรปภาพแสดงดงรปท 2(a) ถง (c) ท block ถกท าสญลกษณลกศรเอาไว

ผลลพธของแบบฟอรมเปลาทยงไดเตมถกแสดงโดยใชกลมของ blocks B = {b1, b2, …, bn} เนองจากความจรงไมทก block ท bj B มความสมพนธเดยวกนส าหรบแสดงแบบฟอรมวางเปลา เราแนบ block relevance value BRV(bj) คอคาความสมพนธของ block แตละ block โดยทคาของ BRV(bj) หมายถง คาความนาจะเปนคณลกษณะ bj อยางไรส าหรบแตละแบบฟอรม เชน ท าอยางไรใหถกตองแนนอนและไมก ากวม มนสามารถระบในการเตมตนฉบบ(ส าเนา)

อยางชดเจน คาขนกบความสมพนธของการประกอบบรรทดขอความ lj,1, lj,2, …, lj,m ดงนน BRV(bj) คอคารวมของความสมพนธของบรรทด LRV(lj,i) และตวเลข m ของบรรทดทประกอบ :

คาของแตละ LRV(lj,i) อยบนลกษณะพนฐาน

BRV b F m LRV lj j i

l j i

( ) ( , ( )),

,

( )1

3 ประการดงตอไปน :

แนวตงและแนวนอน xdim(lj,i) และ ydim(lj,i) ต าแหนงบนหนา L(lj,i) และ T(lj,i) เหมอนบรรทดอน lj,k โดยท k i ใน block

เดยวกน บนทกทง BRV(bj), LRV(lj,i) ถกก าหนดอย

ในชวง [0,1] บนทก LRV(lj,i) ของแตละบรรทดขอความ lj,i ตดสนใจโดยปราศจากการพจารณาการแบงคาไมใชขอความทมนประกอบดวย

เราให 2 ตวอยาง อธบายความคดหลกส าหรบค านวณ LRV(lj,i) ปราศจากความลกลบ ครงแรกเราสมมตวาบรรทดขอความ lj,i ในแบบฟอรมวางเปลา แนวต งใกลกบขนาดของความกวางของหนาม LRV(lj,i) ใกลกบ 1 นคอสงทเหนไดชดเพราะบรรทดนนเปนสวนทเหลอจากการไมเปลยนในแตละการเตมส าเนา

การเปรยบเทยบเพอใหเหนความแตกตาง บรรทดขอความ lj,i ประกอบดวยขนาดแนวตงเลก ๆ ในจดศนยกลางของหนาม LRV(lj,i) นอยเพราะในทกความนาจะเปน บรรทดนถกเปลยนโดยการเตมแบบฟอรมวางเปลา

ตลอดท งการทดลองของเรา พบวามนเพยงพอทจะพจารณามากทสด 10 block bj ซงมคา BRV(bj) มากทสด การเปรยบเทยบอยางงายของความเหมอนของการเตมแบบฟอรมตาง ๆ และ แบบฟอรมวาง คาของ BRV(bj) ถกแบงตามสวนทมการเปลยนแปลง โดยทคารวมของแบบฟอรมวาง = 1

ในรปท 2(a) ถง (c) คา 1 หรอ 2 ทถกก าหนดใหแตละ block คาแรกแสดงการค านวณ BRV ในขณะทคาทสองแสดงคาหลงจากแบงตามเสนต งฉาก

3. การจ าแนกแบบฟอรม

เ งอนไขทจ าเ ปนส าหรบความส าเ รจ เราตองการ algorithm ส าหรบการแบงทเหมอนกนใชส าหรบภาพของทงแบบฟอรมวางและแบบฟอรมทเ ตม แนใจวา เ งอนไข นท าใหระบบการจ าแนกแบบฟอรม แยกประเภทแบบฟอรมเตมบนพนฐานของคาความสมพนธทเกยวของ

ในหวขอนเราอธบายครงแรกในหวขอยอย 3.1 วาค านวณคาความนาจะเปนอยางไร block หนงทอยในประเดน bj ของแบบฟอรมวาง (EFi) จะประกอบดวยแบบฟอรมเตมทไมร (FF) การกระท าเหมอนกนส าหรบทก ๆ block ของ EFi และการรวมผลลพธ หนาท sim(EFi, FF) ตดสนใจการวดคาความเหมอนของ EFi (ขนกบการเปลยนแปลง) ไปสแบบฟอรม เ ตม ท ไ ม ร ผลลพ ธของ sim(EFi,FF) ส าหรบทกรปแบบอางอง ตามการเลอกแบบฟอรมวางดวยคาความเหมอนสงสด (EFbest) ส าหรบแบบฟอรมเตม เพอตดสนใจใชหรอไม EFbest ในส าเนาจรงของแบบฟอรมเตม เราแนะน าในหวขอยอย 3.2 terminal check tc(EFi,FF) ใชตรวจสอบ(ภายใตการพจารณาการเปลยนแปลง) ถาทกบรรทดของ EFbest มส าเนาในแบบฟอรมเตม ดงนนหวขอยอย 3.3 algorithm หลก การจดคแบบฟอรมทดทสด แสดงการอธบายการแยกสวนประกอบ (ดรปท 1) หวขอยอย 3.4 อธบายการค านวณทจะเปนส าหรบ algorithm หลก ตวอยางโปรแกรมและผลลพธในหวขอยอย 3.5 รวมท งในสวนน

3.1 ความเหมอนของ Block

การก าหนดความเหมอนกนของ block bj ใน empty form กบแตละ block b’

j,i ทนาจะเหมอนกนใน fill form จะถกนยามวาเปน block similarity bsim (bj,b

’j,i) โดยทวไป candidate block (block อนท

เหมอนตนฉบบ) เราจะพจารณาจาก block ของ empty form (1 < j << 10) และทกบรรทด l’

i ของ fill form ทไมร l‘ = {l’

1, l’2, … , l’

n} บนพนฐานนความตงใจของเราคอ สวนของบรรทดแบบฟอรมอยในล าดบการคนหา กลมทนาจะเปนไปไดของทางเลอก B’ = {b’

j,1, b’

j,2, … , b’j,m} บนส าเนา bj

โดยทวไปมนยากและไมรบประกนวางายตอการคนหาส าเนาของแตละบรรทด lj,i ของ block bj ใน fill form เพราะ ขนาดแนวนอนถกเปลยนรอยกด ผลลพธของการแบงอาจจะแตกตางหรอไมถก ภาพของ fill form อาจจะถกเปลยนทสวน

แบบอางอง (a) ตดสวนตาง ๆ ของ empty form (b) ตดสวนทไมรของ fill form

รปท 4 ตดสวนตาง ๆ ของสองแบบฟอรม

ดงนนสวนของบรรทดใน block candidate ท าใหยงยาก เพราะฉะนนเราหาแนวทางทละขนให fill form ในล าดบการคนหาส าเนาส าหรบแตละบรรทด lj,i ของ empty form การอธบายเราอางถงรปท 4 โดยทรปท 4(a) แสดงการตดสวนตาง ๆ ของ empty form

ซงประกอบดวย block bj ทม 4 บรรทด ในรปท 4(b) ตดทเดยวกนของ fill form ทไมรถกแสดงและบนทกในตวอยางน มนไมรถาท งตดจากอนหนงและชนดเดยวกนของแบบฟอรม

จดเรมตนส าหรบการคนหาส าเนาคอบรรทด lj,i ใน block bj ของ empty form ดวยพนทใหญทสด เราเรยก main line (mlj) mlj = lj,i | lj,i bj xdim(lj,i).ydim(lj,i) > xdim(lj,k).ydim(lj,k), k i (2)

เพราะฉะนนภาพของ fill form เปลยนทนาจะเปนไปได เรามการพจารณาวามนมหลาย ml’

j,i ใน fill form ทนาจะตรงกบ mlj ซงต งอยในระยะทางทแนนอนและจ ากดโดยจดเรมตน (เชนมมซายบน) จดเรมตนตองประกอบดวยความจรง 2 สวนคอ (1) การเปลยนทเพราะกระบวนการ scan ถาเรา

scan แบบฟอรมโดยเอามนออกและ scan มนอกครง ไมมใครสามารถแนใจไดวาทง 2 กรณแบบฟอรมจะอยทต าแหนงเดยวกนของพนท scan

(2) การเปลยนทเพราะ COR ผด ในการทดลองเราพบวาการเพมพนท scan ดวย

trans = 150 pixels (แนวนอนและแนวตง) จะท าใหพอเพยงตอการ capture แบบฟอรมทสมบรณ คาทนอยกวา trans จะท าใหแกปญหานไมได ในขณะทคาทมากกวา trans จะเพมความซบซอน ครงทสองยอมให scan = 5 pixel ท าใหเกดสวนทบกพรองของ scanner

ดงนนบรรทด l’k ใน fill form ถกใชเหมอน

main-line ml’j,i ถาตรงตามเงอนไขตอไปน

L(mlj) – trans – scann < L(l’k) <

L(mlj) + trans + scann

T(mlj) – trans – scann < T(l’k) <

T(mlj) + trans + scann ydim(mlj) – scann < ydim(l’

k) xdim(mlj) – scann < xdim(l’

k) อางถงรปท 4 ผลลพธของสอง main line ml’

j,i ดวยการเปลยนทในแนวตงของ vtrans(ml’

j,1, mlj) = 120 และ vtrans(ml’

j,2, mlj) = 45 pixels ส าหรบตวอยางงาย ๆ เราสมมตวามนไมมการเปลยนท

ในขนตอนถดมาสวนของ block b’j,i ตองสราง

ส าหรบแตละ main-line ml’j,i เพราะหนาสามารถ

เปลยนทเทานนและ/หรอหมนไดอยางสมบรณ การเปลยนทของแตละบรรทด b’

j,i ตองมคาเดยวกนกบ main line ml’

j,i (ดลกศรในรปท 4) อยางไรกตามการเฉเลกนอยตองยอมรบได เพราะมมทเอยงจะถกตองภายในขอบเขต 0.5 องศา จ าไดหรอไม block bj ในempty form ถกสรางอยางเดยว ถาบรรทดมขอบเขตดานซายเหมอนกน ดงนนจงยอมใหความแตกตางในการเปลยนทในแนวนอนและแนวตงของบรรทดในหนงและ block เดยวกน b’

j,i (hor และ vert) ขนกบความแตกตางของ top value T(lj,i) ใน bj hor และ vert ถกค านวณดวย 2 สมการตอไปนโดยใชการค านวณพนฐานทางตรโกณมต horj,i

= scann + [sin(1/2) . cos(1/2) .

| T(lj,i) - T(mlj)|] (3) vertj,i

= scann + [sin(1/2)2 . | T(lj,i) - T(mlj)|] (4)

ดงนนบรรทด l’k คอกลมส าเนาของบรรทด lj,i

ถาเงอนไข 4 ขอตอไปนส าเรจกคอมนตรงกบ l’k อน

ใดอนหนงมากทสด C1 (คา top)

T(lj,i) – vert j,i < T(l’

k) + vtrans(ml’j,i, mlj) <

T(lj,i) + vert j,i (5)

C2 (คา left) L(lj,i) – hor j,i

< L(l’k) + htrans(ml’

j,i, mlj) < T(lj,i)

+ hor j,i (6)

C3 (เพมเตมแนวตง) ydim(lj,i) – scann < ydim(l’

k) (7) C4 (เพมเตมแนวนอน)

xdim(lj,i) – scann < xdim(l’k) (8)

ในรปท 4 แสดงสองทางเลอกของส าเนา main line mlj

ml’j,1 = l’

1 และ ml’j,2 = l’

2 แสดงในตารางท 1 ความนาจะเปนส าหรบ

ml’j,2 เปนความจรงในส าเนาของ mlj สงกวาหรอ

เหมอน ml’j,1 เพราะมค lj,1, l’

k ตรงกบเงอนไข C1 ถง C4 ตารางท 1 block อน ๆ ส าหรบ block bj ของตวอยาง

bj b’j,1 b’

j,2 lj,3 ไมมส าเนา l’

1 lj,1 = mlj l’

1 l’2

lj,4 l’2 l’

3 lj,2 ไมมส าเนา l’

4

หลงจากการสราง block เรามการค านวณ block similarity bsim ของแตละ candidate block b’

j,i กบ block bj คาของ bsim ถกค านวณโดยความเหมอนกน lsim ของบรรทดทแสดงคาความนาจะเปนวา block bj บรรจใน fill form และอาจจะชดเจนในการรวมเฉพาะบรรทดทเหมอนกน

line similarity (lsim) ขนกบความแตกตางในบรรทดคกน เชนต าแหนงและขนาด โดยปราศจากการอธบายการค านวณคา lsim ตารางท 2 แสดงคาส าหรบตวอยางของรปท 4

ตารางท 2 บรรทดทเหมอนกน ส าหรบตวอยางใน รปท 4

l-sim l’1 l’

2 l’3 l’

4 l’5

l’j,3 0.67 ? ? ? ?

l’j,1 = mlj 0.7 0.9 ? ? ?

l’j,4 ? 0.3 0.5 ? ?

l’j,2 ? ? ? 0.8 ?

สงทไดจากเหตผลทตรงกนของแตละบรรทดใน block เราใหน าหนกคะแนนบรรทดทเหมอนกนดวยสวนของขนาดพนทของบรรทดทเหมอนกน lj,i :

ผลลพธของน าหนกส าหรบตวอยางของเราคอ

wj,1 = 0.41, wj,2 = 0.33, wj,3 = 0.17 และ wj,4 = 0.09 ดงนนความเหมอน bsim ของ b’

j,i ใน fill form กบ block bj คอการแสดงดวยสตรถดไป ในขณะทการตงชอ l’

k จากส าเนา lj,i (ดตารางท 1) ส าหรบตวอยางในรปท 4 การวดความเหมอน

ถกค านวณดงตอไปน bsim(bj,b

’j,1) = 0.41 * 0.67 + 0.33 * 0.99 +

0.17 * 0.50 + 0.09 * 0.80 = 0.72 bsim(bj,b

’j,2) = 0.41 * 0.70 + 0.33 * 0.30 +

0.17 * 0.00 + 0.09 * 0.00 = 0.38 เราอธบายวธการแสดงความเหมอนของ block

bj ของ empty form กบ block b’j,i ของ fill form การ

เปรยบเทยบ fill form ทงหมดดวยแบบอางองในพนฐานความรของแบบฟอรม คาความสมพนธ relevance value RV(bj) เหมอนกบการเปลยนในแนวตงและ

แนวนอน vtrans(b’j,i, bj) และ htrans(b

’j,i, bj) ตองไดจากท

พจารณา นคอสงตรงไปตรงมาเพราะ vtrans(b

’j,i, bj) = vtrans(ml’

j,i, mli) และ htrans(b

’j,i, bj) = htrans(ml’

j,i, mli) สงทไดจากคาสมพนธ RV(bj) = 0.17 จากรปท

4 คาทเกยวของส าหรบตวอยางสรปในตารางท 3

ตารางท 3 คาทส าคญของส าเนา block bj

block id j j id ของส าเนา 1 2

vtrans(b’j,i,bi) (ใน pixel) 120 45

htrans(b’j,i,bi) (ใน pixel) 0 0

bsim(bj,b’j,i) 0.06 0.12

พจารณาเฉพาะ block bj คาในตารางท 3 สถานะความเหมอนของ empty และ fill form ทดทสด ถา fill form ถกเปลยนทในแนวตง 45 pixel แตกระนนทก block candidate ตองเกบคาส าหรบการประมวลผลในภายหนา ส าหรบเปาหมายเราแนะน า block-translation-sets T0,120 = {b’

j,1} และ T0,45 = {b’

j,2}ดวยการ capture ทก block candidate ทคกบ block ของ empty form แตมการเปลยนทเหมอนกน มนเพมการจบค block candidate กบ block อนของ empty form และมการเปลยนทเหมอนกน

จนตนาการผลลพธของการคนหาส าเนา b’k,i

กบ block อน ๆ bk, k j ใหคาแสดงในตารางท 4

ตารางท 4 คาทส าคญของส าเนา bk

block id k k k id ของส าเนา 1 2 3

vtrans(b’k,i,bk) (ใน pixels) -134 120 58

jkj bl

kjkj

ijij

ijlylx

lylxw

,

)dim().dim(

)dim().dim(

,,

,,

,( )9

( )10bsim b b w lsim l lj j i j i j i k

l bj i j

( , ) . ( , )', , ,

'

,

htrans(b’k,i,bk) (ใน pixels) 44 0 45

bsim(bk,b’k,i) 0.06 0.11 0.02

แสดงวาการจบคของ b’k,2 และ b’

j,1 มคาเหมอนกนส าหรบ vtrans และ htrans หมายความวาความเหมอนระหวาง fill form และแบบอางองดทสด เชน bsim(bj,b

’j,1) + bsim(bk,b

’k,2) = 0.17 ถา fill form ถก

เปลยนในแนวตง 120 pixel ดงนนขณะนเราม 4 block-translation-sets T0,120 = {b’

j,1,b’k,2}, T0,45 = {b’

j,2}, T44,-134 = {b’k,1} และ

T45,58 = {b’k,3}

ตวอยางขางบนมการเปลยนแปลงทเหมอนกนใน T0,120 แนนอน เฉพาะกรณความคดทอย โดยทวไปมหลาย block ทมความแตกตางในการเปลยนทในแนวตงและแนวนอนเพยงเลกนอย ดงนนความเหมอนทรบไดส าหรบบรรทดใน block เราแนะน าการเปลยนทอยางกวาง ๆ และ ก าหนดการเปนสมาชกของ block ตอกลมการเปลยนท block ดงนนความเหมอนของแบบอางองของ empty form EF และ fill form FF ถกนยามดงตอไปน

แสดงวา fill form ถกแยกประเภท EFbest ถา sim(EFbest,FF) มคาสงสด เมอ fill form ส าหรบทไมม

ส าเนาอยจะถกปฏเสธ เราตองการอยางนอยคาเรมตนทเขาใกล simmin ซงตองเกนกวา sim(EFbest,FF) คาของ simmin ถกก าหนดในหวขอยอย 3.4

สวนเพมเตมเมอทดสอบระบบการจ าแนกแบบฟอรม เราพบวาความแตกตางของความเหมอนกนของแบบฟอรมโดยใชเฉพาะ similarity sim(EF,FF) เปนเรองยากในบางกรณ ตวอยางเชนสมมตวาม application สองแบบฟอรมและบรษทเดยวกน ซงมความคลายกนมาก ๆ เชนแบบฟอรมใบ

ประกนรถยนต EFcar และอน ๆ ส าหรบใบประกนชวต EFlife ตอมาสมมต EFcar อยในกลมของแบบอางอง ในขณะท EFlife ไมม แลวการแยกประเภทโดย function ความเหมอนอาจจะไมถกตอง เชน คาของ sim(EFcar,EFlife) มคาเกนกวาจะเขาใกล simmin ในล าดบการแกปญหาน เรามการแนะน าการตรวจสอบถอยค า

3.2 การตรวจสอบถอยค า (terminal check)

terminal check tc(EF,FF) ก าหนด EFbest เปนส าเนาของ fill form จรงหรอไม เรามค าอธบายในหวขอยอย 3.1 สวนทเพมเตม similarity sim(EFbest,FF) เราไดการเปลยนทแนวตงและแนวนอน vtrans และ htrans ของ fill form ในความสมพนธทตรงกบ EFbest ทงคาเปนประโยชนส าหรบการตรวจสอบถอยค า

ถา fill form เปนส าเนา EFbest จรงแลวแตละบรรทดบรรทด li ของ empty form อาจจะพบใน FF โดยพจารณาจากคาของ vtrans และ htrans ดงนนบรรทด l’

k ของ FF ถกยอมรบเปนส าเนาของบรรทด li ถาตามเงอนไข 4 ขอถกตอง (C1) : L(li) – scann < L(l’

k) – vtrans < L(li) + scann

(C2) : T(li) – scann < T(l’k) – htrans < T(li) + scann

(C3) : ydim(li) – scann < ydim(l’k)

(C4) : xdim(li) – scann < xdim(l’k)

ดงน นผลลพธของ function cp(li,FF) ซง ตดสน ถาบรรทด li มส าเนาใน fill form

1 l’k | l

’k และ li fit (C1) ถง (C4)

cp(li,FF) = (12) 0 กรณอน ๆ

sim EF FF bsim b b b Tj j i j i x y

i j

( , ) max ( , )|',

', ,

,

( )11

สงทไดจากสตรน เราก าหนดคาขอ tc(EF,FF) ดงเชนสวนรอยละของบรรทด li บรรจใน fill form โดย (n คอจ านวนของบรรทดใน EF)

ดงน น เรามการแนะน าค า เขาใกล simmin

ส าหรบความเหมอน เราใช tcmin อนอนดวย tc(EFbest,FF) ตองมากกวา

3.3 การจบคแบบฟอรมทดทสด

ทง function sim(EF,FF) และ tc(EF,FF) ถกใชส าหรบแยกประเภท fill form ทไมร algorithm Best Matching Form ก าหนดชนดของ fill form ถามส าเนาอยในกลมของ empty form และอน ๆ ถกปฏเสธ fill form วาไมร

Algorithm Best Matching Form ขอมลน าเขา (Input) : กลมของ n empty form

{EF1, EF2, … , EF, … , EFn} การแสดงแตละกลมของ block ดวยสวนทคาสมพนธกบ fill form FF แสดงโดยคณสมบตการแยกบรรทดขอความ (1) ค านวณแตละ EF มนเหมอนกบ

sim(EF,FF) กบ FF (2) ก าหนดการจบคทดทสด : EFbest

EFbest = EF | sim(EF, FF) > sim(EFq, FF) , q,( q)

(3) ถา sim(EFbest, FF) > simmin และ tc(EFbest,FF) > tcmin แลว RETURN (FF มชนด EFbest), STOP

(4) RETURN (ชนดของ FF ทไมรจก), STOP

3.4 การก าหนดจดเรมตน (Determination of Thresholds)

ส าหรบการด าเนนการของระบบการจ าแนกแบบฟอรม เรามการก าหนดคาเรมตน 2 คาคอ simmin และ tcmin เรางายในการน ากลมของ 10 empty form และใชการ เป ลยนแปลง ทนอย ท สดของ Best Matching Form algorithm โดยเฉพาะในขนตอนท 3 จะถกแทนทดวย

return (sim(EFbest, FF), tc(EFbest, FF)) นอกเหนอจากนนขนตอนท 4 จะถกเอาออก

ดงนนเราพยายามจ าแนก 25 ตวอยาง fill form ของ 10 empty form ในรปท 5 เสนปะแสดงคาของ sim(EFbest, FF) เสนจดแสดงครงท 2 จบคทดทสดของ empty form EFsecond ดวยชนด fill form ทแตกตาง หมายเหตในการทดสอบครงนเฉพาะ fill form ทแทนดวยส าเนา

empty จะถกพจารณา

รปท 5 sim(EF,FF) ขนกบ fill form FF

ขอสงเกตหลกสงแรกคอในทกกรณแทนคา EF ดวยคาความเหมอนมากทสด (EFbest) มชนดของ FF ดงนนการก าหนดชนดของ EFbest ส าหรบ FF ทไมรจกจะท างานยาวนานบน fill form ทมส าเนาในกลมของ empty form

tc EF FFcp l FF

n

ii

n

( , )( , )

1 )13(

ขอสงเกตขอสองคอ sim(EFsecond,FF14) > sim(EFbest,FF17) ดงน นจงยอมรบผลลพธของการก าหนดคา sim(EFbest,FF) วาเปนไปไมได ดงนนเราจงนยมคาทเขาใกล simmin = 0.2 เพราะถา sim(EF,FF) < 0.2 EF มชนดไมตรงกบ FF ดงนนการเรยกใหมอกครงจะไมลดลง

ส าหรบการคาดหมายอตราทสง เรามขอมลทเพมเตม ดงนน function tc(EF,FF) ถกแนะน าเพอก าหนดในทายทสด ถา EFbest เปนชนดของ FF จรง

ในขนตอนท 2 ระบบการจ าแนกแบบฟอรม ถกใชจ าแนกประเภท 50 fill form ครงแรกเราตรวจคา tc(EFcp, FF) ของ 25 fill form ดวยส าเนา EFbest = EFcp ในกลมแบบอางอง(เสนปะในรปท 6) ดงนน 25 fill form ปราศจากส าเนา EFbest = EFno-cp ถกทดสอบ ผลลพธคอ tc(EFno-cp, FF) ถกแสดงโดยเสนจดในรปท 6

เพราะ tc(EFcp, FF17) = 2 * tc(EFno-cp, FF14) เรางายในการใหความหมายคาทางคณตศาสตรส าหรบ tcmin เรมตนดวย 0.32 ทง simmin = 0.20 และ tcmin = 0.32 ถกใชใน Best Matching Form algorithm

รปท 6 tc(EF, FF) ขนกบ fill form FF

4. บทสรป

การจ าแนกประเภทถกท าโดยการคนหาส าเนาของ block bj ของ empty form ใน fill form ความ

ซบซอนของการคนหาส าเนา 1 block bj ขนกบจ านวนของบรรทดใน block และจ านวนนถกจ ากด เพราะจ านวนของ block.ในแบบอางองถกจ ากดถง 10 ความซบซอนของการจ าแนกคอ O(n) โดยท n คอจ านวนของ empty form ในการจ าแนกสวนประกอบใชเวลาจรง ๆ ไมถง 1 วนาทในการจ าแนก fill form การ run ทสมบรณรวมท งแบงสวนท งหมดใชเวลาเฉลย 35 วนาทส าหรบการจ าแนก

5. เอกสารอางอง

1. S.W.Lam, An Adaptive Approach to Document Classification and Understanding, Document Analysis Sytems, Kaiserslautern, Germany (Oct. 1997), pp.231-251.

2. R.G.Casey and D.R.Ferguson, Intelligent Forms Processing, IBM Systems Journal, Vol. 29, No.3, (1990), pp. 435-450

3. P.Suda and G.Marderlechner, How Can Document Analysis Help in Capturing Five Million Pages, Third Int’l International Conference on Document Analysis and Recognition, Montreal, Canada (Aug. 1995), pp. 372-377

4. M.D.Garris and P.J.Grother, Generalized Form Registration Using Structure Based Techniques, Symposium on Document Analysis and Information Retrieval, Las Vegas, Nevada (1996).

5. Y.Ishitani, Model Matching Based on Association Graph for Form Image Understanding, Third International Conference on Document Analysis and

Recognition, Montreal, Canada(Aug. 1995), pp. 287-292

6. A.Ting, M.K. Leung, Siu-Cheng Hui and Kai-Yun Chan, A Syntactic Business Form Classifier, Third Int’l International Conference on Document Analysis and Recognition, Montreal, Canada(Aug. 1995), pp. 301-304

7. S.W.Lam, L.Javanbakht and S.N.Srihari, Anatomy of a Form Reader, Second Int’l Conference on Document Analysis and Recognition, Tokyo, Japan (Oct. 1993), pp. 506-509

8. F.Hones and J.Lichter, Layout Extraction of Mixed-Mode Documents, Machine Vision & Applications, Springer Verlag (19994), pp. 237-246

9. F.Cesarini, M.Gori, S.Marinai and G.Soda, A System for Extracting Data from Forms of Known Class, Third International Conference on Document Analysis and Recognition, Montreal, Canada(Aug. 1995), pp. 1136-1140