7
บทความวิจัย บทความวิจัย 1 วารสารเทคโนโลยีสารสนเทศ ปีที ่ 10 ฉบับที ่ 1 มกราคม - มิถุนายน 2557 Vol. 10, No. 1, January - June 2014 Information Technology Journal การใช้งานได้และความปลอดภัยของดอทแคปท์ช่า Usability and Security of Dot Captcha บทคัดย่อ งานวิจัยนี้เสนอแนวคิดการสร้างดอทแคปท์ช่า (Dot Captcha) ซึ่งเป็นแคปท์ช่าแบบตัวอักษร โดยได้นำาแนวคิด Gestalt Theory มาใช้ร่วมในการออกแบบเพื่อให้ได้แคปท์ช่า ที่มนุษย์เข้าใจได้ง่ายในขณะที่ยากต่อการถูกตรวจจับจาก โปรแกรมอัตโนมัติหรือบอท (Bot) ดอทแคปท์ช่าได้ถูกนำา มาทดลองเปรียบเทียบกับรีแคปท์ช่า และไมโครซอฟต์ แคปท์ช่า กับผู้เข้าร่วมทดลองจำานวน 10 คน ผลลัพธ์ทาง ด้านการใช้งานได้ (Usability) ผู้เข้าร่วมทดลองสามารถทำา แบบทดสอบดอทแคปท์ช่าได้ถูกต้องมากที่สุด โดยผิดพลาด เพียง 5 ครั้งเท่านั้น จากการทดลองทั้งหมด 50 ครั้ง ส่วน ผลลัพธ์ในการทดสอบความทนทาน (Robustness) ต่อการ ถูกตรวจจับของดอทแคปท์ช่าด้วย OCR แสดงให้เห็นว่า ดอทแคปท์ช่ามีความทนทานสูง เพราะไม่มีดอทแคปท์ช่า ถูกจับได้ด้วย OCR ที่ใช้ทดสอบได้เลย คำ�สำ�คัญ: แคปท์ช่า แคปช่าท์ตัวอักษร การใช้งานได้ ความทนทาน Abstract This research proposed a new text-based CATPCHA, called Dot CAPTCHA which was designed based upon the Gastalt Theory in order to create the CAPTCHA which was simple for users to understand and hard to automatic programs or BOTs to detect. Dot CAPTCHAs were tested against with Recaptcha and Microsoft CAPTCHA with 10 participants. The result of usability was that participants were able to identify Dot CAPTCHA most accurately and made only five errors in 50 tests. The result regarding the robustness of Dot พงศ์ธร แพมณี (Pongthorn Paemanee)* และ ณัฐธนนท์ หงส์วริทธิ์ธร (Nuttanont Hongwarittorrn)* CAPTCHA by being tested against three OCR showed that Dot CAPTCHAs were very robust since there were no characters that could be detected by those OCRs. Keyword: Captcha, Text Captcha, Usability, Robustness. 1. บทนำา การสร้างแคปท์ช่า (CAPTCHA) ในปัจจุบันมีมากมาย หลากหลายรูปแบบ โดยจุดมุ่งหมายสำาคัญของการนำาไปใช้ ก็คือการป้องกันความปลอดภัยของระบบจากบอท แต่การ พยายามเพิ่มความทนทาน (Robustness) ให้สูงขึ้นอาจทำาให้ ส่งผลกระทบต่อการใช้งานได้ (Usability) ของมนุษย์ ดังนั้น ผู้ใช้บางคนอาจรู้สึกไม่ดีต่อการเข้าใช้งานของระบบที่มีแบบ ทดสอบแคปท์ช่าที่ยาก ในงานวิจัยนี้ ผู้วิจัยได้สร้างดอทแคปท์ช่า (Dot Captcha) ขึ้นมีรูปแบบเป็นแคปท์ช่าตัวอักษร ซึ่งเป็นที่นิยมตาม เว็บไซต์ทั่วไป ผู้ใช้หลายคนจะพบเห็นและคุ้นเคยมากกว่า แคปท์ช่าแบบอื่นๆ และผู้ใช้สามารถใช้งานได้โดยง่ายกว่า แต่แคปท์ช่าตัวอักษร เป็นรูปแบบที่มีความทนทานได้ไม่สูง มากนักเนื่องจากเป็นแคปท์ช่าที่เข้าใจได้ง่ายทั้งต่อมนุษย์ และบอท เทคโนโลยีการรู้จำาอักขระทางภาพหรือโอซีอาร์ (Optical Character Recognition: OCR) [1] มีความก้าวหน้า ไปมาก ทำาให้แคปท์ช่าตัวอักษรมีโอกาสที่จะถูกตรวจจับจาก โปรแกรมได้ง่าย ดังนั้น ผู้วิจัยจึงมีการนำาแนวคิดของ Gestalt Theory [2] มาเพิ่มประสิทธิภาพความทนทานให้กับ แคปท์ช่าตัวอักษร โดยที่ยังคงการใช้งานที่ง่ายต่อมนุษย์อยูOCR คือ กระบวนการทางกลไกหรือทางอิเล็กทรอนิกส์ เพื่อแปลภาพของข้อความจากการเขียนหรือจากการพิมพ์ ไปเป็นข้อความที่สามารถแก้ไขได้โดยเครื่องคอมพิวเตอร์ * ภาควิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์และเทคโนโลยี มหาวิทยาลัยธรรมศาสตร์

Usability and Security of Dot Captcha · ป ท 10 ฉบ บท 1 มกราคม - ม ถ นายน 2557 วารสารเทคโนโลย สารสนเทศ3

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Usability and Security of Dot Captcha · ป ท 10 ฉบ บท 1 มกราคม - ม ถ นายน 2557 วารสารเทคโนโลย สารสนเทศ3

บทความวจยบทความวจย

1วารสารเทคโนโลยสารสนเทศปท 10 ฉบบท 1 มกราคม - มถนายน 2557Vol. 10, No. 1, January - June 2014 Information Technology Journal

การใชงานไดและความปลอดภยของดอทแคปทชาUsability and Security of Dot Captcha

บทคดยอ

งานวจยนเสนอแนวคดการสรางดอทแคปทชา (Dot

Captcha) ซงเปนแคปทชาแบบตวอกษร โดยไดนำาแนวคด

Gestalt Theoryมาใชรวมในการออกแบบเพอใหไดแคปทชา

ทมนษยเขาใจไดงายในขณะทยากตอการถกตรวจจบจาก

โปรแกรมอตโนมตหรอบอท (Bot) ดอทแคปทชาไดถกนำา

มาทดลองเปรยบเทยบกบรแคปทชา และไมโครซอฟต

แคปทชา กบผเขารวมทดลองจำานวน 10 คน ผลลพธทาง

ดานการใชงานได (Usability) ผเขารวมทดลองสามารถทำา

แบบทดสอบดอทแคปทชาไดถกตองมากทสดโดยผดพลาด

เพยง5ครงเทานนจากการทดลองทงหมด50ครงสวน

ผลลพธในการทดสอบความทนทาน (Robustness) ตอการ

ถกตรวจจบของดอทแคปทชาดวยOCR แสดงใหเหนวา

ดอทแคปทชามความทนทานสง เพราะไมมดอทแคปทชา

ถกจบไดดวยOCRทใชทดสอบไดเลย

คำ�สำ�คญ: แคปทชา แคปชาทตวอกษร การใชงานได

ความทนทาน

Abstract

This research proposed a new text-based CATPCHA,

called Dot CAPTCHA which was designed based upon the

Gastalt Theory in order to create the CAPTCHA which was

simple for users to understand and hard to automatic programs

or BOTs to detect. Dot CAPTCHAs were tested against with

Recaptcha and Microsoft CAPTCHA with 10 participants.

The result of usability was that participants were able to

identify Dot CAPTCHA most accurately and made only five

errors in 50 tests. The result regarding the robustness of Dot

พงศธรแพมณ(Pongthorn Paemanee)*และณฐธนนท หงสวรทธธร (Nuttanont Hongwarittorrn)*

CAPTCHA by being tested against three OCR showed that

Dot CAPTCHAs were very robust since there were no

characters that could be detected by those OCRs.

Keyword: Captcha, Text Captcha, Usability, Robustness.

1. บทนำา

การสรางแคปทชา (CAPTCHA) ในปจจบนมมากมาย

หลากหลายรปแบบโดยจดมงหมายสำาคญของการนำาไปใช

กคอการปองกนความปลอดภยของระบบจากบอท แตการ

พยายามเพมความทนทาน(Robustness) ใหสงขนอาจทำาให

สงผลกระทบตอการใชงานได(Usability)ของมนษยดงนน

ผใชบางคนอาจรสกไมดตอการเขาใชงานของระบบทมแบบ

ทดสอบแคปทชาทยาก

ในงานวจยนผวจยไดสรางดอทแคปทชา(Dot Captcha)

ขนมรปแบบเปนแคปทชาตวอกษร ซงเปนทนยมตาม

เวบไซตทวไป ผใชหลายคนจะพบเหนและคนเคยมากกวา

แคปทชาแบบอนๆ และผใชสามารถใชงานไดโดยงายกวา

แตแคปทชาตวอกษรเปนรปแบบทมความทนทานไดไมสง

มากนกเนองจากเปนแคปทชาทเขาใจไดงายทงตอมนษย

และบอท เทคโนโลยการรจำาอกขระทางภาพหรอโอซอาร

(Optical Character Recognition: OCR) [1]มความกาวหนา

ไปมากทำาใหแคปทชาตวอกษรมโอกาสทจะถกตรวจจบจาก

โปรแกรมไดงาย ดงนน ผวจยจงมการนำาแนวคดของ

Gestalt Theory [2]มาเพมประสทธภาพความทนทานใหกบ

แคปทชาตวอกษรโดยทยงคงการใชงานทงายตอมนษยอย

OCR คอ กระบวนการทางกลไกหรอทางอเลกทรอนกส

เพอแปลภาพของขอความจากการเขยนหรอจากการพมพ

ไปเปนขอความทสามารถแกไขไดโดยเครองคอมพวเตอร

* ภาควชาวทยาการคอมพวเตอร คณะวทยาศาสตรและเทคโนโลย มหาวทยาลยธรรมศาสตร

Page 2: Usability and Security of Dot Captcha · ป ท 10 ฉบ บท 1 มกราคม - ม ถ นายน 2557 วารสารเทคโนโลย สารสนเทศ3

2 ว�รส�รเทคโนโลยส�รสนเทศ ปท 10 ฉบบท 1 มกราคม - มถนายน 2557Vol. 10, No. 1, January - June 2014Information Technology Journal

บทความวจย : การใชงานไดและความปลอดภยของดอทแคปทชา

และดวยความสามารถและหลกการทำางานของOCRทำาให

กลมคนบางกลมไดนำาความสามารถนมาใชเพอชวยในการ

ตรวจจบการปองกนของเวบไซตทไดใชแคปทชาตวอกษร

เพอหาขอความทถกตองจากการอานรปภาพแคปทชา

Gestalt Theoryเปนทฤษฎการรบรความเขาใจของมนษย

ทมลกษณะเปนเชงนามธรรม ไมมรปแบบทชดเจนแนนอน

มนษยจะเรยนรจากสงเราทเปนสวนรวมไดดกวาสวนยอยซง

หลกการจดระบบการรบรทสำาคญของGestalt Theory เชน

กฎของความใกลชด (Proximity) กฎของความคลายคลง

(Similarity)กฎของความตอเนอง(Continuity)กฎของการ

ตอเตมใหสมบรณ (Closure) มสวนชวยใหดอทแคปทชา

สามารถเพมความทนทานไดมากขนโดยทการใชงานได

สำาหรบมนษยไมสญเสยไปมากเหตผลหลกกคอการขาดหาย

ไปบางสวนของตวอกษรแตยงคงโครงสรางตวอกษรในภาพ

รวมไวได ทำาใหมนษยสามารถทจะรบรและเขาใจตวอกษร

เหลานนไดไมตางจากเดม ในทางกลบกนคอมพวเตอรจะ

มองในเชงลกลงไปอยางละเอยดทำาใหสามารถรบรรายละเอยด

ไดอยางชดเจนแตไมสามารถทจะเขาใจในภาพรวมไดวาสง

นนคออะไร และในสวนของหลกการภาพและพนหลง

(Figure-Ground) จะชวยใหการออกแบบดอทแคปทชาม

ความปลอดภยสงขนเพราะใชสเพยง2สนนคอสขาวและ

สดำา ดงนนหากบอททำาการตรวจจบดอทแคปทชาโดยมอง

สดำาเปนภาพและสขาวเปนพนหลงไมสำาเรจ กเปนไปไดวา

บอทจะกลบการทำางานเปนตรงกนขามเพอหาผลลพธใหม

โดยมองสขาวเปนภาพและสดำาเปนพนหลงแทน ซงการ

ตรวจจบในลกษณะนจงเปนเรองยากตอบอท แตสำาหรบ

มนษยกยงสามารถทอานขอความนนไดโดยไมยาก ดงนน

ดอทแคปทชาถกออกแบบมาใหมความทนทาน และการใช

งานไดทดไมแตกตางกนแมวาจะใชสดำาเปนภาพสขาวเปน

พนหลงหรอสดำาเปนพนหลงสขาวเปนภาพกตาม

2. งานวจยทเกยวของ

Ahmad Salah El Ahmad และคณะ [3] ทำาการทดสอบ

ประสทธภาพความทนทานของแคปทชาตวอกษรในเวบไซต

Megaupload โดยใชการโจมตดวยกระบวนการ Segmentation

เปนสวนสำาคญ กระบวนการนจะแยกชนสวนของภาพตว

อกษรในแคปทชาซงมลกษณะเปนตวอกษรทซอนทบกน

โดยจะแยกเปนชนสวนทมพนทซอนทบกน และชนสวนทไม

เปนสวนซอนทบ จากนนจะนำาชนสวนทมความสมพนธกน

มาหาจดเชอมตอเพอทำาการประกอบกลบเปนตวอกษรปกต

โดยมอตราความสำาเรจ 82%

ขอสงเกตทนาสนใจของแคปทชาใน Megaupload คอ

การใชจำานวนตวอกษรคงทและมเพยง 4 ตวอกษรเทานน

ทำาใหมโอกาสทจะถกคาดเดาไดงาย และการซอนทบกนของ

ตวอกษรนนยงคงมเสนขอบเขตของตวอกษรอย ทำาใหบอท

สามารถทจะรบรรปทรงลกษณะขอบเขตของตวอกษรได

Ahmad Salah El Ahmad และคณะ [4] ทำาการทดสอบ

ประสทธภาพความทนทานของแคปทชาตวอกษร เวบไซต

ทอยภายใตบรษท Google ซ งยงคงใชกระบวนการ

Segmentation เปนสวนสำาคญ แตไดมการปรบปรงเพมเตม

โดยแบงขนตอนการทำางานเปน 3 ระดบ ขนตอนแรกจะ

ทำาการแปลงภาพใหเหลอเพยง 2 ส คอสของภาพสงทสนใจ

กบสของพนหลง ทำาการขจดสงรบกวนขนาดเลกทไมม

โอกาสเปนตวอกษรไดออก โดยแปลงใหเปนสเดยวกนกบ

พนหลง และการใช Zhangs’ Algorithm ทำาใหความหนาของ

พกเซลรปภาพตวอกษรลดลงเหลอเพยง 1 พกเซล ความ

ซบซอนของรปภาพกจะลดนอยลง กระบวนการกำาหนด

คณลกษณะรปทรงตวอกษรในขนตอนทสองกจะทำาไดงาย

ขน ซงในขนตอนนจะทำาการแบงกลมตวอกษรเพอหาวาม

ตวอกษรอยกตว ตรงไหนบาง เปนตวอกษรประเภทใด แบง

เปน 4 กลมคอ Dot Shape เปนลกษณะตวอกษรทมจดอย

ดานบน (เชน i, j) Loop Shape เปนลกษณะตวอกษรทม

ชองวางอยตรงกลาง (เชน A, e, O) Cross Shape เปนลกษณะ

ตวอกษรทมเครองหมายบวกอยดานบนตวอกษร (เชน t)

S Shape เปนลกษณะตวอกษรทมความหนาแนนในแนวตง

(เชน S) ในขนตอนสดทายกจะใชผลลพธจากขนตอน

กอนหนา ระบลกษณะโครงสรางของตวอกษรแตละกลมเพอ

ใชทำาการกำาหนดตำาแหนงทจะทำาการตดแบงสวนตวอกษร

แตละตวออกจากกน โดยมอตราความสำาเรจ 68%

ขอสงเกตทนาสนใจของแคปทชา ใน Google คอ แคปทชา

จะถกทำาใหเหลอเพยง 2 สเทานน โดยสดำาเปนสงทเราสนใจ

และสขาวคอพนหลง ดงนนการใชสทหลากหลายเกนไปกไม

เปนประโยชนตอการปองกนจากบอท เสนหรอสงรบกวน

ตางๆ ทมขนาดเลกเกนกวาจะเปนตวอกษรได จะถกทำาการ

ลบออก และในขนตอนการแบงกลมประเภทตวอกษรเปน

ขนตอนสำาคญทเพมเขามา ทำาใหสามารถระบลกษณะ

Page 3: Usability and Security of Dot Captcha · ป ท 10 ฉบ บท 1 มกราคม - ม ถ นายน 2557 วารสารเทคโนโลย สารสนเทศ3

3วารสารเทคโนโลยสารสนเทศปท 10 ฉบบท 1 มกราคม - มถนายน 2557Vol. 10, No. 1, January - June 2014 Information Technology Journal

บทความวจย : การใชงานไดและความปลอดภยของดอทแคปทชา

โครงสรางของตวอกษรแตละแบบ และทำาการตดแยกออก

มาเปนตวอกษรแตละตวได แมวาตวอกษรของแคปทชาใน

Google จะมลกษณะเปนตวอกษรเอยงและอยชดตดกนกตาม

Recaptcha [5] พฒนาขนโดย Luis von Ahn ผใหกำาเนด

แคปทชาทมใชกนอยางกวางขวางในปจจบน และถกซอไป

ในป 2009 โดย Google จดมงหมายสำาคญของรแคปทชา

นอกจากปองกนเวบไซตจากบอทแลว ยงมสวนชวยในการ

แปลเอกสารตางๆ ทถกสแกนเขามาเปนขอมลรปภาพใน

คอมพวเตอร ซง Ahmad Salah El Ahmad และคณะ อาศย

กระบวนการเชนเดมในการตรวจจบรแคปทชา แตได

ปรบปรงกระบวนการเพมเตมสำาหรบกลมของขอความทไม

สามารถระบแยกตวอกษรออกมาอยางชดเจนได ดวยการใช

ชวงความกวางของตวอกษรแตละตว ทมขนาดคงทเกอบจะ

เทากนชวยในการแบงตวอกษรแตละตวออกมา โดยมอตรา

ความสำาเรจ 46%

ขอสงเกตทนาสนใจของแคปทชาใน รแคปทชา คอ การ

ใชชดตวอกษรทมหมายเลขและสญลกษณอนๆ รวมอยดวย

และภาพตวอกษรทใชไดจากการสแกนหนงสอเกาๆ เขามา

เปนไฟลรปภาพในคอมพวเตอร ทำาใหรแคปทชามความ

ทนทานทสงขน แตนนกทำาใหการใชงานไดตอมนษยกลดตำา

ลงดวย รวมถงการแบงภาพแคปทชาออกเปนสองสวน และ

ขอความในรแคปทชาบางคำามขนาดทยาวมาก อาจสราง

ความสบสนและการใชงานทยากตอมนษยได แตอยางไร

กตาม รแคปทชา กมคำาโดยสวนใหญเปนคำาทมความหมาย

ตามพจนานกรม รวมถงการตอบแบบทดสอบของรแคปทชา

ไมจำาเปนตองทำาถกตองทงหมดครบทกตวอกษรกได

เปนการเพมการใชงานไดตอมนษยในขณะทความทนทานก

ลดตำาลง

Cody Sutherland [6] ไดพจารณาและกลาวสรปโดยรวม

ถงขอดขอเสยของคณลกษณะในแคปทชาตวอกษรทควรนำา

มาปรบใชเพอใหเกดประสทธภาพสงสดของแคปทชาตวอกษร

เกษรนทร และ วรพล [7] สราง Thai CAPTCHA ซงใช

ตวอกษรทเปนภาษาไทยรวมถงกระบวนการทาง Semantic

วธการ คอ สมตวเลขขนมาแลวแปลงเปนขอความภาษาไทย

โดยคำาตอบทถกตอง คอ การคำานวณตวเลขทแสดงออกมา

ในรปแบบขอความ ซงเปาหมายหลกของการปองกนคอ

บอทจากภายนอกประเทศทไมสามารถเขาใจรปแบบภาษา

ไทย แตนนกจะทำาใหการใชงานไดถกจำากดเพยงผใชทร

ภาษาไทยเทานน

Elie Bursztein และคณะ [8] ทำาการวเคราะหความทนทาน

และจดออนของแคปทชา จำานวน 15 รปแบบทพบเหนตาม

Internet ผลการทดสอบสามารถทจะรบรแคปทชาไดเกอบ

ทกรปแบบ โดยท 7 ใน 15 รปแบบสามารถทจะรบรไดทนท

โดยไมตองทำาการปรบปรงอลกอรธมใดๆ เพมเตม ยกเวน

Google แคปทชา และรแคปทชา ทไมสามารถตรวจจบได

3. ก�รสร�งดอทแคปทช�

การสรางดอทแคปทชา อาศยหลกทฤษฎของ Gestalt

เปนสวนสำาคญในการนำามาตอตานกลไกการตรวจจบตว

อกษร โดยการทำาใหตวอกษรไมสมบรณ แตยงคงสภาพ

โดยรวมของตวอกษรอย ทำาใหมนษยยงพอรบรและเขาใจได

แตจะยากตอการตรวจจบของบอท รวมถงอาศยกลไกการสม

เขามาชวยในหลากหลายรปแบบ เชน ขนาด ระยะหาง หรอ

จำานวนซงทำาใหบอทตรวจจบและคาดเดาไดยากในการรบร

รปรางและขอบเขตทแนนอน

3.1 ดอทแคปทช�โดยทฤษฎของ Gestalt

สรางตวอกษรสดำาขนมาเขยนลงบนพนหลงสขาว จากนน

สรางวงกลมสขาว เขยนลงบนตวอกษรในลกษณะสลบไป

สลบมา เพอใหเกดเปนรอยเวาแหวงขาดหายไปบางสวนของ

ตวอกษร สของวงกลมจะเปนสเดยวกนกบพนหลงทำาใหภาพ

สวนทขาดหายกลมกลนไปกบพนหลง ซงวงกลมเปนรปทรง

ทหาเหลยมหามมหาขอบเขตไดยากกวารปทรงอนๆ

การเรยงลำาดบการสรางดอทแคปทชา โดยเรมดวยการ

กำาหนดสพนหลง ตามดวยการสรางขอความตวอกษรใหเปน

คนละสกบพนหลง และสดทายสรางวงกลมทมสเดยวกนกบ

พนหลงทบลงบนตวอกษร จะทำาใหการพลกกลบสกน

ระหวางตวอกษรและพนหลง แสดงผลออกมาไมแตกตางกน

มากและยงคงความทนทานตอการถกตรวจจบตวอกษรได

ดงภาพท 1

ภาพท 1 ผลลพธการกลบคาสกนระหวางสขาวและสดำา

Page 4: Usability and Security of Dot Captcha · ป ท 10 ฉบ บท 1 มกราคม - ม ถ นายน 2557 วารสารเทคโนโลย สารสนเทศ3

4 ว�รส�รเทคโนโลยส�รสนเทศ ปท 10 ฉบบท 1 มกราคม - มถนายน 2557Vol. 10, No. 1, January - June 2014Information Technology Journal

บทความวจย : การใชงานไดและความปลอดภยของดอทแคปทชา

3.2 การสม

กลไกการสมเปนกระบวนการสรางรปแบบทจะทำาใหบอท

คาดเดาไดยาก โดยการสมจะมการแทรกในกระบวนการ

สรางดอทแคปทชาในหลากหลายรปแบบ เชน ตวอกษรทนำา

มาแสดง ขนาดตวอกษร จำานวนตวอกษร ตำาแหนงตวอกษร

ขนาด และตำาแหนงของวงกลมทใชในการลบบางสวนของ

ตวอกษรออก รปแบบ ขนาด และตำาแหนงของสงรบกวน

ตวอกษรทใชจะมตงแต a-z, A-Z, 0-9 แตจะงดเวนตวอกษร

บางตวทมความคลายคลงกนเพอประโยชนในการปรบแตง

ตวอกษรอนๆ ทจะสามารถทำาไดเพมมากขนนนคอ I, O, Q,

f, i, j, l, o, r, t, 1, 0 ซงตวอกษรเหลานหากถกปรบแตงมาก

เกนไปอาจทำาใหผใชบางคนแยกแยะไมออกกบตวอกษรท

ใกลเคยงกน

การใชสงรบกวนจะใหมการแสดงผลเพยงสวนดานบน

หรอดานลางของดอทแคปทชาเทานน เพอไมใหเกดการปด

ทบหรอปะปนกบตวอกษรจนเกดเปนลกษณะทผดแปลกไป

จากเดมจนผใชงานเกดการเขาใจผดได และรปแบบของสง

รบกวนจะหลกเลยงลกษณะทคลายตวอกษร ซงการสรางสง

รบกวนขนมาเพอสรางความสบสนใหกบบอท จากการทตว

อกษรในดอทแคปทชาถกลบออกไปบางสวนทำาเกดเปนกลม

ของพกเซล (Pixel) ขนาดเลก จะทำาใหสงรบกวนไมถกตด

ออกไปจากการทำางานของบอทดวยการวเคราะหหาปรมาณ

ของกลมพกเซลทมขนาดเลก เนองดวยตวอกษรในดอท

แคปทชาบางตวกมสวนประกอบของกลมพกเซลขนาดเลก

ดวยเชนกน

4. การดำาเนนการทดสอบ

การทดลองใชปจจยควบคมคอรปแบบแคปทชาทม

ทงหมด 3 รปแบบ ไดแก ดอทแคปทชา รแคปทชา และ

ไมโครซอฟตแคปทชา ผทดลอง 1 คนจะทำาทกรปแบบบน

หนาเวบไซตทสรางขนมาโดยเรมจาก ดอทแคปทชา 5 ภาพ

รแคปทชา 5 ภาพ และ ไมโครซอฟตแคปทชา 5 ภาพ ตาม

ลำาดบ ซงแตละรปแบบจะแสดงรปภาพขนมาทละภาพ และ

จะเปลยนไปภาพถดไปเมอผทดลองกดยนยนคำาตอบ โดย

ทำาจนครบทง 5 ภาพ และทำาการบนทกเวลาโดยอตโนมต

ทนท โดยนบเวลาเรมตนตงแตรปภาพของแคปทชาแสดง

ขนมาเรยบรอย และสนสดทนทหลงจากกดยนยนคำาตอบ

จำานวนผทดลองทงหมด 10 คนแบงเปนเพศชาย 4 คน

หญง 6 คน โดยแบงผทดลองทงหมดตามอาย มนอยกวา

15 ป 1 คน อายระหวาง 15 ถง 60 ป 8 คน และอายมากกวา

60 ป 1 คน และแบงผทดลองทงหมดตามอาชพ มโบรกเกอร

1 คน พนกงานออฟฟศ 3 คน นกเรยน 1 คน พนกงานดาน

IT 5 คน

รแคปทชา และไมโครซอฟตแคปทชา ทใชทดสอบไดมา

จากเวบไซต รแคปทชา 50 รป และเวบไซต Hotmail 30 รป

โดยแตละภาพของ รแคปทชา และไมโครซอฟตแคปทชาได

รบการทดสอบและบนทกคำาตอบทถกตองเอาไว ซงแตละ

รปภาพของ รแคปทชา และ ไมโครซอฟตแคปทชา จะถก

เลอกสมออกมาแสดง

แคปทชาทกรปแบบจะแสดงออกมาทละภาพไมใหซำากบ

รปภาพเดมตลอดการทดสอบทง 5 ภาพ ในแตละรปแบบ

ของผทดลองแตละคน เมอผทดลองทำาการทดสอบ แคปทชา

ทง 3 รปแบบเสรจ กจะไดรบแบบสอบถามใหประเมน

แคปทชาทง 3 รปแบบ โดยแบบสอบถามมทงหมด 8 ขอ

สำาหรบแคปทชาทกแบบ และมเกณฑการใหคะแนนในแตละ

ขอ 5 ระดบ

งานวจยนพฒนาโดยใช Microsoft Visual Studio 2010

สราง Project เปน Web Application และใชภาษา VB โดย

เกบขอมลลงใน Database ของ Microsoft SQL Server 2008

R2 Express

5. ผลการทดลอง

ผเขารวมทดลองมทงหมด 13 คน แตมปญหาเกดขนจาก

การสมภาพแคปทชาในชดของรแคปทชา และไมโครซอฟต

แคปทชา ทำาใหมผทดลองจำานวน 3 คน ไดรบภาพจากการ

ภาพท 2 ดอทแคปทชา รแคปทชา และ ไมโครซอฟต

แคปทชา

Page 5: Usability and Security of Dot Captcha · ป ท 10 ฉบ บท 1 มกราคม - ม ถ นายน 2557 วารสารเทคโนโลย สารสนเทศ3

5วารสารเทคโนโลยสารสนเทศปท 10 ฉบบท 1 มกราคม - มถนายน 2557Vol. 10, No. 1, January - June 2014 Information Technology Journal

บทความวจย : การใชงานไดและความปลอดภยของดอทแคปทชา

สมเลอกภาพซำากบภาพเดมทไดทดสอบไปกอนหนา จงทำา

ใหขอมลตางๆ ทไดจากการทดสอบของผทดลองทง 3 คน

ไมเหมาะสมทจะนำามาเปรยบเทยบ ดงนนผลลพธทไดจาก

การทดลองจะตดขอมลของผทดลองทง 3 คนนแยกออก

แตจะนำาขอมลมาใชในการวเคราะหดานอนๆ ในภายหลง

สวนการสมเลอกแคปทชา มการปรบปรงใหมและสามารถใช

ทำาการทดลองไดเปนปกต

การตรวจสอบความถกตองของคำาตอบใหถอวาผทดสอบ

ใชตวพมพใหญหรอพมพเลกมความหมายเดยวกน เพราะ

ในรแคปทชาและไมโครซอฟตแคปทชากมลกษณะเชน

เดยวกนและผลลพธทไดจากการทดลอง จะนำาไปคำานวณหา

คาทางสถตโดย ความถกตอง (Correctness) คอ จำานวนท

ผทดลองตอบแคปทชาไดถกตอง ความเรว (Speed) คอ เวลา

ทใชในการทดลองแคปทชาแตละแบบ และ คะแนนความพง

พอใจ (Satisfaction) คอ คะแนนทผทดลองใหในแบบสอบถาม

สำาหรบแคปทชาแตละแบบ ตวอยางในตารางท 1

ผลการทดลองดานความถกตองของแคปทชาทง 3

รปแบบเปนอสระตอกน

จากตารางท 2 สรปไดวาผทดลองสามารถทำาการ

ทดสอบในดอทแคปทชา ไดถกตองมากกวา รแคปทชา

และ ไมโครซอฟตแคปทชา โดยทในไมโครซอฟตแคปทชา

ผทดลองสามารถทำาไดถกตองมากกวา รแคปทชา

ผลการทดลองดานความเรวของแคปทชา ทง 3 รปแบบ

ใหผลลพธไมแตกตางกน แตขอมลทไดมความไมเปนอสระ

ตอกน เนองจากไมมการสมลำาดบในการทำาแบบทดสอบ

แคปทชาแตละรปแบบ โดยผทดลองทกคนจะมลำาดบการทำา

แบบทดสอบแคปทชาเหมอนกน คอเรมจากอนดบแรก

ดอทแคปทชา อนดบทสอง รแคปทชา และอนดบสดทาย

ไมโครซอฟตแคปทชา ดงนนในการทดลองอาจทำาใหการทำา

แบบทดสอบของผทดลองในแคปทชาทง 3 รปแบบไมเทา

เทยมกน

ผลการทดลองดานความพงพอใจตอแคปทชาทง 3

รปแบบเปนอสระตอกน และใหผลลพธไมแตกตางกน

ตารางท 1 รายละเอยดผลการทดลอง

N Mean S.D. Min Max

Correct

ดอทแคปทชา 10 4.50 0.707 3 5

รแคปทชา 10 2.90 1.663 0 5

ไมโครซอฟต

แคปทชา10 3.80 1.135 1 5

Total 30 3.73 1.363 0 5

Speed

ดอทแคปทชา 10 63.90 22.590 36 121

รแคปทชา 10 67.90 40.018 35 163

ไมโครซอฟต

แคปทชา10 60.70 23.669 29 117

Total 30 64.17 28.952 29 163

Satisfaction

ดอทแคปทชา 10 28.60 5.502 19 35

รแคปทชา 10 28.80 4.872 23 36

ไมโครซอฟต

แคปทชา10 27.50 6.519 16 35

Total 30 28.30 5.503 16 36

ตารางท 2 เปรยบเทยบผลลพธในดานความถกตอง

(I) ชนดของ

แคปทช�

(J) ชนดของ

แคปทช�

Mean Difference

(I - J)Sig.

ดอทแคปทชา รแคปทชา 1.600 0.077

ดอทแคปทชาไมโครซอฟต

แคปทชา0.700 0.134

รแคปทชาไมโครซอฟต

แคปทชา- 0.900 0.440

ตารางท 3 ผลคะแนนแบบสอบถามจากผทดลองแยก

ตามกลมคำาถาม

คำ�ถ�ม ดอทแคปทช� รแคปทช�ไมโครซอฟต

แคปทช�

1. ความเขาใจในแบบทดสอบ 34 36 36

2. ความงายในการทำาแบบทดสอบ 40 38 36

3. ความสะดวกรวดเรวในการทำา

แบบทดสอบ38 37 34

4. ความชดเจนของขอความท

แสดงในแบบทดสอบ35 37 31

5. ความเหมาะสมในการจดวาง

ขอความในแบบทดสอบ33 35 36

6. ความเหมาะสมของลกษณะ

ตวอกษรทใชในแบบทดสอบ33 33 32

7. ความเหมาะสมของภาพทแสดง

ในแบบทดสอบ35 36 35

8. ความพงพอใจในแบบทดสอบ 38 36 35

Page 6: Usability and Security of Dot Captcha · ป ท 10 ฉบ บท 1 มกราคม - ม ถ นายน 2557 วารสารเทคโนโลย สารสนเทศ3

6 ว�รส�รเทคโนโลยส�รสนเทศ ปท 10 ฉบบท 1 มกราคม - มถนายน 2557Vol. 10, No. 1, January - June 2014Information Technology Journal

บทความวจย : การใชงานไดและความปลอดภยของดอทแคปทชา

ผลการทดลองในสวนของความทนทาน ไดทำาการ

ทดสอบแคปทชาทง3แบบดวยOCRชอOCR Image to

Text Conversion ToolซงเปนDemo Version โดยผลลพธท

ไดจากการทดสอบคอOCRไมสามารถใหคำาตอบทถกตอง

ในทกแบบแตมขอนาสงเกตในรแคปทชาและไมโครซอฟต

แคปทชา สามารถรบรตวอกษรไดบางสวน ในขณะทดอท

แคปทชาใหผลลพธออกมาประกอบดวยสญลกษณตางๆท

ไมไดอยบนคยบอรด นอกจากนยงไดทดสอบกบเวบไซต

ชอ free-ocr.com และ i2ocr.com พบวาในรแคปทชา และ

ไมโครซอฟตแคปทชา สามารถรบรตวอกษรไดบางสวน

เชนกน แตสำาหรบดอทแคปทชาไมพบตวอกษรทสามารถ

รบรไดโดยแสดงขอความเตอนวา“Sorry, we could not find

any text in your image.”ในfree-ocr.comและ“Error-The

requested service could not be completed for technical reasons.

Please contact [email protected]”ในi2ocr.com

6. บทวเคราะห

6.1 ขอผดพลาดทเกดขน

จากการทดสอบของผทดลองจำานวน 10 คน ในการทำา

แบบทดสอบดอทแคปทชา คนละ 5 รปภาพ มการตอบผด

เกดขนทงหมด 5 รปภาพ จากทงหมด 50 ครง

จากภาพท 3 ผทดลองไดตอบออกมาวา ua6qvvaha ซง

คำาตอบทถกตองคอ ua6qvvaha7 อาจเกดจากการทผทดลอง

ทำาแบบทดสอบทรวดเรวมากเกนไป จงขาดความรอบคอบ

พมพ 7 ขาดไปหนงตวอกษร

จากภาพท 4 ผทดลองไดตอบออกมาวา gqhpekvau ซง

คำาตอบทถกตองคอ gqhpekvdu เกดจากการทตวอกษร d ถก

ลบออกไปบางสวน จนทำาใหตวอกษร d มลกษณะทคลาย a

จากภาพท 5 ผทดลองไดตอบออกมาวา 2gP.aBqS ซงคำา

ตอบทถกตองคอ 2gPaBqS เกดจากการทมสงรบกวน

ลกษณะคลายตวอกษรจดบนคยบอรดแทรกอยใกลๆ กบ

กลมของตวอกษร

จากภาพท 6 ผทดลองไดตอบออกมาวา C5nb3yMLAA

ซงคำาตอบทถกตองคอ C5nb3vMLAA อาจเกดจากการท

ตวอกษร v ถกลบออกไปบางสวน จนเวาแหวงทำาใหผทดลอง

เกดความสบสนไดวาเปน y

จากภาพท 7 ผทดลองไดตอบออกมาวา p8ADFh JP4N

ซงคำาตอบทถกตองคอ p8ADFhJP4N เกดจากการทระยะ

หางตวอกษรมมากจนทำาใหผทดลองมองเปนชองวาง และ

ไดทำาการพมพใสมาในคำาตอบดวย

6.2 ขอสงเกตอนๆ

การแบงคำาเปน 2 สวนของ รแคปทชา ทำาใหผทดสอบ

บางคนเขาใจผดจากการพมพขอความลงไปเพยงสวนเดยว

เทานน และในบางรปภาพทขอความยาวมากๆ และแสดง

ผลไมชดเจนของ รแคปทชา ผทดลองบางคนพมพตวอกษร

ซงอยตดกน 5 ตวอกษรขาดหายไป และผทดลองบางคนอาจ

ใชความคนเคยกบคำาในการทำาแบบทดสอบ จนสงผลใหตอบ

แบบทดสอบผดได เชน lypvkhtlm เปน LYPVKHtml

ขอความทยาวมากๆ ในแคปทชา ผทดลองบางคนอาจ

ตอบแบบทดสอบผดจากการพมพทเรวเกนไป ทงทควรจะ

ถก เชน oliesvi twenty-five เปน oliesvi tewenty-five

บางกรณการพมพตวอกษรผดเกดจากการกดปมตว

อกษรซงอยตดกนบนคยบอรดแทน เชน xt5ppxxp เปน

Zt5PPXxp

ภาพท 3 ดอทแคปทชา ทผทดลองตอบผดแบบท 1

ภาพท 4 ดอทแคปทชา ทผทดลองตอบผดแบบท 2

ภาพท 5 ดอทแคปทชา ทผทดลองตอบผดแบบท 3

ภาพท 7 ดอทแคปทชา ทผทดลองตอบผดแบบท 5

ภาพท 6 ดอทแคปทชา ทผทดลองตอบผดแบบท 4

Page 7: Usability and Security of Dot Captcha · ป ท 10 ฉบ บท 1 มกราคม - ม ถ นายน 2557 วารสารเทคโนโลย สารสนเทศ3

7วารสารเทคโนโลยสารสนเทศปท 10 ฉบบท 1 มกราคม - มถนายน 2557Vol. 10, No. 1, January - June 2014 Information Technology Journal

บทความวจย : การใชงานไดและความปลอดภยของดอทแคปทชา

นอกจากนดอทแคปทชาไดทำาการทดสอบกบชายอาย 72

ซงมภาวะทางสายตาเปนตอหนบางสวน โดยใหทำาการ

ทดสอบดวยการอานใหฟงเพยงอยางเดยว และตอบออกมา

ดวยการพดคำาตอบทยนยนแลว เนองจากภาวะทางสายตา

ไมสามารถทจะอานตวอกษรบนคยบอรดได โดยทำาการอาน

ภาพทงหมด 3 รปแบบ รปแบบละ 5 รปภาพเทาๆ กนกบ

ผทดลองคนอนๆ ซงผลปรากฏวา ในไมโครซอฟตแคปทชา

ตอบผดหมดทกรป ในขณะทรแคปทชากตอบผดหมดเชน

กน โดยทการอานทำาไดลำาบากมาก

สำาหรบการอานดอทแคปทชา สามารถทำาไดดเทยบเทา

คนปกตโดยตอบผดเพยงตวอกษรเดยว นนคอตอบ e เปน

8 แตเปนทนาสงเกตวาในภาพอนๆ ทรปแบบเดยวกน โดย

มตวอกษร e เชนเดยวกน แตกลบสามารถตอบไดถกตอง

7. สรป

งานวจยนตองการสรางแคปทชาตวอกษร ใหมการใชงาน

ไดทงายตอมนษยและยงคงมความทนทานทดอย การนำา

ทฤษฎของ Gestalt มาใชจงเปนสงสำาคญ รวมถงกลไก

การสมทชวยใหดอทแคปทชาประสบความสำาเรจไดตาม

เปาหมาย โดยผทดลองมการตอบผดเพยง 5 ครง จาก

ทงหมด 50 ครง ซงดกวารแคปทชา และไมโครซอฟต

แคปทชา ในขณะทความทนทานของดอทแคปทชา จากการ

ทดสอบกบ OCR ผลลพธคอ OCR ไมสามารถใหคำาตอบท

ถกตองได

งานวจยนไมเพยงนำาเสนอแคดอทแคปทชาเทานน แตยง

แสดงใหเหนวาการใชทฤษฎ Gestalt กบแคปทชารปแบบ

ตวอกษร ซงหากใชไดอยางถกตองกจะสามารถใหประโยชน

ไดอยางมาก โดยการสญเสยการใชงานไดจะเกดขนนอยลง

ในขณะทความทนทานมความแขงแรงมากขน

งานวจยนเปนเพยงการศกษาเบองตน ในอนาคตผวจย

มแนวคดในการเพมประสทธภาพความทนทานใหกบ

ดอทแคปทชาขนไปอก โดยทไมใหกระทบกบการใชงานได

ของมนษย ซงลกษณะตวอกษรของดอทแคปทชาทอานได

งายสามารถทจะเพมเทคนคอนๆ เพอใหความทนทานม

ความแขงแรงมากขนได เชน Semantic และเพมการทดสอบ

แคปทชากบเครองมอ หรอกระบวนการอนๆ ใหมากขน

8. เอกส�รอ�งอง

[1] วศน สนธภญโญ. “Thai OCR Technology.” LibCamp#1

Book Digitization, กรงเทพมหานคร: ประเทศไทย

30 เมษายน 2552.

[2] วจตพาณ เจรญขวญ. ระบบและทฤษฎทางจตวทยา,

ภาควชาจตวทยา คณะศกษาศาสตร มหาวทยาลย

รามคำาแหง.

[3] A.S. El Ahmad, J. Yan and L. Marshall. “The robustness

of a new CAPTCHA.” In Proceedings of the Third

European Workshop on System Security, Paris, France,

pp. 36-41, 2010.

[4] A.S. El Ahmad, J. Yan and M. Tayara. “The Robustness

of Google CAPTCHAs.” Computing Science, Newcastle

University, UK, September 2011.

[5] L. V. Ahn, B. Maurer, C. McMillen, D. Abraham and

M. Blum. “reCAPTCHA: Human-Based Character

Recognition via Web Security Measures.” Science

Magazine, Vol. 321, No. 5895, pp. 1465-1468,

September 2008.

[6] C. Sutherland. “Usability and Security of Text-based

CAPTCHAs.” UMM CSci Senior Seminar Conference,

Morris, May 2012.

[7] เกษรนทร ชาวเกวยน และ วรพล ลลาเกยรตสกล.

“Thai CAPTCHA: Construction and Analysis.”

Journal of Information Science and Technology,

Vol. 2, Issue 2, pp. 56-64, July-December 2011.

[8] E. Bursztein, M. Martin and J. C. Mitchell. “Text-based

CAPTCHA Strengths and Weaknesses.” In Proceedings

of the 18th ACM conference on Computer and

communications securi ty , New York, USA,

pp. 125-138, 2011.