ปัจจุบัน Search Engine ชื่อดังล้วนเปิดให้เราค้นหารูปภาพได้ โดยการใส่คำค้นที่เราต้องการลงไป แล้วมันก็จะจัดแจงแสดงภาพที่เกี่ยวข้องกับคำค้นออกมา!!!

แต่ถ้ารูปภาพที่เราต้องการค้นนั้น มันไม่มีคำให้ค้นล่ะ อือม หมายถึง … ยกตัวอย่างเช่น มีใครซักคนนึงวาดรูปโลโก้ของผลิตภัณฑ์ชนิดหนึ่งมาให้เรา แถมวาดออกมาก็ไม่เหมือนของจริงซะทีเดียว แค่คล้าย ๆ อ่ะ แล้วก็มาถามเราว่าจะค้นจากคอมพิวเตอร์ได้มั้ย? ว่ารูปโลโก้ดังกล่าวมันเป็นของสินค้ายี่ห้ออะไร?

เอ่อ … งั้นก็คงต้องตอบว่า ไม่ได้อ่ะ ไอ้เจ้า Google กับ Yahoo มันทำไม่ได้ T-T

สาเหตุที่ต้องตอบว่าไม่ได้ก็เพราะว่า การค้นของ Search Engine มันไม่ได้ใช้เทคนิค Pattern Recognition อ่ะดิ แต่ถ้าจะให้มนุษย์ค้นให้ล่ะก็ซำบายมาก เพราะสมองของมนุษย์เรานั้นได้บรรจุกลไกของ Pattern Recognition เอาไว้อย่างเต็มเปี่ยม ต่อให้รูปภาพต้นแบบมันจะบิดเบี้ยว บู้บี้ โย้เย้ ผิดรูป หรือ ผิดสี เพียงไร มนุษย์ก็จะสามารถเดาได้ลาง ๆ อยู่ดีว่ามันน่าจะเป็นรูปภาพอะไร!!!

อือม แต่จากประสบการณ์ที่เคยทำ Pattern Recognition มาต้องขอบอกว่า ไอ้การทำ Pattern Recognition นั้น มันค่อนข้างจะกินทรัพยากรของคอมพิวเตอร์น่าดู เพราะมันไม่เหมือนกับการค้นหาคำ ที่เราสามารถใช้รหัส UTF-8 (สามไบต์) หรือ UTF-16 (สองไบต์) ในการเป็นสิ่งบ่งจำเพาะสำหรับค้นหาได้โดยตรง เนื่องจากการทำ Pattern Recognition นั้น เราจำเป็นที่จะต้องหา “ชุดตัวเลข” ของสิ่งบ่งจำเพาะ เพื่อใช้สำหรับเป็นเอกลักษณ์ของ Pattern นั้น ๆ และหนำซ้ำ “ชุดตัวเลข” ที่คำนวณออกมาได้ ยังอาจจะเป็นชุดตัวเลขสองมิติอีกต่างหาก ซึ่งถึงแม้มันจะช่วยให้ Pattern มีเอกลักษณ์โดดเด่นขึ้น แต่นั่นก็หมายถึงความสาหัสของการประมวลผลที่มากขึ้นเป็นทวีคูณ!

ประเด็นถัดมาก็คือเทคโนโลยีที่จะต้องใช้ เนื่องจากรูปภาพที่จะใช้ในการค้นนั้น มันเป็นได้หลายอย่าง ไม่ว่าจะเป็นรูปภาพของโลโก้, วิวทิวทัศน์, ลายมือ, ลายเซ็น หรือ หน้าคน เป็นต้น ซึ่ง Pattern เหล่านี้ล้วนใช้เทคโนโลยีที่แตกต่างกัน ยกตัวอย่างเช่น ถ้าจะค้นรูปภาพธรรมดา เราก็สามารถจะใช้เทคโนโลยี Pattern Recognition ได้ แต่ถ้าหากเราจะตรวจรู้ลายเซ็น เราก็จำเป็นต้องใช้เทคโนโลยี Optical Character Recognition หรือหากเราต้องค้นรูปหน้าของคน เราก็ต้องเปลี่ยนไปใช้เทคโนโลยี Facial Recognition เป็นต้น

จากตัวอย่างข้างต้นจะเห็นว่า การจะทำ Universal Image Search Engine นั้นเป็นเรื่องหินชาติพอสมควร เพราะเราต้องใช้เทคโนโลยีหลาย ๆ อย่างเข้ามาช่วย ไม่ว่าจะเป็น …

1. แขนงทาง Pattern Recognition เช่น Optical Character Recognition, Digital Image Processing หรือ Optical Mark Recognition เป็นต้น

2. แขนงทาง Biometrics เช่น Facial Recognition, Iris Recognition หรือ Fingerprint Recognition เป็นต้น

โดยส่วนตัวแล้วมองว่า ถ้าทุกครั้งที่เราต้องการหาคำตอบว่ารูปภาพที่เราอยากค้น มันคือรูปภาพของอะไร? แล้วเราต้องให้คอมพิวเตอร์ใช้ทุกเทคโนโลยีข้างต้น เข้ามารุมตรวจสอบรูปภาพดังกล่าว มันคงจะสาหัสน่าดู ดังนั้นก็เลยคิดว่า มันน่าจะเป็นไปได้ ที่จะสามารถนำเอาเทคโนโลยีทั้งหมดมารวมกัน ให้กลายเป็น Universal Pattern Recognition ได้!!!

ขนาดในทางฟิสิกส์อนุภาค นักวิทยาศาสตร์ยังคิดกันหัวหกก้นขวิด ว่าจะรวมแรงทั้ง 4 อันได้แก่ แรงนิวเคลียร์อย่างอ่อน, แรงนิวเคลียร์อย่างเข้ม, แรงแม่เหล็กไฟฟ้า และ แรงโน้มถ่วง เข้าไว้ด้วยกันได้ยังไง งั้น … ในทางวิทยาศาสตร์คอมพิวเตอร์ ก็น่าจะสามารถคิดค้นวิธีการรวมเทคโนโลยีการประมวลผลภาพทั้งหลาย เพื่อให้กลายเป็น Universal Image Recognition ได้เหมือนกันอ่ะดิ อิ อิ เอาแบบว่าสมการชุดเดียว ใช้กับรูปภาพได้ทุกรูปแบบไปเลย 😛 (สงสัยงานนี้ต้องรอกันอีกนาน)

[tags]Universal, Image, Recognition, Pattern Recognition, Biometrics[/tags]

Related Posts

5 thoughts on “Universal Image Recognition

  1. เว็บนี้น่าจะค้นได้อย่างที่พี่ไท้ต้องการนะคับ
    อัพรูปขึ้นไป เด๋วมันหารูปใกล้เคียงให้
    ซึ่งก็น่าจะใช้ได้ระดับนึงแล้วล่ะครับ
    http://tineye.com/

    ป.ล. ตอนนี้ google เริ่มใส่ function สำหรับ search image มากขึ้นแล้วนะครับ ล่าสุดเห็นมีค้นรูปตามสีด้วย

  2. โอ้ ผมเพิ่งรู้แฮะคุณ MacroArt ถ้าแบบนี้มันเรียกว่า Human-based Computation เลยนะนั่น

    555 ขำคุณ crucifier

    เข้าไปดูแล้ว แต่ยังไม่ได้ลองเลยอ่ะคุณ AMp

ใส่ความเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *