ตามปรกติแล้วเมื่อนักวิทยาศาสตร์ทำการทดลองใด ๆ ก็จำเป็นที่จะต้องสรุปผล พร้อมทั้งประเมินวิธีในการแก้ปัญหาที่จะเกิดขึ้นให้ครบสมบูรณ์

ผมเองก็พบ bug ตัวใหญ่ 3 ตัวใน Jingjo รุ่น 0.5.0 เช่นกัน โดยจะอธิบายให้ทราบดังนี้

1.   อ่านไม่ได้จบศัพท์ จับไปกระเดียด

ลักษณะของ bug คือ คำ ๆ นั้นจริง ๆ ถูกอยู่แล้วถ้าอ่านให้มันจบซะก่อน แต่เป็นเพราะอ่านยังไม่ทันจบ ก็เลยคิดไปเองว่ามันผิด ยกตัวอย่างเช่น คำว่า สร้างสรรค์ เป็นต้น

2.   คำผสมไม่ผิด แต่คำโดดดันบอกว่าผิด

เพราะภาษาไทยมีทั้งคำโดดและคำผสม ดังนั้นถ้าคำโดดสะกดอย่างโดดเดี่ยว ก็เป็นไปได้ที่คำนั้นอาจจะผิด แต่หากว่าคำโดดดังกล่าวสะกดผสมกับคำโดดอื่นด้วย ก็จะกลายเป็นว่าคำโดดดังกล่าวถูกต้องไป ยกตัวอย่างเช่น คำว่า อนุญาต เป็นต้น

3.  เอาลูกเขามาเลี้ยง เอาเมี่ยงเขามาอม

อันนี้เป็น bug ที่ผมโดนแซวกระจุยเลยครับ 😛 จริง ๆ แล้วผมก็เห็นตั้งแต่ตอนบันทึกแล้วล่ะ อิ อิ โดย bug ตัวนี้เกิดขึ้นเพราะภาษาไทยเขียนติดกันเป็นพรืด ก็เลยทำให้เกิดการเปรียบเทียบคำที่ผิด ดันเอาพยัญชนะของคนล่ะคำมารวมกันให้เป็นคำใหม่ แล้วชี้ลงไปว่าคำนั้นผิด ยกตัวอย่างเช่น ดัชนีตลาดหลักทรัพย์ เป็นต้น

ผมคิดว่าผมจะเริ่มแก้ bug ตัวที่ 1 ก่อน ซึ่งก็ไม่รู้ว่าจะเสร็จเมื่อไหร่ จากนั้นจึงค่อยแก้ bug ตัวที่ 2 ซึ่งงานนี้คงต้องบรรจุพจนานุกรมไทยฉบับราชบัณฑิตยสถาน พ.ศ. 2540 เข้าไว้ในโค้ดแหง ๆ เลย  และสำหรับ bug ตัวสุดท้ายคงต้องแก้ด้วยการหาอัลกอริธึมในการตัดคำที่สมบูรณ์แบบนั่นเอง ซึ่งผมคิดว่า…มัน…ยากกกกกกกกกมากกกกกกกกกกกก

โดยสรุปแล้ว bug ทั้ง 3 ตัวนั้น ไม่ใช่แก้กันได้โดยง่าย คงต้องใช้เวลาพักใหญ่เลยทีเดียว กว่า Jingjo จะหลุดจากสถานะ alpha เข้าสู่สถานะ beta ได้

การประมวลผลภาษาไทย ช่างยากอะไรเช่นนี้หนอ T-T

[tags]ประเมินผล, jingjo, wordpress, plugin, ภาษาไทย, ซอฟต์แวร์, คอมพิวเตอร์[/tags]

Related Posts

4 thoughts on “ประเมินผล Jingjo รุ่น 0.5.0

  1. lexitron มีฐานข้อมูลให้ใช้นะครับ แต่ถ้ามี API ให้ จะเทห์มาก

    เอาใจช่วยครับพี่

    ปล. ผมยังไม่ได้แก้บั๊กที่ว่าเลยครับ

  2. ลองหา Open Source ของ Firefox ดูสิครับเผื่อเป็นแนวทางได้เพราะมันมีฟังชั่นการทำงานคล้ายกับ Jingjo สังเกตได้เวลาเรากำลัง Comment

  3. ถึงขนาดเป็น API เลยเหรอคุณ audy โหย ยากอ่ะ T-T

    หาแล้วครับ แต่หาไม่เจอ สงสัยผมจะไม่เชี่ยวเรื่อง firefox เท่าไหร่ครับคุณ DukeSoNiC

    มันเป็น wordpress plugin นี่ครับคุณ DominixZ แจกให้ไปใช้ยังไงก็เปลือย source code อยู่แล้ว อิ อิ ^-^

ใส่ความเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *