ข่าว IT ล่าสุด
ถูกใจอย่าลืม Like Fanpage
[it] Google Translate ทำงานอย่างไร?
แสดงแล้ว 1401 ครั้ง /
สิงหาคม 13, 2010, 10:05:50

Moshi

ออฟไลน์
กระทู้ : 16,996
คะแนนขอบคุณ : 45
it4x สังคมแห่งการเรียนรู้
      Google Translate เครื่องมือแปลภาษาที่เปิดให้ใช้ฟรี โดยสามารถแปลได้ตั้งแต่ข้อความที่เป็นประโยคไปจนถึงเอกสารทั้งหน้า หรือแม้แต่ทั้งเว็บไซต์ อย่างไรก็ตาม เชื่อว่า คุณผู้อ่านของ it4x หลายคนคงอยากทราบว่า Google Translate มีการทำงานอย่างไร? ทำไมมันถึงได้เข้าใจภาษาต่างๆ และสามารถแปลออกมาได้ค่อนข้างถูกต้องในบางภาษา?


     
 

สหรับการแปลภาษาของ Google Translate จะมาจากการประมวลผลของคอมพิวเตอร์หลายเครื่องด้วยกัน โดยคอมพิวเตอร์เหล่านี้จะใช้กระบวนการแปลที่เรียกว่า "statistical machine translation" หรือ "ระบบการแปลภาษาเชิงสถิติ" ซึ่งเป็นวิธีที่คอมพิวเตอร์ใช้แปลความหมายของประโยค โดยอ้างอิงจากรูปแบบของข้อความจำนวนมาก เพื่อให้ข้อความที่แปลมีความใกล้เคียงกับภาษามนุษย์

ลองนึกย้อนไปในสมัยเรียนภาษาอื่นๆ หากคุณต้องการสอนใครสักคนให้สามารถพูดภาษาใหม่ได้ คุณอาจจะเริ่มต้นด้วยการสอนคำศัพท์ และกฎไวยกรณ์ที่จะบอกว่า โครงสร้างประโยคของภาษาเป็นอย่างไร? คอมพิวเตอร์สามาถเรียนรู้ภาษาต่างๆ ของมนุษย์ได้ด้วยวิธีเดียวกัน นั่นก็คือ การอ้างอิงจากความหมายของคำศัพท์ และกฎไวยกรณ์ แต่ในความเป็นจริง ภาษาต่างๆ จะมีความซับซ้อน ซึ่งครูสอนภาษาหลายคนก็มักจะบอกตรงกันว่า มันมีข้อยกเว้นสำหรับการใช้กฎต่างๆ ด้วย เมื่อคุณพยายามใช้ข้อยกเว้นเหล่านั้นทั้งหมด ก็จะพบว่า มันมีข้อยกเว้นของข้อยกเว้นขึ้นมาอีก จึงไม่น่าแปลกใจว่า คุณภาพของโปรแกรมแปลภาษาด้วยคอมพิวเตอร์จึงไม่เป็นที่น่าพอใจเท่าที่ควร แต่สำหรับ Google Translate จะใช้วิธีแปลที่แตกต่างจากโปรแกรมทั่วไป

แทนที่ Google Translate จะใช้วิธีสอนให้คอมพิวเตอร์รู้จักกฎไวยกรณ์ของภาษา ทีมพัฒนาใช้วิธีทำให้คอมพิวเตอร์สามารถค้นพบรูปแบบ หรือกฎการแปลภาษาด้วยตัวมันเอง ซึ่งคอมพิวเตอร์ทั้งระบบสามารถทำสิ่งนี้ได้โดยวิเคราะห์จากเอกสารหลายล้านชุดที่มีการแปลออกมาแล้วโดยมนุษย์ ซึ่งข้อความที่แปลแล้วมาจากหนังสือต่างๆ จากองค์กรอย่าง UN และเว็บไซต์จากทั่วโลก โดยคอมพิวเตอร์สามารถสแกนข้อความต่างๆ เพื่อค้นหาสถิติที่สามารถให้ข้อสรุปที่ชัดเจนของรูปแบบการแปลเทียบกับการแปลคำต่อคำจนสามารถตัดสินใจได้ว่า ประโยคนั้นๆ ควรจะแปลว่าอย่างไรกันแน่ เมื่อคอมพิวเตอร์พบรูปแบบของการแปลทีชัดเจน (สถิติการแปลยืนยันว่า ส่วนใหญ่ต้องแปลแบบนี้) ระบบก็จะใช้รูปแบบนั้นแปลข้อความที่คล้่ายกันออกมาได้ เมื่อคอมพิวเตอร์ผ่านกระบวนการแปลซ้ำๆ ไปเรื่อยๆ ด้วยรูปแบบต่างๆ โปรแกรมก็จะมีความฉลาดในการแปลเพิ่มขึ้นตามไปด้วย

อย่างไรก็ตาม เนื่องจากบางภาษามีเอกสารให้โปรแกรมได้เรียนรู้ค่อนข้างน้อย นั่นเป็นสาเหตุให้คุณภาพการแปลภาษาของ Google Translate มีความแตกต่างกันไป ซึ่ง Google ยอมรับว่า ระบบการแปลยังไม่สมบูรณ์ แต่ด้วยการที่ระบบได้รับข้อความแปลใหม่ๆ ตลดเวลา มันจะทำให้คอมพิวเตอร์ฉลาดขึ้น และการแปลก็จะดีขึ้นเรื่อยๆ ตามไปด้วย ดังนั้นทุกครั้งที่คุณแปลประโยค หรือเว็บเพจด้วย Google Translate พึงระลึกว่า การแปลที่เห็นนั้นเกิดจากการประมวลผลเอกสารการแปลหลายล้านชุด และหลายพันล้านรูปแบบการแปล ซึ่งหลายต่อหลายครั้งผู้ใช้จะทึ่งกับผลลัพธ์การแปลที่ได้

ข้อมูลจาก: googleblog

แสดงบนเว็บไซด์ : http://www.it4x.com

ที่อยู่ของข้อความต้นฉบับ: http://www.arip.co.th/news.php?id=411928


 

ด้วยฟังค์ชั่น ตอบด่วน คุณสามารถใช้โค๊ดและ เครื่องหมายแสดงอารมณ์ได้ เหมือนการตั้งกระทู้ธรรมดา แต่สามารถทำได้สะดวกกว่า

ระวัง: หัวข้อนี้ไม่มีการอัพเดทมานานถึง 120 วัน

แจ้งเตือน: โพสของคุณจะไม่แสดงจนกว่าผู้ดูแลจะอนุมัติ.
ชื่อ: อีเมล์: