Bánh bà xã và nước ác quỷ: Những hiểm họa của bản dịch tự động

Bánh bà xã và nước ác quỷ: Những hiểm họa của bản dịch tự động

Hãy tưởng tượng về một vùng đất xa xôi nào đó mà bạn có thể bắt một chuyến xe từ trạm xe buýt Jackie Chan tới một nhà hàng tên là Lỗi dịch thuật máy chủ và thưởng thức một bữa tiệc thịnh soạn với bánh kẹp trẻ em và bánh bà xã kèm với nước ác quỷ.
Nếu mắc nghẹn vì bữa trưa đó, bạn sẽ rất vui khi biết có rất nhiều người của Hội giám lý sẵn sàng nhổ hết răng của bạn đi.
Và nếu không thích đi bằng xe buýt nữa, bạn có thể bay về nhà trên một chiếc máy bay đang sôi. Nhưng dù làm bất cứ điều gì, xin hãy nhớ là khi đến sân bay, đừng ăn thảm trải sàn vì điều đó bị cấm.
Không, tôi không điên đâu. Đó là những ví dụ hoàn toàn thực tế về những bản dịch của phần mềm dịch thuật tự động.

Dịch thuật máy
Bỏ qua chuyện buồn cười sang một bên, những bản dịch tồi có thể gây ảnh hưởng lớn, khiến các công ty làm mếch lòng khách hàng và lỡ chuyện làm ăn, hoặc làm hình ảnh của họ trở nên vô cùng thiếu chuyên nghiệp.
Tuy nhiên, chúng ta luôn được hứa hẹn rằng máy móc sẽ sớm học được cách xử lý ngôn ngữ tự nhiên và sẽ sớm cho ra những bản dịch hoàn hảo và gần như ngay lập tức.
Vây các doanh nghiệp còn phải chờ bao lâu nữa?


Những lời tục tĩu
Vào tháng 1 vừa rồi, Skype đã cho ra mắt phần mềm dịch thuật thời gian thực cho phép dịch thuật bằng giọng nói với 7 ngôn ngữ.
Nhưng bước phát triển công nghệ cao này cũng có những vấn đề của nó, khi thỉnh thoảng ngẫu nhiên thay những từ tiếng quan thoại thành những từ tục tĩu.
Nhiếp ảnh gia Tom Carter, người đang ở Trung Quốc để quay một quảng cáo Skype và dùng ứng dụng này để nói chuyện với mọi người bằng tiếng quan thoại đã phát hiện ra trục trặc này,
Khi anh nói: “Rất vui được nói chuyện với bạn” với một người hướng dẫn địa phương ở Dương Sóc, Skype đã dịch câu đó ra thành một chuỗi từ chửi thề rất khó chịu.
Nguyên nhân của vấn đề được cho là vì “Vạn lý tường lửa” – phương pháp kiểm duyệt trang web của Trung Quốc – đã làm gián đoạn hội thoại của Skype.
Những mạng lưới thần kinh
Các chương trình dịch thuật như Google Translate được xây dựng theo cách truyền thống quanh những bản dịch máy thống kê dựa trên cụm từ.
Chúng hoạt động bằng cách phân tích một danh mục văn bản đã được dịch từ trước, như những nghiên cứu học thuật và bảng từ vựng. Những văn bản này được phân tích song song trong cả ngôn ngữ gốc và ngôn ngữ đích, sau đó dùng xác suất thống kê để chọn bản dịch thích hợp nhất.
Hiệu quả của công tác này phụ thuộc rất nhiều vào chất lượng của các mẫu bản dịch gốc và rất dễ có lỗi sai, thường cho bản dịch cứng nhắc và rườm rà.
Vì lý do này, Alan Packer, giám đốc kỹ thuật công nghệ ngôn ngữ tại Facebook mới nói rằng bản dịch máy thống kê đã chạm tới “hồi kết cho đời sống tự nhiên của nó”.
Thay vào đó, công nghệ dịch thuật bây giờ di chuyển theo hướng mạng lưới thần kinh nhân tạo. Những mạng lưới này được cấu tạo tương tự như não người và dùng những thuật toán phức tạp để chọn và sử dụng bản dịch chính xác.
Nhưng thay vì chỉ dịch từ ngữ, một mạng lưới thần kinh có thể học các ẩn dụ và ý nghĩa đằng sau ngôn ngữ, cho phép nó chọn một bản dịch có cùng ý nghĩa trong một nền văn hóa khác, thay vì một bản dịch nghĩa đen trực tiếp mà đôi khi có thể gây phản cảm.
Facebook, nơi thực hiện tới 2 tỉ bản dịch mỗi ngày giữa 40 ngôn ngữ đang lên kế hoạch đưa ra một hệ thống như vậy vào cuối năm nay.
Gã khổng lồ trong lĩnh vực tìm kiếm là Google- hiện đang cung cấp hỗ trợ 103 ngôn ngữ, chiến 99% dân số trực tuyến – cũng được cho là sẽ nghiên cứu chuyển đổi dịch vụ dịch thuật của mình sang dạng mạng thần kinh.
Nhưng công ty chưa công khai thời điểm chuyển đổi sớm nhất.
‘Những vấn đề khó khăn’
Trước khi bạn cho rằng bản dịch tự động đang sắp trở nên hoàn hảo, hãy nghĩ lại.
Giáo sư Philipp Koehn, một nhà khoa học máy tính kiêm chuyên gia công nghệ dịch thuật tại đại học Edinburgh chia sẻ với hãng tin BBC rằng vẫn còn rất nhiều việc phải làm.
“Có những vấn đề rất khó khăn trong việc thể hiện ngữ nghĩa và kiến thức cần được giải quyết trước, và chúng ta thậm chí còn chưa đến gần được cách giải quyết.
Thách thức chính là có ít thông tin rõ ràng trong ngôn ngữ gốc thay vì những yếu tố cần thiết để tạo ra kết quả trong ngôn ngữ đích.
Ví dụ, tiếng Trung không có tương đương sử dụng từ dạng số nhiều, thì của động từ hay đại từ như tiếng Anh, và việc có bản dịch chính xác sang tiếng Trung Quốc là rất khó khăn.
Tiếng Anh cũng không sử dụng danh từ có giống, vì thế việc dịch từ tiếng Anh sang những ngôn ngữ như Pháp, Ý hay Đức cũng không phải chuyện dễ.”
Yếu tố con người
Cho đến khi những thách thức này được vượt qua, những bản dịch sai vẫn sẽ tiếp tục xuất hiện, dù là trên tuyến xe buýt tới trạm Ký túc đại học Jackie Chan thay vì Ký túc đại học Tứ Xuyên, hay những chủ nhà hàng gọi quán của họ là “Lỗi dịch thuật máy chủ”.
Mặc dù công nghệ dịch thuật có thể cải thiện nhanh chóng, cái giá của thất bại cũng sẽ rất lớn, vì thế nhiều công ty không muốn đặt hết niềm tin vào dịch thuật máy.
Clem Chambers là giám đốc điều hành của ADVFN, một trang web thông tin chứng khoán và cổ phiếu toàn câu bao quát hoạt động của hơn 70 sàn giao dịch chứng khoán trên thế giới.
Ông cho hay: “Với chúng tôi, khi phải lập ra những trang web phù hợp về địa lý và ngôn ngữ, không gì bằng việc có những người bản ngữ có hiểu biết sâu sắc về thị trường tài chính ở các nơi.
Công nghệ dịch thuật đã tiến xa và có thể đưa ra những bản dịch nghĩa đen chính xác, nhưng cái chúng tôi cần là thứ gì đó có thể thực sự nói được ngôn ngữ của người dùng cuối, với tất cả những sự tinh tế và cách sử dụng từ ngữ cụ thể của người dân một quốc gia.”
Nói cách khác, công nghệ dịch thuật cũng có công dụng của mình, nhưng đừng dựa hết vào chúng nếu bạn không muốn những điều tồi tệ xảy ra.


DỊCH SỐ là một trong số những nhà cung cấp dịch vụ dịch thuật hàng đầu tại Hà Nội. Ngoài ra, công ty còn cung cấp dịch vụ dịch thuật đối với hơn 20 loại ngôn ngữ khác nhau. Công ty Dịch Số đáp ứng nhu cầu dịch thuật tài liệu kỹ thuật, pháp lý, học thuật, y học và marketing, cùng nhiều loại tài liệu khác. Quý khách hàng vui lòng tham khảo thêm thông tin trên website http://www.dichso.com/ hoặc liên hệ hotline +84 934 425 988.

Share this post

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *