Tiếng Việt và vấn đề dịch máy

Tiếng Việt và vấn đề dịch máy

TIẾNG VIỆT VÀ VẤN ĐỀ DỊCH MÁY

Tiếng việt và dịch máy

Dung vũ

Dịch máy (machine translation) đã trở thành một tiện ích phổ biến trong thời đại internet.

Đây là một trong những đề tài phức tạp nhất của việc xử lý ngôn ngữ con người trong lĩnh vực trí thông minh nhân tạo (artificial intelligence) mà giới khoa học đã miệt mài nghiên cứu để đạt nhiều kết quả đáng kể ngày hôm nay: tự điển song ngữ tự động (Anh-Đức, Anh-Pháp, Anh-Nhật, Anh-Việt,…), dịch cụm từ, câu (như Google Translator, Babel Fish,…). Tuy nhiên vẫn còn nhiều khó khăn.

Dịch máy cũng là đề tài được giới khoa học Việt Nam quan tâm và còn gặp nhiều khó khăn hơn nữa, ít nhất vì những nguyên nhân khách quan sau đây:

Thứ nhất, tiếng Việt là một ngôn ngữ rất phức tạp (so với ngôn ngữ Âu châu).

Thứ hai, dịch máy là một chủ đề còn mới mẻ đối với giới ngôn ngữ học điện toán Việt Nam.

Thời gian nghiên cứu chưa lâu (ước khoảng một thập niên trở lại đây). Thiếu nhân sự, kỹ

thuật, kinh nghiệm kỹ nghệ, tài chính,… Thậm chí thiếu kiến thức ngôn ngữ học thuần túy và đôi khi vẫn chưa nắm được đặc điểm tiếng Việt.

Bài viết sơ lược này sẽ chỉ ra một số vấn đề dịch máy tiếng Việt và đồng thời gợi ý giải quyết. Tuy đây là một đề tài chuyên môn nhưng bài viết chọn cách trình bày bình dân, dễ hiểu thay cho hình thức một tiểu luận khoa học khô khan…

Xem bài viết bằng bản PFD tại đây:

Download Free tại Dịch Số

Phần 1
Phần 2
Phần 3
Phần 4

© 2013 DICHSO – Mọi thông tin bài viết, tập download, đều được DSC giữ đúng nguồn của tác giả.

Share this post

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *