Mạng lưới toàn cầu và dịch giả (P.2)

Mạng lưới toàn cầu và dịch giả (P.2)

3.0 MẠNG LƯỚI WEB CÓ THỰC SỰ LÀ MỘT KHO NGỮ LIỆU?

Để xem liệu mạng lưới Web có các đặc điểm cần thiết để được coi như một kho ngữ liệu hay không, phần này sẽ tập trung so sánh các đặc tính của Web và kho ngữ liệu.

Dịch giả và internet
Dựa trên các định nghĩa khác nhau được đưa ra cho kho ngữ liệu trong các nghiên cứu, kho ngữ liệu có 3 đặc điểm chính: chứa các văn bản xác thực; chứa các văn bản được lấy mẫu để thể hiện rõ nhất về ngôn ngữ đang được nghiên cứu; và chúng ở dạng có thể đọc trên máy (Tengku Mahadi, Vaezian & Akbari: 2010). Tognini-Bonelli (2001: 55) định nghĩa tính xác thực của văn bản trong kho ngữ liệu như sau: “Tất cả các tài liệu trong kho ngữ liệu, dù ở dạng viết, dạng nói, hay được thu thập theo bất cứ hướng trung gian nào đều được giả định là lấy từ những giao tiếp xác thực giữa người với người về những vấn đề bình thường của họ.” Có lẽ không cần nghi ngờ, mạng lưới Web cũng có chung đặc điểm này với kho ngữ liệu, với các văn bản trực tuyến là những ví dụ thực tế của ngôn ngữ được sử dụng. Đối với đặc điểm thứ hai, tức là tính đại diện, mạng lưới Web với số lượng lớn văn bản ở nhiều ngôn ngữ khác nhau có thể chứa các đoạn văn bản mẫu mang tính đại diện trong nhiều ngôn ngữ. Cuối cùng, mạng lưới Web chắc chắn có chung đặc điểm thứ ba của kho ngữ liêu, tức là các văn bản trực tuyến đều ở dạng có thể đọc trên máy.

Do đó, có thể nói rằng mạng lưới Web ít nhiều có các đặc điểm của kho ngữ liệu. Thực tế, có thể coi mạng lưới Web là một kho ngữ liệu quản trị đa ngôn ngữ lớn thường xuyên được cập nhật với các văn bản mới. Bây giờ chúng ta hãy xem tại sao dịch giả muốn lấy thông tin từ mạng lưới Web với tư cách một kho ngữ liệu lớn thay vì lấy từ kho ngữ liệu thật sự.

  1. 0 MẠNG LƯỚI WEB LÀ KHO NGỮ LIỆU ẢO SO VỚI KHO NGỮ LIỆU THỰC

Kho ngữ liệu đã được chứng minh là rất có ích với các dịch giả.  Như Tengku Mahadi, Vaezian và Akbari (2010) đã nêu, kho ngữ liệu cung cấp cho dịch giả những thông tin về khái niệm, cách kết hợp từ ngữ, thuật ngữ, ngôn ngữ học và phép chính tả. Tuy nhiên, vẫn có một số hạn chế với dịch giả trong sử dụng kho ngữ liệu.

Đầu tiên, tiếp cận một kho ngữ liệu đã được tạo lập sẵn không phải lúc nào cũng dễ dàng. Trong thực tế, số lượng các kho ngữ liệu đã được lập sẵn rất hạn chế, nhất là với những ngôn ngữ ít phổ biến. Thứ hai, hầu hết các kho ngữ liệu hiện có chỉ ở một số lĩnh vực cụ thể và cung cấp một lượng hạn chế các thể loại và loại hình văn bản. Thứ ba, kho ngữ liệu hiện tại có thể không phải lúc nào cũng chứa chính xác thông tin mà dịch giả tìm kiếm. Trong thực tế, kể cả những kho ngữ liệu rất lớn cũng không thường xuyên chứa thông tin cần thiết để dịch các văn bản thuộc các lĩnh vực chủ đề cụ thể.

Ngược lại, bất cứ người dùng nào trên thế giới cũng có thể tiếp cận với mạng lưới Web, và mạng lưới này chứa rất nhiều văn bản phong phú ở hầu như mọi ngôn ngữ trên thế giới cũng như thuộc nhiều thể loại và loại hình khác nhau.  Tình huống này cho thấy việc dùng mạng lưới Web như một kho ngữ liệu là một lựa chọn khả thi khi dịch giả không thể tiếp cận với những kho ngữ liệu đã được tạo lập sẵn hoặc khi kho ngữ liệu có sẵn không chứa chính xác thông tin dịch giả cần tìm.

Đương nhiên, việc sử dụng mạng lưới Web như một kho ngữ liệu lớn cũng có những nhược điểm. Vấn đề chủ yếu khi sử dụng mạng lưới toàn cầu như một kho ngữ liệu lớn là thực tế rằng người dùng không có quyền kiểm soát với các văn bản trong mạng lưới. Sự thiếu kiểm soát các văn bản trực tuyến ngụ ý rằng người dùng sẽ khó đánh giá tính đại diện và xác thực của văn bản (Fletcher:  2004). Bên cạnh đó, như Gatto (2009: 46) đã nêu, làm việc với một lượng lớn dữ liệu trên mạng lưới Web “đòi hỏi một lượng lớn sức mạnh xử lý”, tức là người dùng phải đầu từ nhiều thời gian và công sức hơn để tìm thông tin họ cần từ vô vàn thông tin trong mạng lưới.

5.0 TRÍCH XUẤT CÁC THÔNG TIN LIÊN QUAN ĐẾN CÔNG TÁC DỊCH TỪ KHO NGỮ LIỆU MẠNG LƯỚI WEB

Nếu coi mạng lưới Web như một kho ngữ liệu lớn, chúng ta có thể đơn gian coi các công cụ tìm kiếm đa dạng như Google, Yahoo và Bing là những công cụ phân tích kho ngữ liệu được dùng để truy vấn kho ngữ liệu khổng lồ này. Các công cụ tìm kiếm thực tế là những chương trình kiểm tra các trang web và lưu thông tin về nội dung của chúng. Vì vậy, khi thực hiện một tìm kiếm, công cụ tìm kiếm sẽ tìm các tài liệu được lưu trữ trên mạng lưới Web theo những từ khóa cụ thể và trả về một danh sách các văn bản có các từ khóa đó. Những gì mà công cụ tìm kiếm làm thực tế rất gần với các tính năng đối chiếu của các công cụ phân tích kho ngữ liệu, bởi chúng đều tìm kiếm các văn bản theo từ khóa cụ thể và tìm những văn bản sử dụng các từ khóa đó.

Một số công cụ tìm kiếm như Google có một số tính năng cho phép người dùng tinh chỉnh tìm kiếm để đạt hiệu quả tốt nhất. Một số tính năng tìm kiếm hữu dụng nhất của công cụ tìm kiếm Google, từ góc nhìn dịch thuật là  tìm kiếm theo cụm từ , tìm kiếm loại trừtìm kiếm theo ký tự đại diện. Tìm kiếm theo cụm từ cho phép người dùng tìm một cụm từ chính xác bằng cách sử dụng dấu nháy kép(“”)ờ hai đầu cụm từ. Với tìm kiếm loại trừ, việc sử dụng một dấu trừ (-) ngay trước từ khóa, Google sẽ không đưa ra các trang có chứa từ đó trong phần kết quả, và khi dùng dấu sao(*) trong truy vấn theo ký tự đại diện, Google sẽ coi dấu sao là chỉ dấu cho bất cứ thuật ngữ chưa biết nào và tìm các kết quả phù hợp nhất.

Như Maniez đã nêu, dịch giả có thể dùng tốt các công cụ tìm kiếm để tìm các thuật ngữ hiếm gặp hay các mẫu cú pháp, hoặc kiểm tra tần số sử dụng thuật ngữ hay cách diễn đạt trong ngôn ngữ đích (2007). Ông cũng giải thích kỹ về việc tìm theo ký tự đại diện trên Google có thể áp dụng cho tìm kiếm các tương đương dịch thuật khi không biết tương đương chính xác của một thuật ngữ phức tạp. Fuji cũng cho thấy việc sử dụng công cụ tìm kiếm Google giúp các sinh viên cải thiện hiệu quả dịch thuật của mình như thế nào trong các lĩnh vực sau: mạo từ và từ số ít/số nhiều, hình thành các thì động từ, chuyển đổi loại từ, giới từ, dòng từ ngữ và câu, đại từ quan hệ, chọn từ chính xác cho ngữ cảnh và chuyển từ dạng bị động sang chủ động (2007).

Ngoàicác công cụ tìm kiếm thông thường, còn rất nhiều chương trình so sánh đối chiếu được thiết kế đặc biệt để truy vấn kho ngữ liệu mạng lưới Web. Những chương trình đối chiếu như vậy, theo Gatto, đã “cung cấp những ví dụ theo ngữ cảnh của việc sử dụng ngôn ngữ trên trang web dưới dạng phù hợp với phân tích ngôn ngữ học (2009: 80). Hiện nay, có nhiều chương trình đối chiếu trang web trực tuyến miễn phí. Chương trình WebCorp do Đơn vị Nghiên cứu và Phát triển nghiên cứu tiếng Anh tại Đại học Birmingham và chương trình WebAsCorpus do William Fletcher thiết kế là hai chương trình đối chiếu trang web trực tuyến miễn phí nổi tiếng.

6.0 LỜI KẾT

Ngày nay các dịch giả chuyên nghiệp làm việc với rất nhiều văn bản thuộc nhiều loại hình khác nhau.  Như Ulrych (2005: 22) đã nêu, “ý tưởng dịch giả chuyên nghiệp chỉ chủ yếu làm việc trong một hai một vài lĩnh vực cụ thể thực sự đang dần mất ưu thế…”.  Tình hình hiện nay đòi hỏi dịch giả có kiến thức bách khoa về nhiều lĩnh vực cụ thể, hoặc có những nguồn lực cần thiết để có những kiến thức đó khi nhu cầu đặt ra.

Pym (1993: 114) nói rằng, sự chuyên môn hóa trong thị trường dịch thuật ngụ ý rằng “một dịch giả không phải là người biết nhiều thứ mà là người có những kỹ năng và đầu mối để tìm những thông tin cụ thể khi cần.” Do đó, chìa khóa để thành công trong thị trường dịch thuật hiện nay nằm ở sự tháo vát, và mạng lưới Web có rất nhiều khả năng giúp đỡ cho dịch giả từ quan điểm này. Mạng lưới toàn cầu có thể được xem như một nguồn lực vô giá với dịch giả, bởi nó không chỉ chứa rất nhiều thông tin ngôn ngữ học về nhiều ngôn ngữ và loại văn bản khác nhau, mà còn cung cấp cho dịch giả một kênh giao tiếp với những người đồng nghiệp, những chuyên gia về lĩnh vực chủ đề và quan trọng hơn hết là với khách hàng của họ.


DỊCH SỐ là một trong số những nhà cung cấp dịch vụ dịch thuật hàng đầu tại Hà Nội. Ngoài ra, công ty còn cung cấp dịch vụ dịch thuật đối với hơn 20 loại ngôn ngữ khác nhau. Công ty Dịch Số đáp ứng nhu cầu dịch thuật tài liệu kỹ thuật, pháp lý, học thuật, y học và marketing, cùng nhiều loại tài liệu khác. Quý khách hàng vui lòng tham khảo thêm thông tin trên website http://www.dichso.com/ hoặc liên hệ hotline +84 934 425 988.

Share this post

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *