kết quả thử nghiệm có bằng chứng gồm có 67 bài báo đã được chú thích theo cách thủ công với một cấu trúc đại diện của các kết quả thực nghiệm bởi các chuyên gia về tên miền.. Bằng cách t
Trang 1Trích thông tin học thuật có cấu trúc từ văn học dịch máy
I Tóm tắc:
Kết quả thực nghiệm của một bài báo khoa học rất quan trọng để hiểu được đóng góp của nó và so sánh nó với các công việc Chúng tôi giới thiệu một cấu trúc truy vấn có thể cho kết quả thử nghiệm và sự diễn tả một hệ thống đường
cơ sở tự động Việc đó có thể trả lời các câu hỏi thành phần như: "Những kết quả được xuất bản tốt nhất được báo cáo về NIST 09 tập dữ liệu Trung Quốc sang tiếng Anh? "Và" Phương pháp quan trọng nhất để đẩy nhanh giải mã theo cụm từ là gì? " Câu trả lời cho các câu hỏi thường bao gồm các cuộc điều tra
về văn học hiện tại máy đọc các bài báo học thuật thường không xem xét thực nghiệm thực tế, nhưng chủ yếu tập trung vào việc hiểu các bài tóm tắt Chúng tôi mô tả công việc để giải thích và tạo ra một bài báo khoa học ban đầu kết quả thử nghiệm có bằng chứng gồm có 67 bài báo đã được chú thích theo cách thủ công với một cấu trúc đại diện của các kết quả thực nghiệm bởi các chuyên gia về tên miền Ngoài ra, chúng tôi trình bày một thuật toán cơ bản đặc trưng cho khó khăn nhiệm vụ suy luận
Từ khoá: Thu thập thông tin, Văn học khoa học, Dự báo có cấu trúc
1 Giới thiệu:
Các công nghệ hiện tại cho phép người ta tiếp cận khoa học với kho văn học thông qua nhiều phương tiện, trong phạm vi từ tìm kiếm từ khóa đơn giản cho nội dung và tác giả để các suy luận phức tạp khai thác đường trích dẫn (Dunneet al., 2010; Schafer và cộng sự, 2011), các kỹ thuật tự động xác định các phần và các nhãn phần (Teufel và Kan, 2011), và các phương pháp không được giám sát để suy luận thông tin cấu trúc (Kiela và cộng sự, năm 2015).Thật không may, các phương pháp thiếu đáp ứng nhiều câu hỏi có thể cải thiện đáng
kể các hoạt động hàng ngày của một nhà nghiên cứu
Hãy tưởng tượng, ví dụ, một nhà nghiên cứu trẻ muốn bắt đầu làm việc trên Máy Dịch (MT) hoặc một nhà nghiên cứu dày dạn muốn theo dõi sự phát triển gần đây trên đồng ruộng Họ muốn nhanh chóng nhận được câu trả lời cho những câu hỏi như:
Những kết quả xuất bản tốt nhất được báo cáo về Số liệu NIST-09 của Trung Quốc?
Theo thống kê hơn 100 triệu từ mà mô hình lấy cảm hứng từ hình thái học dẫn đến những cải tiến về chất lượng bản dịch
Các phương pháp quan trọng nhất để tăng tốc giải mã dựa trên cụm từ?
Có giấy tờ chứng minh rằng một bản dịch thần kinh là mô hình tốt hơn
so với mô hình không thần kinh?
Trang 2 Theo hiểu biết của chúng tôi, để trả lời các câu hỏi như vậy vượt quá ngoài tầm công nghệ Các phương pháp hiện tại vẫn chưa thể suy ra chính các yếu
tố của các thí nghiệm báo cáo trong các bài báo; như một vấn đề thực tế, không có sự nhất trí về những yếu tố này nên những mối quan hệ giữa chúng là gì
Trong bài báo này, chúng ta sẽ thực hiện một vài bước để giải quyết những vấn đề này còn hiếu sót Bằng cách tập trung vào MT như là trường mẫu nghiên cứu điển hình của chúng tôi, chúng tôi đề xuất một mô hình cấu trúc đại diện rõ ràng của các thí nghiệm điển hình: dữ liệu các nguồn được sử dụng để huấn luyện và kiểm tra, số liệu đánh giá, ngôn ngữ, thuật toán cơ
sở, phương pháp và các thuật toán các thí nghiệm, vv Chúng tôi cũng báo cáo công việc nhằm tạo ra một tiêu chuẩn cho công việc này và chúng tôi xem xét một tập hợp các thuật toán đơn giản mà chúng tôi phát triển như một đường cơ sở để mô tả một cách khách quan khó khăn của bài tập Bằng cách làm cho dữ liệu của chúng tôi và kết quả công khai, chúng tôi hy vọng đóng góp vào nỗ lực chuyển đổi trường khai thác thông tin từ xác định các
đề cập và quan hệ đơn giản để và lý luận với các cấu trúc phức tạp như sự kiện, kịch bản, và thí nghiệm
2 Đại diện có cấu trúc của các thí nghiệm dịch máy và xác định nhiệm vụ:
Để nắm bắt các yếu tố có ý nghĩa của các thí nghiệm trong các bài báo hội nghị dịch máy, chúng tôi thiết kế một mô tả cơ cấu các kết quả thực nghiệm Mặc dù điều này có thể được dùng làm tài liệu tham khảo để hiểu các thí nghiệm ở các lĩnh vực khác, chúng tôi đã cố ý thiết kế nó để trả lời các truy vấn có ý nghĩa về các bài báo Dịch Máy Nhiệm vụ tổng thể của chúng tôi là chuyển đổi một bài báo (Hình 1, đầu trang) vào một
đồ thị kết nối (dưới cùng) của các kết quả thực nghiệm Hình 1 cho thấy một ví dụ về một bài báo “dịch máy thống kê với các cụm từ ngôn ngữ mục tiêu được thống nhất hóa” (Marcu et al, 2006) Biểu diễn được cấu
trúc bao gồm các tập dữ liệu, loại thử nghiệm và kết quả Bộ dữ liệu là
tập sử dụng để đào tạo hoặc đánh giá các hệ thống Chúng tôi phân tích
bộ dữ liệu thành tên, kích thước và ngôn ngữ Ví dụ sử dụng bốn bộ dữ liệu, bao gồm cả tài liệu song song Trung-Anh và NIST 2002 Chỉ có tập
dữ liệu đầu tiên có kích thước quy định, 138.7 triệu từ, trong khi tất cả chúng đều sử dụng cặp ngôn ngữ Trung-Anh
Trang 3Hình 1: Một minh hoạ cho nhiệm vụ khai thác Bắt đầu với một bài báo khoa học (trên cùng), thông tin được trích ra để xây dựng một mô tả cơ cấu dữ liệu thử nghiệm (dưới cùng)
Trang 4 Kiểu thử nghiệm đề cập đến mục tiêu của thử nghiệm và phương pháp được sử dụng để đạt được Chúng tôi xác định 9 mục tiêu và 27 phương pháp Kết quả là kết quả thực nghiệm được trình bày trong bài báo, bao gồm giá trị số, số liệu và tên của hệ thống đã đạt được kết quả Trong Hình 1, chúng tôi đã tìm ra bốn giá trị (34.83, 31.46, 39.56, 34.10) với chỉ số BLEU
Hai giá trị kết quả được kết hợp với hệ thống PBMT và với hệ thống SPMT-Comb Giá trị kết quả được kết nối với bộ dữ liệu qua mối quan
hệ thử nghiệm hoặc train và với loại hình thử nghiệm Chúng tôi đề cập đến từng mẩu thông tin bao gồm biểu diễn được cấu trúc như nguyên tử Trong ví dụ, có 15 nguyên tử, bao gồm tiếng Trung-Anh, BLEU, 31.46
và 2002 NIST
3 Dữ liệu và Chú thích.
Để xây dựng bộ dữ liệu, chúng tôi bắt đầu bằng cách chọn các bài báo liên quan đến Dịch máy từ Thư viện Trung Quốc (Radev và cộng sự, 2009) bằng cách sử dụng tìm kiếm từ khóa và nhắm mục tiêu các hội thảo về Dịch Thuật Máy Đối với một mẫu ngẫu nhiên 67 bài báo, chúng tôi đã yêu cầu các nhân viên chú giải đưa ra một biểu diễn có cấu trúc các kết quả thực nghiệm như được xác định trong phần trước Để hỗ trợ khai thác thông tin được cấu trúc, chúng tôi tự động tạo ra một bản mô tả cấu trúc của mỗi bài báo Các đại diện bao gồm các văn bản đơn giản chia thành các phần và phần phụ, cũng như các bảng phân tích cú pháp
Số liệu chú thích được công bố cùng với báo cáo để thúc đẩy nghiên cứu trong tương lai Tổng cộng, 1063 nguyên tử đã được chú thích thống kê
số liệu bổ sung được thể hiện trong Bảng 1 Trong phần còn lại của phần này chúng tôi mô tả việc xây dựng bộ dữ liệu và chú thích một cách chi tiết hơn
Trang 5Avg Count St Dev
Mục lục Câu văn
7.55 3.76 272.55
1.38 1.78 89.65 Kết cấu thí nghiêm Tổng nguyên tử
Đào tạo/tập dữ liệu
Số liệu Kết quả Thí nghiệm
23.47 4.33 2.01 6.48 1.13
9.85 4.14 1.52 5.01 0.34
Bảng 1: Văn bản có cấu trúc và phản ứng khảo sát có ý nghĩa và độ lệch chuẩn
3.1 Chuyển đổi PDF sang Chuyển đổi Văn bản Có Cấu trúc
Điểm xuất phát là một tập các bài báo ở định dạng PDF Chúng tôi chuyển đổi giấy tờ dưới dạng PDF thành văn bản có cấu trúc sử dụng hệ thống bộ công cụ trích xuất văn bản (TET) Vì các bảng thường được sử dụng để báo cáo kết quả thực nghiệm, chúng tôi chú ý đặc biệt đến sự khai thác của chúng Chúng tôi trích ra các thông tin dạng bảng bằng TableSeer (Liuet al., 2007) Chúng tôi sử dụng ParsCit (Councill và cộng
sự, 2008) để tìm ra cấu trúc phân cấp của các phần và các phần phụ Chúng tôi tạo ra sự trình bày cuối cùng của các giấy tờ với một hệ thống kết hợp đầu vào của cả ba thành phần Quá trình tạo ra văn bản có cấu trúc, được chia thành các phần và các phần phụ với các bảng phân tích
cú pháp kèm phụ đề, nhưng không bao gồm các thông tin
3.2 Chú thích Đại diện Cấu trúc
Chú thích được trình bày với các giấy tờ ở định dạng PDF Lý tưởng nhất là các công cụ chú thích sẽ làm nổi bật các thông tin có liên quan trong bản tóm tắt và kết nối các mô hình được thể hiện Tuy nhiên, liên kết như vậy là rất tốn thời gian Thay vào đó, chúng tôi thiết kế một công
cụ chú giải khảo sát, thể hiện trong hình 2 Từ phản hồi của cuộc khảo sát, chúng tôi tạo ra các mô hình có cấu trúc xác định Chúng tôi thu thập các chú thích bằng cách gửi bản khảo sát cho các tác giả của các bài báo được lựa chọn và tự mình chú thích Từ phản hồi khảo sát, chúng tôi tạo
ra các đại diện có cấu trúc một cách xác định
Sáu tờ báo đã được chú thích bởi hai người chú thích Thoả thuận giữa các bên báo cáo về các tờ báo này được trình bày trong Bảng 3.Những người chú thích không thường xuyên đồng ý với các kỹ thuật, vì một bài
Trang 6báo có thể sử dụng nhiều kỹ thuật Sự khác biệt về từ vựng trong đặt tên một tập dữ liệu hoặc một hệ thống cũng gây ra sự bất đồng Được hướng dẫn để chọn hiệu suất hàng đầu và cơ sở cho mỗi đánh giá quan trọng, mọi người đôi khi chọn các thí nghiệm khác nhau
Đi đôi
21.3 76.3
94.7 81.7
37.8 81.3
100.0 100.0
Tên
20.1 24.3
28.9 25.0
23.7 24.6
67.1 41.8
Số liệu Tên
7.1 35.5 7.1
84.7 83.6 16.0
13.0 49.8 9.9
92.2 92.4 46.7 Kết cấu thí nghiệm Mục tiêu
Công nghệ
72.6 24.2
65.2 22.7
68.7 23.4
-Bảng 2: Hiệu suất của máy dò nguyên tử theo độ chính xác, thu hồi, và điểm F1, và tái thiết từ điều tra đáp ứng (R *)
4 Phương pháp tiếp cận hệ thống đường cơ sở:
Chúng tôi trình bày một hệ thống dựa trên các mẫu, trích xuất các phần tử riêng
lẻ từ một bản mô tả văn bản thuần bằng văn bản dịch máy và chọn , liên kết chúng thành một biểu diễn có cấu trúc
4.1 Phát hiện nguyên tử:
Trong phát hiện nguyên tử, hệ thống tạo ra danh sách các ứng cử viên cho mỗi loại nguyên tử Mục tiêu của việc phát hiện nguyên tử là phát hiện càng nhiều nguyên tử càng tốt để có thể cho phép các bước tiếp theo trong hệ thống lựa chọn giữa nhiều ứng cử viên Việc phát hiện bao gồm các chuỗi con, các từ chồng chéo và các mẫu phân bố phù hợp trong văn bản hoặc bảng
Số liệu ngôn ngữ phù hợp với một danh sách các ngôn ngữ đã được xác định trước đối với văn bản Danh sách bao gồm hai và ba chữ viết tắt của ký tự
Số liệu kích thước tập dữ liệu được dựa trên mẫu biểu thức chính quy phù hợp với các biểu thức, chẳng hạn như các cặp câu '8M Sentence.' Các mẫu này bao gồm một đơn vị (như ở trên) hoặc đơn vị, ví dụ: '8M.'
Số liệu tên tập dữ liệu khớp với danh sách được sắp xếp của bộ dữ liệu bản dịch máy đã biết trong văn bản Nhiều cách hiển thị bộ dữ liệu được mã hoá bằng các mẫu biểu thức chính quy
Trang 7 Hệ thống số liệu tìm thấy các ứng cử viên trong bảng kết quả, không bao gồm
số và từ khoá cụ thể
Số liệu giá trị kết quả thu thập các ô số trong các bảng kết quả, chẳng hạn như 24,3, 12%
Số liệu kết quả được dựa trên một danh sách các số liệu chung được sử dụng trong bản dịch máy như đánh giá song ngữ
Số liệu mục tiêu và số liệu công nghệ kết hợp các bảng liệt kê trước
4.2 Liên kết
Liên kết bao gồm hai giai đoạn: (1) liên kết các nguyên tử vào cấu trúc trung gian và (2) liên kết các cấu trúc trung gian vào cấu trúc kết cấu cuối Ở giai đoạn đầu tiên, các nguyên tử riêng lẻ được chọn và liên kết với nhau để tạo thành một cấu trúc đại diện cho một tập dữ liệu, một loại thử nghiệm, hoặc một kết quả Ở giai đoạn này, nhiều nguyên tử có sẵn để liên kết và một quá trình lựa chọn được thực hiện trên các nguyên tử để tạo ra các cấu trúc trung gian làm ứng cử viên Trong giai đoạn thứ hai, một quá trình lựa chọn sau đó được thực hiện trên cấu trúc trung gian để tạo ra cấu trúc kết cấu cuối cùng diễn tả cho một tờ báo
Số liệu:
Chúng ta chọn cặp ngôn ngữ dựa trên tần số, và chúng ta tìm ra tên tập tin và kích thước nguyên tử gần nhất Chúng tôi chọn nhãn cạnh bằng cách tìm kiếm các từ khoá như 'train' và 'test' ở gần nhau
Kết quả
Chúng tôi xây dựng các cấu trúc kết quả từ các bảng, sử dụng các cột, hàng, và chú thích các bảng Chúng tôi liên kết nguyên tử tên hệ thống và các nguyên tử
số liệu kết quả tìm thấy ở hàng đầu hoặc cột thứ nhất
Kết hợp:
Bộ dữ liệu được liên kết đến kết quả dựa trên các phép đo và tín hiệu gần nhau
từ văn bản, ví dụ như đề cập đến ngôn ngữ hoặc tên tập dữ liệu trong chú thích hoặc các ô bên cạnh Chúng tôi giới hạn mỗi kết quả cho một tập dữ liệu thử nghiệm đơn lẻ, nhưng cho phép nhiều tập dữ liệu training lại
PBMT Ngôn ngữ Phương pháp
thí nghiệm
BLEU Gia đoạn kiểm tra
Trang 8english MIRA
PRO
20.5 20.4
17.9 18.2 MIRA
PRO
21.8 21.6
17.8 18.1
Hình 3: Tên hệ thống được chú thích là 'PBMT basic PRO'
Đường cơ sở Nguyên tử
S-Dữ liệu S-Kết quả S-Tổng
0.35 0.51 0.54 0.58
0.18 0.40 0.31 0.34
0.22 0.40 0.34 0.39 Chú thích Nguyên tử
S-Dữ liệu S-Kết quả S-Tổng
0.44 0.66 0.77 0.68
-0.66 0.67 0.68
-0.64 0.73 0.65
Bảng 3: Liên kết các kết quả đánh giá hiệu quả về điểm chính xác, thu hồi và F1 Smatch Trong trường hợp nguyên tử, chính xác, thu hồi, và F1 của các nguyên tử được chọn sau liên kết được hiển thị
5 Đánh giá
Dữ liệu:
Từ những dữ liệu thu thập, 5 giấy tờ được sử dụng để phát triển, và 62 giấy tờ được sử dụng để đánh giá
Số liệu đánh giá:
Chúng tôi đánh giá hiệu suất của hệ thống phát hiện nguyên tử với độ chính xác
và gọi về Chúng tôi tiếp cận đánh giá của các đại diện được cấu trúc có liên kết bằng cách biến nó thành một đồ thị theo chu kỳ và tính điểm Smatch (Cai và Knight, 2013), trước đây được sử dụng để đánh giá sự tương tự giữa cấu trúc biểu diễn ý nghĩa trừu tượng (AMR)
5.1 Đánh giá phát hiện các nguyên tử
Bảng 2 cho thấy hiệu suất của sự phát hiện nguyên tử Vì các công cụ chú thích không cho chúng tôi biết thông tin ở đâu, chúng tôi ghép các nguyên tử được chú thích với mỗi chuỗi con trong văn bản có cấu trúc và ghi chú thích hiện tại
từ văn bản dưới dạng R * trong bảng 2 Điều này thể hiện một mức mềm cho
Trang 9cách tiếp cận cơ bản của chúng tôi Tìm tên tập tin có chú giải, kích thước và tên của nguyên tử hệ thống đã gặp nhiều thách thức do chữ viết tắt, lỗi chuyển đổi PDF sang văn bản, tên đa dạng từ vựng và mở rộng, cũng như các giá trị trích xuất bao gồm các chuỗi rải rác, như thể hiện trong hình 3 Các vấn đề này vẫn tồn tại trong phát hiện nguyên tử
Kết quả:
Các máy dò song ngôn ngữ đạt được sự thu hồi cao Giá trị kết quả và máy dò
số liệu cũng đạt được thu hồi cao ngang bằng với R * Tên bộ định danh và bộ
dò số liệu đạt được khoảng một nửa số lần thu hồi Tên bộ định danh và bộ dò
số liệu đạt được khoảng một nửa số lần thu hồi vàng Ngay cả khi họ không trích xuất toàn bộ tên một cách chính xác, họ thường bắt một chuỗi con Tên và kích thước bộ dữ liệu có thể được biểu diễn bằng nhiều cách – đầu ra của hệ thống có thể khác với chú thích
Những thách thức chưa được giải quyết
Trình dò cặp ngôn ngữ gặp khó khăn với các cụm từ như 'dịch tiếng Anh sang tiếng Nhật và tiếng Thổ Nhĩ Kỳ,' chỉ phát hiện ra tiếng Anh - tiếng Nhật 'Tên
mở rộng này cũng sẽ xảy ra trong tên tập dữ liệu Giải thích chính xác thông tin trong các bảng, nơi mà thông tin được trình bày một cách có cấu trúc tương tự như hình 3 cũng là vấn đề thú vị cần giải quyết Đối với dữ liệu, các lỗi chủ yếu
do nhiều cách để thể hiện tên và kích thước tập dữ liệu (ví dụ MT03-MT08 đề cập đến tập hợp 6 bộ dữ liệu) Ngoài ra, các bộ dữ liệu không tên mới được liên tục giới thiệu trong tài liệu Việc phát hiện tên hệ thống thậm chí còn khó khăn hơn, vì không có quy ước đặt tên Phát hiện mục tiêu và công nghệ của một bài báo đạt được sự thu hồi bình thường Vấn đề thách thức này là một trọng tâm của nghiên cứu bởi chính nó (ví dụ như Gupta và Manning (2011))
5.2 Đánh giá kết nối :
Hiệu suất liên kết được trình bày trong Bảng 3 Như là một điểm tham khảo, chúng tôi trình bày điểm số tính giữa hai cột chú thích như 'Inter-Annotator.' Phân tích cho thấy rằng hệ thống có thể phát hiện điểm số BLEU ghi điểm cao nhất trên cặp ngôn ngữ chính xác, nhưng đôi khi không phục hồi được tên của datasets hoặc hệ thống Ví dụ, trong ví dụ trong hình 1, hệ thống có thể phát hiện ra tất cả bốn giá trị kết quả và tên PBMT và liên kết chính xác đến cặp ngôn ngữ và số liệu, nhưng nó không thể truy xuất tên SPMT Hơn nữa, kết nối chính xác một kết quả với một tập hợp các tập đoàn đào tạo là một thách thức chỉ có thể được giải quyết bằng sự hiểu biết phụ thuộc trong tài liệu Mặc dù nó
Trang 10là có thể liên kết tập con của tập dữ liệu, hệ thống thường không phục hồi tên đầy đủ được mở rộng của bộ dữ liệu Ví dụ trong hình 1, hệ thống có thể lấy NIST như cả hai thử nghiệm và dữ liệu huấn luyện, nhưng không nêu rõ năm Chú thích
BLEU: thuật toán đánh giá chất lượng của văn bản đã được dịch máy
MT: Machine Translation
6 Các công trình liên quan:
Tự động xử lý văn học khoa học đang nhận sự chú ý ngày càng gia tăng Các nhà nghiên cứu tập trung vào việc trích xuất thông tin từ tóm tắt, tiêu đề và trích dẫn Ở đây có là những nỗ lực để tạo ra tóm lược khai thác (Abu-Jbara và Radev, năm 2011; Qazvinian và cộng sự, 2013) và các luồng khoa học ý tưởng (Shahaf và cộng sự, 2012) Phân tích các giấy tờ cá nhân(Tsai và cộng sự,
2013, Gupta và Manning, 2011, Kiela và cộng sự,2015) tập trung chủ yếu vào các tóm tắt J Hutchins đã biên soạn thủ công một kho lưu trữ văn bản dịch máy điện tử Ông phân loại 11.500 các giấy tờ theo phương pháp, cặp ngôn ngữ, hệ thống, ngôn ngữ học các khía cạnh, v.v… Đối với các ứng dụng của các phân tích tự động, iOpener dự án (Dunne et al., 2012; Dunne et al., 2010)
và Schaferet al (2011) trình bày mối liên kết lexical bibliometric, các kỹ thuật tổng hợp, và các công cụ trực quan Tập trung về siêu dữ liệu như từ khóa, tác giả, tổ chức, hội nghị tên và trích dẫn
7 Kết luận và công việc tương lai:
Trình bày thông tin thực nghiệm từ các bài báo khoa học trong một đại diện có cấu trúc hỗ trợ truy vấn sẽ giúp các nhà nghiên cứu hiểu văn học khoa học Đến kết thúc này, chúng tôi đề xuất một nhiệm vụ mới là tự động trích ra thông tin thực nghiệm từ các bài báo khoa học Chúng tôi tập trung vào lĩnh vực dịch máy, mà chúng tôi tạo ra một mô hình có cấu trúc thu thập thông tin thực nghiệm Chúng tôi tạo một tập dữ liệu gồm 67 giấy tờ MT với thông tin thực nghiệm đã được chú thích theo cách thủ công trong các đại diện có cấu trúc Tập dữ liệu có sẵn tại https://github.com/eunsol/mt lit lrec16.git Cuối cùng, chúng tôi đánh giá một hệ thống cơ sở đơn giản, thể hiện một số những thách thức để tự động khai thác thông tin thực nghiệm Chúng bao gồm việc tìm kiếm
và giải quyết các thông tin có cấu trúc trong bảng, giải quyết sự biến đổi về từ vựng và giải quyết kết nối đường dài Công việc trong tương lai có thể khám phá kiến thức về lĩnh vực dưới hình thức như phạm vi kết quả cho các số liệu, cũng như sử dụng biên dịch thủ công