Similarity score đo mức trùng lặp văn bản so với một cơ sở dữ liệu đối chiếu: đây là chỉ số so khớp, chưa phải kết luận đạo văn.
Similarity score đo mức trùng lặp văn bản so với một cơ sở dữ liệu đối chiếu: đây là chỉ số so khớp, chưa phải kết luận đạo văn. AI score ước lượng mức độ dễ đoán về mặt thống kê của câu chữ bạn viết, một xác suất cho thấy văn bản giống văn do máy tạo, và chưa phải bằng chứng bạn đã dùng AI (Foltýnek et al., 2020; Liang et al., 2023). Hai con số trả lời hai câu hỏi hoàn toàn khác nhau, và tự thân mỗi con số đều chưa đủ để kết luận vi phạm liêm chính học thuật.
Tác giả: MAAS Academic Skills Publishing Desk · Hiệu đính bởi một Principal Academic Mentor
Cập nhật lần cuối: 2026-07-04
Category: writing-tips
SIMILARITY SCORE THỰC SỰ ĐO ĐIỀU GÌ?
Trả lời trực tiếp: Similarity score là tỷ lệ phần trăm văn bản bạn nộp mà công cụ so khớp văn bản tìm thấy trùng hoặc gần trùng với văn bản đã có sẵn trong cơ sở dữ liệu đối chiếu của nó, gồm bài của sinh viên khác, tạp chí khoa học, website và sách. Đây là một phép tính trùng lặp từ vựng thuần túy, chưa đánh giá tính nguyên bản hay ý định của người viết, và được tạo ra theo cùng một cách bất kể lý do khiến văn bản trùng khớp là gì.
Bằng chứng: Một nghiên cứu so sánh quy mô lớn, chi tiết về phương pháp, trên mười lăm hệ thống so khớp văn bản trực tuyến đã kết luận rằng phần mềm loại này không thể xác định đạo văn có xảy ra hay không; nó chỉ có thể đánh dấu những đoạn tương đồng có thể cấu thành đạo văn, và mọi match đều cần con người thẩm định mới diễn giải được (Foltýnek et al., 2020). Hướng dẫn liêm chính học thuật của University of Melbourne cũng xem một kết quả similarity cao là tín hiệu để rà soát thêm, chưa phải bằng chứng tự thân, vì trích dẫn trực tiếp nhiều nhưng đúng quy cách vẫn có thể đẩy tỷ lệ phần trăm lên ngang với sao chép không ghi nguồn (University of Melbourne, n.d.-a).
Vì sao điều này quan trọng: Vì con số được tính hoàn toàn máy móc, một tỷ lệ cao vẫn có thể hoàn toàn vô hại: danh mục tài liệu tham khảo dài, các câu trích nguyên văn, hay cụm thuật ngữ chuẩn của ngành đều bị đếm là "match" ngay cả khi đã được trích dẫn đầy đủ và chính xác. Bài đồng hành về ý nghĩa thực của similarity score hướng dẫn cách đọc báo cáo theo từng match một.
AI SCORE THỰC SỰ ĐO ĐIỀU GÌ?
Trả lời trực tiếp: Chỉ báo AI-writing ước lượng xác suất một đoạn văn được tạo ra hoặc paraphrase bởi một hệ thống AI, dựa trên các mẫu thống kê trong chính câu chữ, chủ yếu là mức độ dễ đoán của từng lựa chọn từ (perplexity) và mức độ biến thiên của độ dài câu và cấu trúc câu (burstiness). Nó hoàn toàn không so văn bản của bạn với bất kỳ nguồn bên ngoài nào; nó đánh giá "dấu vân tay" thống kê bên trong của chính bài viết.
Bằng chứng: Hướng dẫn của University of Melbourne mô tả chỉ báo AI là tỷ lệ phần bài nộp mà công cụ tính ra "khả năng từ 98% trở lên" đã được AI tạo hoặc paraphrase, tức một ước lượng xác suất tính từ bên trong, chưa phải một dữ kiện đối chiếu được với nguồn (University of Melbourne, n.d.-b). Vì ước lượng này dựa trên một mô hình thống kê thay vì tra cứu cơ sở dữ liệu, độ chính xác của nó khác về bản chất, và theo bằng chứng hiện có thì kém ổn định hơn, so với một phép tính so khớp (Weber-Wulff et al., 2023).
Vì sao điều này quan trọng: Một similarity score có thể kiểm chứng bằng cách đối chiếu với nguồn cụ thể. Một AI score thì không kiểm chứng được theo cách đó: không có tài liệu gốc nào để chỉ vào, chỉ có một xác suất mà mô hình gán cho một mẫu câu chữ. Chính khác biệt này khiến hai con số không thể đọc bằng cùng một thước đo trong đầu.
VÌ SAO HAI CHỈ SỐ ĐƯỢC TÍNH THEO HAI CÁCH HOÀN TOÀN KHÁC NHAU?
Trả lời trực tiếp: Kiểm tra similarity là một bài toán truy xuất và đối chiếu: hệ thống tìm trong kho tham chiếu các nguồn ứng viên, rồi dóng văn bản của bạn với các nguồn đó để đo mức trùng lặp. Phát hiện AI là một bài toán phân loại: hệ thống không có tài liệu tham chiếu nào để tìm, nên nó chấm "kết cấu" thống kê bên trong câu chữ của chính bạn dựa trên các mẫu học được từ văn bản đã biết là do người viết và do máy viết. Một phương pháp nhìn ra ngoài, vào các tài liệu khác; phương pháp kia nhìn vào trong, vào phong cách viết của bạn.
Bằng chứng: Các tổng quan hệ thống về nghiên cứu phát hiện đạo văn mô tả so khớp văn bản là quy trình hai bước, truy xuất nguồn ứng viên rồi dóng hàng chi tiết với một kho tham chiếu lớn (Foltýnek et al., 2020). Ngược lại, các AI detector dựa trên những tín hiệu rút từ mô hình ngôn ngữ như perplexity và burstiness thay vì bất kỳ phép đối chiếu kho dữ liệu nào, và kiểm định độc lập cho thấy độ chính xác của chúng giảm mạnh chỉ sau vài chỉnh sửa nhẹ lên văn bản, một điểm yếu không có tương đương ở phía so khớp, vì so khớp không phụ thuộc vào việc mô hình hóa "AI viết như thế nào" (Weber-Wulff et al., 2023).
Vì sao điều này quan trọng: Vì hai cơ chế không giao nhau, một tài liệu có thể điểm cao ở chỉ số này và thấp ở chỉ số kia vì những lý do hoàn toàn không liên quan. Một bài literature review trích dẫn dày đặc, ghi nguồn tỉ mỉ có thể mang similarity score cao và AI score thấp. Một đoạn văn ngắn, mộc mạc, cấu trúc đều đặn do chính sinh viên viết từ đầu có thể có similarity score gần bằng không mà vẫn kích hoạt cờ AI.
ĐIỂM CAO Ở MỘT TRONG HAI CHỈ SỐ KHÔNG CHỨNG MINH ĐIỀU GÌ?
Trả lời trực tiếp: Cả hai chỉ số đều chưa phải bằng chứng vi phạm. Một kết quả similarity cao thường phản ánh phần trích dẫn đúng quy cách thay vì hành vi sao chép. Một kết quả AI-writing cao thường phản ánh văn người thật viết nhưng tình cờ quá đều đặn, một đặc điểm phổ biến ở văn học thuật cẩn thận hoặc văn của người viết bằng ngôn ngữ thứ hai, chứ không dành riêng cho văn máy.
Bằng chứng: Hướng dẫn liêm chính học thuật nói rõ rằng một kết quả similarity cao "tự nó không nên bị xem là bằng chứng một vi phạm đánh giá đã xảy ra", vì trích dẫn nhiều nhưng đúng quy cách tạo ra cùng một con số tổng như sao chép không ghi nguồn (University of Melbourne, n.d.-a). Ở phía AI, cùng bộ hướng dẫn đó yêu cầu giảng viên cân nhắc liệu văn phong của sinh viên có thiên về "đều đặn, theo lối mòn hay công thức" hay không, vì đặc điểm ấy làm tăng khả năng false positive thay vì chỉ ra việc dùng AI (University of Melbourne, n.d.-b). Một nghiên cứu bình duyệt trên nhiều AI detector phổ biến phát hiện chúng phân loại nhầm các bài luận thật của người viết tiếng Anh không phải bản ngữ thành văn AI với tỷ lệ cao hơn hẳn so với bài của người bản ngữ (Liang et al., 2023). Lý do khả dĩ là lối viết mộc, đồng đều mà nhiều người viết ngôn ngữ thứ hai được dạy lại chính là thứ kéo thấp tín hiệu perplexity mà các detector này đọc như dấu hiệu của văn máy.
Vì sao điều này quan trọng: Với sinh viên ESL và du học sinh Việt nói riêng, những thói quen giúp văn ngôn-ngữ-thứ-hai rõ ràng và an toàn về ngữ pháp, gồm câu ngắn hơn, từ vựng giản dị hơn, cấu trúc nhất quán, cũng chính là những thói quen về mặt thống kê giống đầu ra của AI. Đó là hạn chế đã được ghi nhận của phương pháp phát hiện, chứ không phản ánh bài luận thực sự được viết ra như thế nào. Bài đồng hành về vì sao bài tự viết vẫn bị flag là AI giải thích cơ chế này sâu hơn.
CÁC TRƯỜNG ĐƯỢC KHUYẾN NGHỊ XỬ LÝ TỪNG CHỈ SỐ NHƯ THẾ NÀO?
Trả lời trực tiếp: Như điểm khởi đầu cho phán đoán của con người, chứ chưa bao giờ là phán quyết tự động. Cả kết quả similarity lẫn AI-writing đều được thiết kế để gợi mở một lượt xem xét kỹ hơn bởi một con người, và quy trình liêm chính học thuật nhìn chung đòi hỏi bằng chứng bổ trợ trước khi đưa ra bất kỳ kết luận vi phạm nào dựa trên một trong hai chỉ số.
Bằng chứng: Hướng dẫn dành cho giảng viên của University of Melbourne viết thẳng rằng "một điểm AI detection cao, tự nó, không cấu thành căn cứ để cáo buộc vi phạm liêm chính học thuật", đồng thời liệt kê các bằng chứng bổ sung cần tìm, như sự bất nhất so với bài trước đây của sinh viên hay metadata bất thường của file, trước khi tiến hành (University of Melbourne, n.d.-b). Nguyên tắc tương tự áp cho kết quả similarity, mà theo hướng dẫn phải được "cân với các bằng chứng khác" thay vì bị coi là kết luận tự thân (University of Melbourne, n.d.-a). Kiểm định độc lập trên các công cụ phát hiện đi đến kết luận song song từ phía nghiên cứu: công cụ tự động có thể hỗ trợ một cuộc điều tra, nhưng tự chúng không thể xác định vi phạm có xảy ra hay không (Foltýnek et al., 2020; Weber-Wulff et al., 2023).
Vì sao điều này quan trọng: Nếu quy trình của trường bạn vận hành đúng thiết kế, một con số trên báo cáo sẽ mở ra một cuộc trao đổi, chứ không dẫn thẳng đến hình phạt. Biết trước điều đó giúp quá trình bớt giống một lời buộc tội và trở về đúng bản chất của nó: một bước kiểm tra.
BẠN NÊN LÀM GÌ NẾU BỊ FLAG Ở MỘT TRONG HAI CHỈ SỐ?
Trả lời trực tiếp: Phản hồi bình tĩnh, hỏi chính xác điều gì đã được báo cáo, và chuẩn bị trình bày quá trình làm bài thay vì tranh cãi với con số. Với cờ similarity, tự rà từng match và phân loại đâu là trích dẫn, tài liệu tham khảo hay cụm từ chuẩn của ngành, đâu là trùng lặp thật sự chưa ghi nguồn. Với cờ AI, thu thập bằng chứng về quyền tác giả, như lịch sử bản nháp, ghi chú, dàn ý và các nguồn có chú thích, vì loại bằng chứng này trả lời được câu hỏi mà điểm số thống kê không trả lời được.
Bằng chứng: Hướng dẫn cho cả hai loại cờ đều coi chúng là lời mời xem xét thay vì kết luận, và cho phép sinh viên giải thích quá trình làm bài, cung cấp bản nháp, hoặc trao đổi về cách bài được thực hiện trước khi bất kỳ cáo buộc nào được đưa ra (University of Melbourne, n.d.-a, n.d.-b). Vì độ chính xác của AI detection được ghi nhận là thiếu nhất quán, đặc biệt với người viết tiếng Anh không phải bản ngữ, một vệt bản nháp được lưu lại đầy đủ là cách trả lời mạnh nhất và trực tiếp nhất cho một cờ mà điểm số thống kê tự nó không giải quyết được (Liang et al., 2023; Weber-Wulff et al., 2023).
Vì sao điều này quan trọng: Hiểu mình bị flag ở chỉ số nào sẽ thay đổi loại bằng chứng thực sự liên quan. Cờ similarity được trả lời bằng cách chỉ vào trích dẫn. Cờ AI được trả lời bằng cách cho thấy bài đã được viết ra sao. Nhầm lẫn hai loại này làm mất thời gian lẽ ra dành cho việc trả lời đúng câu hỏi đang được đặt ra.
MAAS HỖ TRỢ BẠN HIỂU ĐÚNG BÁO CÁO, KHÔNG HỖ TRỢ ĐƯỜNG TẮT
Nếu một báo cáo similarity hay AI-writing khiến bạn chưa chắc nó thực sự nói gì về bài của mình, hỗ trợ liêm chính học thuật của MAAS có thể giúp bạn đọc đúng kết quả: phân biệt vấn đề thật với những hiệu ứng phát sinh từ cách tính của từng chỉ số, chỉ ra chỗ cần chỉnh so với chỗ vốn đã ổn, và định hướng cách bạn dùng AI một cách có trách nhiệm trong học tập. Mentor có thể đặt câu hỏi, chỉ ra nơi thiếu trích dẫn và phản hồi lập luận của bạn, còn bài làm vẫn là của bạn: MAAS định hướng, hỏi, phản hồi; KHÔNG viết, sửa hay nộp thay bạn.
Câu hỏi thường gặp
Một bài có thể vừa có similarity score cao vừa có AI score thấp không?
Có, và điều này phổ biến. Một bài literature review trích dẫn dày đặc, ghi nguồn cẩn thận có thể hiện tỷ lệ similarity cao từ các câu trích và tài liệu tham khảo được so khớp, trong khi điểm khả năng AI-writing vẫn thấp, vì hai chỉ số đo hai thứ không liên quan (Foltýnek et al., 2020).
Một bài có thể có similarity score thấp nhưng AI score cao không?
Có. Văn bản có thể hoàn toàn nguyên bản theo nghĩa không trùng với bất kỳ nguồn nào sẵn có, nhưng vẫn đủ đồng đều về mặt thống kê để kích hoạt chỉ báo AI-writing, vì chỉ báo này hoàn toàn không kiểm tra nguồn trùng khớp (University of Melbourne, n.d.-b).
Chỉ số nào đáng tin cậy hơn?
Chúng thiếu tin cậy theo những cách khác nhau. So khớp similarity có thể bỏ sót đạo văn đã paraphrase và cũng có thể đánh dấu tài liệu trích dẫn đúng quy cách là "match". AI detection có thể phân loại nhầm văn người thật viết, và độ chính xác được ghi nhận là còn giảm thêm khi văn bản chỉ được chỉnh sửa nhẹ (Weber-Wulff et al., 2023). Cả hai đều không được thiết kế để đọc như một phán quyết độc lập.
Vì sao người viết tiếng Anh không phải bản ngữ hay bị flag ở AI score hơn?
Vì những thói quen viết thường được dạy cho người viết ngôn ngữ thứ hai, như câu ngắn hơn, từ vựng giản dị hơn và cấu trúc nhất quán, về mặt thống kê giống với mẫu ít biến thiên mà các AI detector gắn với văn máy. Một nghiên cứu bình duyệt tìm thấy tỷ lệ false positive cao hơn đáng kể ở người viết tiếng Anh không phải bản ngữ so với người bản ngữ (Liang et al., 2023).
Trích dẫn có xử lý được cờ AI-writing như cách nó xử lý một similarity match không?
Không. Trích dẫn giải quyết được một similarity match vì similarity xoay quanh việc ghi nguồn cho phần văn bản trùng khớp. Cờ AI-writing không liên quan đến trích dẫn thiếu; nó là ước lượng thống kê về cách văn bản được tạo ra, nên câu trả lời phù hợp là bằng chứng về quá trình soạn thảo của chính bạn, chứ không nằm ở danh mục tài liệu tham khảo.
Có nên đổi văn phong để tránh bị flag AI không?
Đừng bóp méo bài làm để "qua mặt" một detector. Hãy tập trung vào quyền tác giả thực sự và giữ lại bằng chứng tự nhiên về quá trình làm bài, như các bản nháp và ghi chú. Các trường xem cả hai chỉ số như lời gợi mở cho một cuộc trao đổi giữa người với người, chứ không xem đó là mục tiêu để tối ưu ngược.
MAAS có thể diễn giải báo cáo similarity và AI-writing giúp tôi không?
Có. Một mentor của MAAS có thể cùng bạn đi qua cả hai báo cáo, giải thích mỗi con số đang đo và không đo điều gì, và giúp bạn xác định phần nào trong bài thực sự cần xử lý, hoàn toàn không viết hay chỉnh sửa hộ bài làm.
Tài liệu tham khảo
- Foltýnek, T., Dlabolová, D., Anohina-Naumeca, A., Razı, S., Kravjar, J., Kamzola, L., Guerrero-Dib, J., Çelik, Ö., & Weber-Wulff, D. (2020). Testing of support tools for plagiarism detection. International Journal of Educational Technology in Higher Education, 17, Article 46. https://doi.org/10.1186/s41239-020-00192-4
- Liang, W., Yuksekgonul, M., Mao, Y., Wu, E., & Zou, J. (2023). GPT detectors are biased against non-native English writers. Patterns, 4(7), Article 100779. https://doi.org/10.1016/j.patter.2023.100779
- University of Melbourne. (n.d.-a). Advice for students regarding Turnitin and AI writing detection. Academic Integrity. Retrieved July 4, 2026, from https://academicintegrity.unimelb.edu.au/plagiarism-and-collusion/advice-for-students-regarding-turnitin-and-ai-writing-detection
- University of Melbourne. (n.d.-b). Turnitin's AI writing detection tool. Academic Integrity. Retrieved July 4, 2026, from https://academicintegrity.unimelb.edu.au/staff-resources/turnitins-ai-writing-detection-tool
- Weber-Wulff, D., Anohina-Naumeca, A., Bjelobaba, S., Foltýnek, T., Guerrero-Dib, J., Popoola, O., Šigut, P., & Waddington, L. (2023). Testing of detection tools for AI-generated text. International Journal for Educational Integrity, 19, Article 26. https://doi.org/10.1007/s40979-023-00146-z
Bài viết này là hướng dẫn về liêm chính học thuật, không thay thế bài làm của chính bạn hay chính sách của trường bạn. MAAS đồng hành để sinh viên tạo ra sản phẩm thực sự của mình theo mô hình Outline → Draft → Final; MAAS không viết, không nộp và không che giấu bài làm thay cho sinh viên.
