Đã có ứng dụng phát hiện nội dung ChatGPT tạo ra, giả dạng con người

29/07/2023 14:00

Edward Tian đã xây dựng nguyên mẫu cho GPTZero, công cụ phát hiện ChatGPT, trong phòng ký túc xá ở ĐH Princeton (Hoa Kỳ), khi thế giới có vẻ say mê ChatGPT còn Tian lo khó phát hiện nội dung giả dạng do con người viết nhưng thực chất bởi AI tạo ra.

*Edward Tian (phải), người sáng lập GPTZero*

Anh chàng 22 tuổi nói ChatGPT xuất hiện mang lại cảm giác giống như mở chiếc hộp Pandora vậy, bất ngờ xuất hiện và có nhiều khả năng bị lạm dụng. GPTZero đã thu hút được 1,2 triệu người dùng chỉ trong năm tháng. Công ty cũng đã huy động được 3,5 triệu USD tài trợ.

GPTZero quét văn bản bằng mô hình ngôn ngữ lớn của riêng ứng dụng này, một tập hợp các mô hình AI nguồn mở khác. GPTZero được đào tạo về cả văn bản do con người và AI tạo ra, bao gồm các bài báo cũng như câu hỏi và trả lời.

Bằng cách học hỏi từ các mô hình AI tổng quát hiện có, công cụ này tính toán và dự đoán xác suất của các từ trong một câu do AI tạo ra. Nó cũng phân tích các mẫu văn bản bằng cách sử dụng cú pháp và độ dài câu để xác định văn bản do máy tạo và làm tốt điều đó dù Tian nói cần cải thiện.

Vì kết quả đầu ra của chatbot phụ thuộc vào dữ liệu được cung cấp nên công cụ này đôi khi có thể nhầm lẫn nội dung của con người là do AI viết và ngược lại. Đó là lý do GPTZero sử dụng cả máy học và sức lao động của con người để tạo lại nội dung từ các chương trình AI khác nhau, đảm bảo rằng nó sẽ phát hiện văn bản do AI tạo ra với độ chính xác ngày càng cao.

GPTZero có thể phát hiện văn bản từ nhiều mô hình AI khác nhau, trong đó có LaMDa của Google, LLaMa của Facebook, GPT-3 và GPT-4 của OpenAI. GPTZero đã hợp tác với các tổ chức giáo dục Canvas và K16 Solutions để thu thập dữ liệu đào tạo cho công cụ phát hiện AI của mình. Các nhà giáo dục nhận thấy ứng dụng thực sự hữu ích khi phát hiện các bài luận của học sinh dùng ChatGPT.

Và còn có nhiều ứng dụng ngoài giáo dục. Công ty đã có kế hoạch tiếp thị dịch vụ của mình cho khách hàng doanh nghiệp trong lĩnh vực xuất bản, phương tiện truyền thông xã hội, các công ty làm việc liên quan đến sự tin cậy và an toàn.

Tian nói cũng xem chính phủ là khách hàng tiềm năng, có thể sử dụng công cụ phát hiện AI để xây dựng chính sách. Công ty đã có 3.000 người đăng ký trả phí cho gói 9,99 USD/tháng.

Công ty khởi nghiệp sẽ sớm ra mắt trình duyệt có tên Origin để đánh giá tính chính xác và nguồn gốc của các sự kiện trong một đoạn văn bản đã xuất bản nhất định. Với Origin, Tian hy vọng sẽ hỗ trợ kiến thức truyền thông trong thời đại trí tuệ nhân tạo bằng cách kiểm tra nội dung, xác minh các trích dẫn cho nội dung do AI tạo ra.

Theo Tuổi trẻ