Bài thi vấn đáp trở lại khi AI phát triển

Các kỳ thi vấn đáp đang trở lại khi ChatGPT tác động vào giáo dục, khiến bài luận không còn hiệu quả để đo lường chất lượng học tập như trước.

Với sự bùng nổ của các chatbot AI như ChatGPT từ 2022, một bài luận có thể được thực hiện dễ dàng chỉ sau một cú nhấp chuột. Để tìm kiếm các giải pháp đánh giá sinh viên hiệu quả hơn thay thế cho bài luận trong bối cảnh đó, các kỳ thi vấn đáp đang trở lại.

Vấn đáp là cách đánh giá có tính truyền thống. Vào những năm 1600, thi vấn đáp là hình thức đánh giá cơ bản tại các trường như Oxford và Cambridge. Đó cũng là cách các triết gia cổ đại như Socrates đã làm. Đánh giá vấn đáp hiện được thực hiện chủ yếu trong các buổi bảo vệ luận án sau đại học, hoặc một số bài kiểm tra trong các môn ngôn ngữ tại bậc phổ thông.

Tuy nhiên, kỳ thi vấn đáp có nhược điểm là tốn thời gian và khiến các thầy cô phải làm việc nhiều.

Beth Carlson, một giáo viên tiếng Anh tại Trường trung học Kennebunk, Mỹ, cho biết: "Chúng rất tốn sức". Theo tiêu chuẩn chương trình, cô vẫn thực hiện các bài vấn đáp 15 phút cho mỗi học sinh, nhưng chỉ có thể làm bốn bài liên tiếp, sau đó cần nghỉ ngơi. Hiếm giáo viên có thể làm các bài thi vấn đáp cho 6 học sinh liên tục.

Mặc dù vậy, đã có những thử nghiệm mới cho kỳ thi vấn đáp. Chìa khóa là sử dụng công nghệ để làm cho phương pháp này thuận tiện và ít tốn sức hơn.

Thi vấn đáp là giải pháp hiệu quả để đánh giá chất lượng học tập. Ảnh minh họa: EdSurge — Thi vấn đáp là giải pháp hiệu quả để đánh giá chất lượng học tập. Ảnh minh họa: *EdSurge*

Joseph Tey và Shaurya Sinha, hai sinh viên đang làm việc tại Phòng thí nghiệm Piech, Đại học Stanford, tin rằng có thể khai thác AI cho kỳ thi vấn đáp hiệu quả hơn. Họ đã xây dựng một công cụ có tên là Sherpa, giúp các giáo viên lắng nghe sinh viên trả lời các bài được giao, từ đó xác định mức độ hiểu bài của họ.

Để sử dụng Sherpa, giáo viên sẽ tải bài đọc được giao lên hoặc yêu cầu sinh viên tải lên bài luận mà họ đã viết. Công cụ sẽ đặt một loạt câu hỏi (do giáo viên nhập vào hoặc được tạo tự động bởi AI) về bài viết đó để kiểm tra khả năng nắm bắt các khái niệm chính của sinh viên. Sinh viên sẽ trả lời các câu hỏi này và phần mềm ghi lại cuộc trò chuyện.

Sau đó, công cụ sẽ văn bản hóa cuộc trò chuyện, đánh dấu các phần không đúng trọng tâm trong câu trả lời. Giáo viên có thể xem lại video, bản ghi âm hoặc bản ghi chép cuộc trò chuyện và xem những gì Sherpa đánh dấu là có vấn đề, từ đó đánh giá câu trả lời của sinh viên.

Cô Carlson, người đang bối rối với các kỳ thi vấn đáp của mình đã thử Sherpa. Cô cho biết đã đọc bản ghi chép của các học sinh được Sherpa ghi lại và xem cách Sherpa chấm điểm. "Phần lớn là đúng", cô cho biết.

Theo cách chấm của Sherpa, có bốn học sinh trong cả lớp của cô Carlson chưa hiểu bài đọc một cách đầy đủ. "Bốn học sinh nhận được 'cảnh báo' về một số câu hỏi đã nói quá chung chung hoặc trả lời khác với những gì được hỏi", cô Carlson nói.

So với bài tập luận văn truyền thống, cô tin rằng cách tiếp cận này khiến học sinh khó gian lận hơn. Tuy vậy, một số học sinh đã chuẩn bị trước khi làm các câu hỏi Sherpa đưa ra, và về mặt lý thuyết, những ghi chú đó có thể đến từ một chatbot.

Một chuyên gia về các kỳ thi vấn đáp truyền thống, Stephen Dobson, trưởng khoa giáo dục và nghệ thuật tại Đại học Central Queensland ở Australia, lo ngại rằng sẽ rất khó để một hệ thống AI như Sherpa đạt được lợi ích chính của các kỳ thi vấn đáp, đó là đưa ra những câu hỏi tức thời dựa trên cách học sinh phản hồi.

"Chúng liên quan đến tương tác", vị chuyên gia cho biết. "Nếu bạn có một bộ 5 câu hỏi có sẵn, liệu chúng có giúp tìm ra kiếm điểm yếu của học sinh không"?

Sinh viên Joseph Tey cho biết nếu chọn để AI đặt câu hỏi trong Sherpa, hệ thống sẽ mô phỏng cấu trúc của một kỳ thi vấn đáp thực sự, theo đó đặt ra các câu hỏi thuộc nhiều loại khác nhau tùy thuộc vào câu trả lời của học sinh. "Nếu học sinh gặp khó khăn với câu trả lời trước đó, câu hỏi tiếp theo sẽ giảm độ khó. Nếu họ trả lời tốt trước đó, câu hỏi tiếp theo sẽ được thiết kế để để hiểu sâu hơn, dựa trên các cụm từ và trích dẫn cụ thể từ câu trả lời trước đó của học sinh", Tey cho biết.

Trong khi đó, đối với một số giáo viên, công nghệ chính để hỗ trợ kiểm tra vấn đáp là phần mềm video call. Huihui Qi, phó giáo sư giảng dạy về kỹ thuật cơ khí và hàng không vũ trụ tại Đại học California ở San Diego đã làm như vậy.

Thường dạy các khóa học kỹ thuật cơ khí với 100 đến 150 sinh viên, hiện bà tổ chức các bài kiểm tra vấn đáp kéo dài 15 phút một đến ba lần mỗi học kỳ. Để thực hiện được điều đó, sinh viên lên lịch hẹn họp qua Zoom với bà hoặc trợ lý giảng dạy. Mỗi người chấm điểm có thể online từ một nơi khác nhau, và cũng lên lịch nghỉ giải lao giữa giờ để nạp lại năng lượng.

"Thi vấn đáp từ xa giúp chúng tôi không phải mất nhiều thời gian để sắp xếp địa điểm, hay sinh viên phải xếp hàng dài chờ đợi bên ngoài", bà nói.

Không chỉ giúp đánh giá chính xác hơn về sinh viên, điều Qi coi trọng nhất từ các kỳ thi vấn đáp là cơ hội tuyệt vời để trực tiếp truyền đạt cho sinh viên kinh nghiệm từ người giảng dạy.

"Thông qua cuộc đối thoại trong mỗi buổi kiểm tra vấn đáp, vai trò của tôi là gợi ý để các em có thể tự hình thành tư duy phản biện tốt hơn", bà nói, thêm rằng các kỳ thi vấn đáp giúp giáo sư hiểu được cách học sinh suy nghĩ về các vấn đề - một khái niệm gọi là siêu nhận thức.

Mặc dù bài kiểm tra vấn đáp tốn nhiều thời gian để thực hiện, chuyên gia Dobson cũng cho rằng chúng thường mất ít thời gian chấm điểm hơn so với bài luận. Cách tiếp cận này cũng cung cấp cho sinh viên phản hồi ngay lập tức về mức độ hiểu bài của họ, thay vì phải đợi nhiều ngày hoặc nhiều tuần để giáo viên trả kết quả.

"Giống như bạn đang trong một cuộc phỏng vấn xin việc vậy", ông nói.

Nguyên Chương (theo EdSurge)

Độc giả tìm hiểu thêm về các chương trình học tập công nghệ, kiến thức và kỹ năng số tại đây.

Trở lại Giáo dụcTrở lại Giáo dục