Saturday, June 19, 2010

Tỷ lệ tốt nghiệp THPT 2010 cao, tại sao?

Bài viết này tôi mới viết theo yêu cầu của tòa báo hôm qua để trả lời câu hỏi đã đưa trong tựa của entry này, và đã đăng trên báo Pháp Luật TP HCM hôm nay, ở đây. Dưới đây là bản gốc mà tôi đã viết, có thể có chút khác biệt với bản đã đăng trên báo, do đã được biên tập ít nhiều. Xin đưa lên đây để các bạn cùng đọc và trao đổi, tranh luận.
---
Kết quả kỳ thi tốt nghiệp phổ thông vừa qua đã gây ra sự tranh cãi giữa hai quan điểm, một bên cho rằng tỷ lệ đỗ cao của năm nay là do học sinh học tốt hơn năm trước, còn bên kia cho rằng tỷ lệ này chẳng qua là do năm nay đề thi dễ hơn, và việc tổ chức kỳ cũng lỏng hơn. Vậy, ai đúng ai sai?

Tôi cho rằng nếu chỉ dựa trên những thông tin mà hiện nay dư luận có được thì cuộc tranh cãi này sẽ mãi không có câu trả lời, vì cả hai phía đều có thể đúng (cũng có nghĩa là cả hai phía đều có thể sai!) Bởi, theo lý thuyết về kiểm tra đánh giá giáo dục thì kết quả của một kỳ thi được tạo thành bởi 3 yếu tố như sau (không kể các yếu tố ngẫu nhiên không khống chế được, giả định là như nhau giữa các kỳ thi):

1. Năng lực của thí sinh
2. Độ khó của bài thi hoặc cách cho điểm
3. Các yếu tố liên quan đến việc tổ chức kỳ thi

Vấn đề là với cách sử dụng điểm thô (điểm tuyệt đối) như tại Việt Nam hiện nay thì không thể có căn cứ nào để so sánh năng lực của thí sinh năm này với năm trước cả. Đơn giản là vì thí sinh mỗi năm mỗi khác, đề thi mỗi năm cũng là đề thi mới (không thể dùng lại đề cũ, tất nhiên rồi). Chính vì vậy mà khoa học trắc nghiệm đã phải đưa ra khái niệm điểm chuẩn hóa, hay còn gọi là điểm thống kê/điểm tương đối, để có thể đưa ra những so sánh giữa các năm với nhau.

Đây là một vấn đề khá kỹ thuật, nhưng có thể giải thích theo ngôn ngữ bình dân như sau: Nếu không có căn cứ nào khác ngoài điểm thi để chứng minh là năng lực của thí sinh có khác biệt giữa các năm, thì phải chấp nhận giả định là năng lực của thí sinh giữa các năm không có gì khác biệt.

Nói cách khác, nếu năm trước thí sinh có điểm cao nhất là 8/10, còn năm nay thí sinh có điểm cao nhất là 9/10, thì phải xem 2 điểm số khác nhau đó là tương đương với nhau (8 điểm của năm trước bằng 9 điểm của năm nay). Điều này cũng đồng nghĩa với kết luận là đề thi năm nay dễ hơn, hoặc chấm điểm nới tay hơn. Hoàn toàn không thể dùng sự khác biệt về điểm thô để kết luận về năng lực của thí sinh.

Ngoài ra, xét về tính logic của lập luận thì nếu có những khác biệt trong cách tổ chức thi giữa 2 năm, bắt buộc ta phải kết luận là sự thay đổi trong cách tổ chức thi năm nay đã tạo ra sự khác biệt về kết quả so với năm trước.

Như vậy, kết luận của Bộ Giáo dục rằng tỷ lệ tốt nghiệp cao năm nay phản ánh năng lực cao hơn của thí sinh là một kết luận không đủ căn cứ (chưa kể, ý kiến của Bộ Giáo dục thiếu tính khách quan khi chính mình chỉ đạo việc toàn bộ mọi khâu từ tổ chức giảng dạy, ra đề thi, tổ chức kỳ thi, rồi sau đó dựa trên kết quả của chính kỳ thi do mình tổ chức để kết luận rằng mình đã làm tốt).

Nếu Bộ có những lý do để tin rằng quả thật năng lực thí sinh đã tăng lên thì chỉ còn cách tổ chức một đợt thử nghiệm, chọn mẫu ngẫu nhiên một số thí sinh đã thi xong kỳ thi năm nay, và cho các em làm lại đề thi năm ngoái, rồi so điểm. Tất nhiên, sẽ có nhiều vấn đề kỹ thuật cần phải giải quyết để đảm bảo điểm số của các thí sinh trong mẫu thử nghiệm trên hai bài thi có thể so sánh được với nhau, nhưng nếu muốn có câu trả lời chính xác thì chỉ có thể làm cách đó. Còn nếu Bộ không đưa ra được số liệu như vậy thì cho dù thí sinh năm nay có thực sự giỏi hơn năm ngoái, Bộ cũng sẽ đành chịu mang tiếng “đề dễ, tổ chức thi lỏng” như hiện nay!

Một nhận xét cuối cùng. Thực ra, việc thử nghiệm như đã nêu ở trên chính là một bước trong quy trình ra đề thi, và LẼ RA ĐÃ PHẢI ĐƯỢC THỰC HIỆN TRƯỚC KHI THI để đảm bảo rằng đề thi của các năm là tương đương nhau. Nếu Bộ làm việc một cách chuyên nghiệp, thì những kết quả thử nghiệm này đã phải được công bố trước khi thi rồi. Như thế, khi có kết quả thì sẽ không thể có bất kỳ tranh cãi gì nữa.

Những việc như thế này, các nước tiên tiến đã làm cả thế kỷ nay. Việt Nam cải cách thi cử mãi hàng chục năm nay, có cả một Cục chuyên môn để làm việc này, chuyên gia trong nước cũng không thiếu, chẳng hiểu tại sao cứ loay hoay mãi như thế?
----
Cập nhật lúc 7g40 sáng 19/6:
Trên báo Thanh Niên hôm nay có đăng mẩu tin tóm tắt "Có 4 lý do dẫn đến tốt nghiệp cao", ở đây. Tin này hẳn là dựa trên bài phỏng vấn một quan chức của Bộ Giáo dục, đã được nêu trong bài viết này, và đã đăng hôm qua ở đây.

Phát biểu trong phỏng vấn này hẳn là phản hồi của Bộ GD với dư luận xã hội đã được phản ánh trong bài viết hôm qua về việc tại sao năm nay tỷ lệ tốt nghiệp lại "đẹp" như thế, đăng trên Báo Thanh Niên, ở đây.

Xin đưa các bài viết ấy lên đây để rộng đường dư luận.
---
Cập nhật tiếp lúc 3g20' chiều cùng ngày:
Tôi lại vừa tìm thấy mấy bài viết của GS Nguyễn Văn Tuấn về cùng một vấn đề, rất thú vị, nên đem hết các links về đây, again, "cho nó khỏi lạc bầy" ;-). Chúng ở đây, và ở đây.

Và cám ơn GS Nguyễn Văn Tuấn về những bài này, thật vậy!

3 comments:

  1. Cô có thể nói rõ hơn về quy trình thử nghiệm không ạ? Em có chút thắc mắc khi đọc đoạn này:
    "Một nhận xét cuối cùng. Thực ra, việc thử nghiệm như đã nêu ở trên chính là một bước trong quy trình ra đề thi, và LẼ RA ĐÃ PHẢI ĐƯỢC THỰC HIỆN TRƯỚC KHI THI để đảm bảo rằng đề thi của các năm là tương đương nhau. Nếu Bộ làm việc một cách chuyên nghiệp, thì những kết quả thử nghiệm này đã phải được công bố trước khi thi rồi."
    Nếu kết quả thực nghiệm phải được công bố trước khi thi, vậy phải chăng các thí sinh tham gia cuộc thử nghiệm cũng làm cả đề tốt nghiệp năm nay (hoặc một phiên bản nào đó của đề này) trước khi kì thi này diễn ra?

    SGK

    ReplyDelete
  2. Hi SGK,

    Công thức làm bài thi chuẩn hóa, vd như TOEFL (có lẽ IELTS cũng thế): Trong mỗi bài thi, luôn có một số câu thử nghiệm không tính điểm, để đưa vào ngân hàng đề thi. Sau đó, khi xây dựng đề thi mới, thì rút một số câu đã có các thông số cần thiết (tức đã được trả lời bởi các thí sinh thật của những năm trước) trong ngân hàng ra để so với những thí sinh mới. Việc này gọi là sử câu "neo" (anchor questions) để "định cỡ" (calibrate) câu hỏi mới.

    Như vậy, hoàn toàn có thể cho thí sinh mới làm những câu đã được những thí sinh thật làm của năm trước, để so độ khó. Những câu đó không nhất thiết phải xuất hiện lại trong đề thi thật, mà chỉ là căn cứ để suy ra độ khó tương đương của những câu khác trong đề thi thật.

    Hơi technical một chút, Hùng ạ. Nếu muốn, thì trao đổi trực tiếp với cô.

    PA

    ReplyDelete
  3. Hi SGK,

    Có một câu viết sót, cô viết lại:

    "sử DỤNG câu neo (anchor questions)" (trong comment ở trên bị thiếu chữ "dụng").

    PA

    ReplyDelete