Monday, January 11, 2010

"Phân tích nhân tố" - trích trong sách thống kê của Hoàng Trọng & Chu Nguyễn Mộng Ngọc

Gửi các bạn sinh viên cao học ĐL-ĐG trong giáo dục

Do có một số bạn cần sử dụng kỹ thuật phân tích nhân tố để thực hiện đề tài của mình nhưng chưa hiểu nhiều về kỹ thuật này, tôi đã đánh máy lại (một phần) chương 10 của cuốn sách về thống kê đã nêu trên tiêu đề của mục entry này. Hy vọng sẽ giúp ích cho các bạn.
--
Phân tích nhân tố

(Trích trong tài liệu: Phân tích dữ liệu nghiên cứu với SPSS, tác giả: Hoàng Trọng và Chu Nguyễn Mộng Ngọc, NXB Thống kê 2005, Chương X)

I. Khái niệm và ứng dụng
Phân tích nhân tố (PTNT) là tên chung của một nhóm các thủ tục được sử dụng chủ yếu để thu nhỏ và tóm tắt các dữ liệu. Trong nghiên cứu, chúng ta có thể thu thập được một số lượng biến khá lớn và hầu hết các biến này có liên hệ với nhau. Số lượng của chúng cần được giảm bớt xuống đến một số lượng mà chúng ta có thể sử dụng được. […]

PTNT được sử dụng trong các trường hợp sau:
1. Nhận diện các khía cạnh hay nhân tố giải thích được các liên hệ tương quan trong một tập biến. Ví dụ, ta có thể sử dụng một tập hợp các phát biểu về lối sống để đo lường tiểu sử tâm lý của người tiêu dùng. Sau đó những phát biểu (tức các biến) này được sử dụng trong PTNT để nhận diện các yếu tố tâm lý cơ bản.
2. Nhận diện một tập hợp gồm một số biến lượng mới tương đối ít và không có tương quan với nhau để thay thế tập hợp biến gốc và có tương quan với nhau để thực hiện một phân tích đa biến tiếp theo sau (ví dụ như hồi quy hoặc phân tích biệt số). Chẳng hạn như sau khi nhận diện các nhân tố tâm lý thì ta có thể sử dụng chúng thành những biến độc lập để giải thích sự khác biệt giữa người trung thành và người không trung thành với nhãn hiệu sử dụng.

PTNT có vô số ứng dụng trong các nghiên cứu kinh tế và xã hội. Trong nghiên cứu xã hội, các khái niệm thường khá trừu tượng và phức tạp, phân tích nhân tố thường được dùng trong quá trình xây dựng thang đo lường các khía cạnh khác nhau của khái niệm nghiên cứu, kiểm tra tính đơn khía cạnh của thang đo lường. Trong kinh doanh, PTNT có thể được ứng dụng trong nhiều trường hợp:

1. PTNT có thể được sử dụng trong phân tích thị trường để nhận ra các biến quan trọng dùng để phân nhóm người tiêu dùng. Người mua xe có thể được nhóm theo sự chú trọng tương đối về tính kinh tế, tiện nghi, tính năng và sự sang trọng. [...]
2. Trong phân tích sản phẩm, ta có thể sử dụng PTNT để xác định các thuộc tính nhãn hiệu có ảnh hưởng đến sự lựa chọn của người tiêu dùng. Ví dụ các nhãn hiệu kem đánh răng có thể được đánh giá theo khả năng bảo vệ chống sâu răng, trắng răng, mùi vị, hơi thở thơm tho, và giá cả.
(trang 259-260)
[…]

IV. Tiến hành phân tích nhân tố
1. Xác định vấn đề

Xác định vấn đề nghiên cứu gồm có nhiều bước.Đầu tiên phải nhận diện các mục tiêu của PTNT cụ thể là gì. Các biến tham gia vào PTNT phải được xác định dựa vào các nghiên cứu trong quá khứ, phân tích lý thuyết, và đánh giá của các nhà nghiên cứu. Một điều quan trọng là các biến này phải được đo lường một cách thích hợp bằng các thang đo định lượng (khoảng cách hay tỷ lệ), và cỡ mẫu phải đủ lớn. Thông thường thì số quan sát (cỡ mẫu) ít nhất phải bằng 4 hay 5 lần số biến trong PTNT. Trong nhiều tình huống nghiên cứu, kích thước mẫu khá nhỏ và tỷ số này đôi khi cũng khá nhỏ. Trong trường hợp này thì việc giải thích các kết quả cần phải thận trọng.

Để minh họa, chúng ta hãy xem ví dụ sau. Một nhà nghiên cứu muốn xác định các lợi ích căn bản người tiêu dùng cần có khi mua một ống kem đánh răng. Mẫu gồm 35 người tiêu dùng được phỏng vấn. Những người được phỏng vấn cho biết mức độ quan trọng của 6 lợi ích sau trên thang đo 7 điểm (1 = không quan trọng, 7 = rất quan trọng). Danh sách 6 lợi ích đó như sau:
V1 (V = value): ngừa sâu răng
V2: làm trắng răng
V3: làm chắc nướu
V4: làm hơi thở thơm tho
V5: làm sạch răng
V6: làm bóng răng

2. Xây dựng ma trận tương quan
Quá trình phân tích dựa trên ma trận tương quan của các biến này. Để có thể áp dụng được PTNT thì các biến phải có liên hệ với nhau. Trong thực tế ta luôn có điều này. Nếu hệ số tương quan giữa các biến nhỏ thì PTNT có thể không thích hợp. […]

Ta có thể sử dụng Bartlett’s test of sphericity để kiểm tra giả thuyết H0 là các biến không có tương quan với nhau trong tổng thể. […] Đại lượng này càng lớn thì ta càng có nhiều khả năng bác bỏ giả thuyết này. Nếu không thể bác bỏ giả thuyết thì PTNT có thể không thích hợp.

3. Số lượng nhân tố
Chúng ta có thể tính ra một số nhân tố nhiều bằng số biến, nhưng như thế không có tác dụng gì cả! Để tóm tắt thông tin thì số nhân tố phải ít hơn số biến. Nhưng bao nhiêu nhân tố? Có 5 phương pháp xác định số nhân tố: xác định từ trước, dựa vào eigenvalue, biểu đồ dốc (scree plot), phần trăm biến thiên giải thích được (percentage of variance), chia đôi mẫu và kiểm nghiệm mức ý nghĩa.
[…]
4. Xoay các nhân tố




Còn tiếp các phần sau:
5. Đặt tên và giải thích nhân tố
6. Nhân số (Điểm số nhân tố)

14 comments:

  1. Em tìm được trên mạng 1 bài về các phương pháp nghiên cứu định tính tại địa chỉ http://www2.hcmuaf.edu.vn/data/quoctuan/Phuong%20phap%20nghien%20cuu%20dinh%20tinh.pdf
    . Em thấy bài viết này cũng khá hay nên chia sẻ cùng các bạn lớp cao học ĐL&ĐG

    ReplyDelete
  2. Cám ơn em!
    Và hoan hô đã ... lộ diện và tham gia "diễn đàn".

    Vì chúng ta quá có ít thời gian, các bạn lại có quá ít sự chuẩn bị (không phải lỗi hoàn toàn ở các bạn) nên tôi vẫn nghĩ đưa lên blog như thế này sẽ giúp mọi người học được nhiều hơn.

    PA

    ReplyDelete
    Replies
    1. CHi ơi chi có bản mềm của sách "Phân tích nhân tố" - trích trong sách thống kê của Hoàng Trọng & Chu Nguyễn Mộng Ngọc
      Không?
      Chị có thể gửi cho e được k? e đang rất cần nó
      E cảm ơn chi nhiều. qua email haidangkn51@gmail.com

      Delete
  3. mình đang làm đề án thống kê với đè tài là phân tích phần tử bất thường?
    nhưng vẫn chưa biết khái niệm thế nào là phần tử bất thường cả.
    nếu ai biết vấn đề này xin giải đáp giùm.
    thanks!

    ReplyDelete
  4. hi pink,
    bạn có thể viết thêm để mô tả nghiên cứu của bạn không? tôi không biết phần tử bất thường là gì, nhưng nếu bạn tả kỹ thêm thì tôi nghĩ mình có thể giúp được 1 vài ý tưởng để giải quyết vấn đề.

    ReplyDelete
  5. xin kính chào cô Phương Anh, xin chào bạn Pink!
    nghe qua thì điều mà bạn Pink đang quan tâm rất giống với một đề tài khoa học mà mình đang làm, nghiên cứu các phương pháp thống kê đa biến sử dụng trong việc khai thác hiệu quả một bộ số liệu (trong đó có một phần nhỏ là tìm các điểm nghi ngờ hay còn gọi là bất thường),
    nếu mọi người quan tâm, chúng ta có thể thảo luận thêm được không ạ?
    xin hãy liên lạc với mình qua địa chỉ: vuchicong@gmail.com hoặc yahoo: vuchicong86
    chân thành cảm ơn!

    ReplyDelete
  6. Hi Công,

    Em có thể mô tả thêm về đề tài của em được không? Liên hệ với tôi qua mail nhé, vtpanh@gmail.com. Có thể chúng ta làm được cái gì đó chung chăng?

    PA

    ReplyDelete
  7. co j email it.problem.ace@gmail.com rat pro ve IT va Ly thuyet xac suat thong ke.anh em nao co can tai lieu hoac hoi j thi cu email nhe.

    ReplyDelete
  8. Cô Phương Anh ơi!Em đang cần lý thuyết về phân tích nhân tố để làm đề tài cho môn đề án. Hi!đang bí tài liệu thì tìm thấy bài liệu thì tìm thấy bài viết của cô,mừng hết lớn. Hix!Nhưng sao em chỉ đọc được hết phần 3.Số lượng nhân tố trongIV.Tiến hành phân tích nhân tố thôi.Em tìm hoài mà không ra những phần tiếp theo. Cô giúp em làm sao đọc được những phần tiếp theo ạ!

    ReplyDelete
  9. Chi Phuong Anh oi, em cung dang bi qua, em dang lam de tai thac sy, nhung dang tim hieu "phuong phap phan tich nhan to" dung trong SPSS, chi co cho em xin voi. Mail cua em la Symobifone@gmail.com. Em cam on chi nhieu.

    ReplyDelete
  10. chi oi doc nhung phan tiep o dau vay chj

    ReplyDelete
  11. phan tiep theo doc o dau vay chi?

    ReplyDelete
  12. Các bạn đang hoặc sẽ thực hiện đề tài, luận văn tốt nghiệp thạc sỹ, đại học sử dụng chương trình SPSS - Statistical Package for Social Sciences (thống kê mô tả, phân tích độ tin cậy Cronbach's alpha; phân tích nhân tố EFA; kiểm định Bartlett, KMO; Principal axis factoring với phép quay Varimax, Eigenvalues; phân tích tương quan Pearson; phân tích hồi quy đa biến multiple regression: Method Enter, Backward, Stepwise, Forward; vấn đề đa cộng tuyến VIF ; phân tích anova, phân tích Crosstabs...) mà đang bị vướng mắc, cần tìm thêm thông tin.

    Vướng mắc khi chạy SPSS trong luận văn, hãy liên hệ hotrospss@gmail.com để được giải đáp thắc mắc Do anh Khánh phụ trách (Cử nhân CNTT Đại Học KHTN Tp.HCM ,Thạc sĩ QTKD Đại Học Bách Khoa Tp.HCM ,TOEIC quốc tế 810)
    Liên hệ anh Khánh : Mail: hotrospss@gmail.com Chúng tôi sẽ hồi âm lại bạn

    ReplyDelete
  13. mọi người xin hỏi có ai biết làm sao mà phân lớp a,b,c.. khi chạy Anova được không ?

    ReplyDelete