Hàm CORREL trong Excel - Tính toán tương quan thống kê

Tải xuống Sổ làm việc Ví dụ

Tải xuống sổ làm việc mẫu

Hướng dẫn này trình bày cách sử dụng Hàm CORREL trong Excel trong Excel để tính toán mối tương quan.

Tổng quan về chức năng CORREL

Hàm CORREL Tính tương quan của hai chuỗi số.

Để sử dụng Hàm Trang tính CORREL Excel, hãy chọn một ô và nhập:

(Chú ý cách các đầu vào công thức xuất hiện)

Hàm CORREL Cú pháp và đầu vào:

1 = CORREL (mảng1, mảng2)

array1 - Mảng số.

Hàm CORREL là gì?

Hàm CORREL trong Excel trả về hệ số tương quan (Pearson’s NS) của hai phạm vi dữ liệu.

Hệ số tương quan là gì?

Hệ số tương quan, thường được gọi là Pearson’s NS (được đặt theo tên của Karl Pearson, người đã phát triển nó), là một thống kê cho bạn biết hai biến có liên quan chặt chẽ như thế nào.

Của Pearson NS là một con số giữa -1 và 1, có thể dẫn đến ba cách giải thích: tương quan thuận, tương quan nghịch và không tương quan.

Tương quan tích cực

Tương quan thuận (NS > 0) có nghĩa là khi hai biến song song - khi bạn quan sát điểm cao ở một biến, bạn cũng có xu hướng quan sát điểm cao ở biến kia. Tương tự như vậy, khi một biến thấp, biến kia cũng có xu hướng thấp.

Ví dụ, chiều cao và cân nặng có mối tương quan thuận. Xem biểu đồ bên dưới, biểu đồ chiều cao và cân nặng của một số ít cầu thủ bóng chày:

Các NS của mẫu nhỏ này là 0,73 - một mối tương quan thuận rất mạnh. Điều này có ý nghĩa về mặt logic - những người cao hơn trung bình thường nặng hơn vì chiều cao tăng thêm đó được tạo thành từ xương và cơ bắp và các mô khác, tất cả đều nặng một thứ.

Nhưng mối tương quan không hoàn hảo (trong mối tương quan hoàn hảo với NS là 1, tất cả các điểm số sẽ nằm trên đường xu hướng). Một số người thấp hơn có thể nặng hơn - có thể họ thừa một chút mỡ hoặc tập thể dục tại phòng tập thể dục. Tương tự như vậy, một số người cao có thể rất gầy và thực sự nặng hơn nhiều người thấp hơn.

Mối tương quan ở đây có lẽ quá cao bởi vì chúng tôi đang đối phó với các vận động viên, nó sẽ thấp hơn trong dân số tổng thể. Hãy nhớ ghi nhớ điều này khi sử dụng CORREL - the NS bạn nhận được không phải là chắc chắn - bạn cần phải suy nghĩ về dữ liệu của bạn là gì và bạn nhận được dữ liệu đó như thế nào khi thực hiện các diễn giải của mình.

Tương quan tiêu cực

Tương quan nghịch (NS <0) có nghĩa là khi bạn quan sát điểm cao ở một biến, bạn có xu hướng quan sát điểm thấp ở biến kia và ngược lại.

Ví dụ, điểm kiểm tra của học sinh và số lần nghỉ học của học sinh có mối tương quan nghịch. Có nghĩa là, họ càng bỏ lỡ nhiều ngày, điểm số của họ có xu hướng thấp hơn. Họ bỏ lỡ càng ít ngày, điểm số càng cao có xu hướng:

Một lần nữa, mối tương quan không hoàn hảo (vì chúng hầu như không bao giờ xảy ra). Chúng tôi có một học sinh ở đây đã trượt 5 ngày, nhưng vẫn đạt được 85% điểm. Chúng tôi cũng có một người đạt tỷ lệ 52%, mặc dù chỉ vắng mặt hai ngày.

Chúng tôi vẫn có một xu hướng tiêu cực rõ ràng. Tuy nhiên, vẫn có rất nhiều sự thay đổi trong kết quả thử nghiệm mà không thể giải thích chỉ bằng sự vắng mặt. Điều này có thể là do các biến số khác, như năng khiếu, động lực, sức khỏe và nhiều yếu tố tiềm năng khác.

Vì vậy, khi bạn sử dụng CORREL, hãy nhớ rằng có một bức tranh lớn hơn mà dữ liệu của bạn có thể không giải thích đầy đủ.

Không liên quan

Không liên quan (NS = 0 hoặc gần bằng 0) có nghĩa là bạn không thể dự đoán điểm của một biến dựa trên biến khác. Nếu bạn vẽ dữ liệu, bạn sẽ không thấy xu hướng rõ ràng và đường xu hướng sẽ bằng phẳng hoặc gần bằng phẳng.

Dưới đây là một số dữ liệu về chiều dài ngón tay đeo nhẫn và chỉ số IQ:

Như bạn có thể thấy, không có mối liên hệ nào giữa hai biến này trong mẫu này, vì vậy chúng tôi có thể cho rằng chúng không có liên quan.

Trong thực tế, bạn khó có thể nhận được NS của chính xác là 0. Hãy nhớ rằng khi thu thập dữ liệu, thường có một số thay đổi do sai sót, có thể trong đo lường hoặc báo cáo. Vì vậy, chỉ vì của bạn NS không chính xác là 0, không có nghĩa là bạn đã tìm thấy thứ gì đó.

Tương quan không phải là nhân quả

Điều quan trọng cần lưu ý là CORREL không thể cho bạn biết biến nào đang ảnh hưởng đến biến kia - hoặc ngay cả khi có bất kỳ mối quan hệ nhân quả nào giữa các biến. Ví dụ, mối tương quan đã được tìm thấy giữa các biến sau:

  • Lượng kem bán ra và số lượng tội phạm bạo lực
  • Bạn hạnh phúc như thế nào và bạn thành công như thế nào trong sự nghiệp của mình
  • Số người chết đuối trong hồ bơi và số phim Nicolas Cage xuất hiện mỗi năm

Ví dụ đầu tiên là vấn đề biến thứ ba. Tất nhiên, kem không khiến người ta trở nên bạo lực, cũng như không gây ra bạo lực khiến người ta thèm ăn sữa đông lạnh và đường. Biến thứ ba là thời tiết. Khi thời tiết nóng bức, mọi người chỉ đơn giản là đi ra ngoài nhiều hơn - giữa mọi người có nhiều sự tiếp xúc hơn và do đó, có nhiều khả năng nổ ra xung đột hơn. Thời tiết nắng nóng, người dân cũng mua kem nhiều hơn. Vì vậy, doanh số bán kem và tội phạm bạo lực chỉ có mối tương quan vì cả hai đều liên quan đến một biến thứ ba.

Thứ hai có thể là một ví dụ về nhân quả kép. Thành công trong công việc có thể tốt cho hạnh phúc của bạn - bạn sẽ kiếm được nhiều tiền hơn và nhìn chung sẽ có nhiều quyền kiểm soát hơn đối với công việc bạn làm và bạn làm công việc đó với ai. Nhưng hạnh phúc cũng có thể có lợi cho thành công, có thể những người hạnh phúc hơn sẽ dễ dàng hòa hợp và phát triển các mối quan hệ công việc bền chặt hơn, hoặc có thể họ kiên cường hơn về mặt tinh thần trước những thất bại. Trong trường hợp này, cả hai biến đều ảnh hưởng lẫn nhau.

Thứ ba chỉ đơn giản là một tương quan giả. Chỉ vì hai biến tương quan trong dữ liệu của bạn, không có nghĩa là chúng tương tác với nhau trong cuộc sống thực.

Điểm mấu chốt là, một mối tương quan không thể cho bạn biết liệu hai biến số có kết nối nhân quả hay không.

Cách sử dụng CORREL

Sử dụng Hàm CORREL trong Excel như sau:

1 = CORREL (B3: B15, C3: C15)

Với CORREL, bạn xác định hai đối số - hai phạm vi dữ liệu mà bạn muốn tương quan.

Dưới đây là một số điểm chính cần ghi nhớ với CORREL:

  • Văn bản, Boolean (TRUE / FALSE) và các ô trống bị bỏ qua.
  • Cả hai phạm vi dữ liệu phải có số lượng điểm dữ liệu bằng nhau, nếu không, bạn sẽ gặp lỗi # N / A
  • Nếu một trong các phạm vi dữ liệu trống, nếu không có sự thay đổi nào trong dữ liệu (tức là nếu tất cả các điểm dữ liệu là cùng một số), bạn sẽ nhận được lỗi # DIV / 0! Lỗi

Hàm CORREL trong Google Trang tính

Hàm CORREL hoạt động hoàn toàn giống trong Google Trang tính cũng như trong Excel:

Ghi chú bổ sung

Các ví dụ về CORREL trong VBA

Bạn cũng có thể sử dụng hàm CORREL trong VBA. Kiểu:
application.worksheet functions.correl (array1, array2)
Đối với các đối số của hàm (array1, v.v.), bạn có thể nhập chúng trực tiếp vào hàm hoặc xác định các biến để sử dụng thay thế.

Quay lại danh sách tất cả các hàm trong Excel

wave wave wave wave wave