Phân tích tương quan Pearson được sử dụng để làm gì?

Tương quan theo nghĩa rộng nhất là thước đo mối liên hệ giữa các biến. Trong dữ liệu tương quan, sự thay đổi độ lớn của 1 biến có liên quan đến sự thay đổi độ lớn của một biến khác, theo cùng hướng (tương quan thuận) hoặc ngược chiều (tương quan nghịch). Thông thường, thuật ngữ tương quan được sử dụng trong bối cảnh mối quan hệ tuyến tính giữa 2 biến liên tục và được biểu thị dưới dạng tương quan thời điểm sản phẩm Pearson. Hệ số tương quan Pearson thường được sử dụng cho dữ liệu được phân phối chuẩn chung (dữ liệu tuân theo phân phối chuẩn hai biến). Đối với dữ liệu liên tục được phân phối không bình thường, đối với dữ liệu thứ tự hoặc đối với dữ liệu có các ngoại lệ có liên quan, tương quan xếp hạng Spearman có thể được sử dụng làm thước đo của mối liên hệ đơn điệu. Cả hai hệ số tương quan đều được chia tỷ lệ sao cho chúng nằm trong khoảng từ –1 đến +1, trong đó 0 biểu thị rằng không có mối liên hệ tuyến tính hoặc đơn điệu, và mối quan hệ trở nên mạnh mẽ hơn và cuối cùng tiến tới một đường thẳng (tương quan Pearson) hoặc một đường cong tăng hoặc giảm liên tục . Kiểm tra giả thuyết và khoảng tin cậy có thể được sử dụng để giải quyết ý nghĩa thống kê của kết quả và để ước tính sức mạnh của mối quan hệ trong dân số mà dữ liệu được lấy mẫu. Mục đích của hướng dẫn này là hướng dẫn các nhà nghiên cứu và bác sĩ lâm sàng trong việc sử dụng và giải thích các hệ số tương quan một cách thích hợp.

Các nhà nghiên cứu thường nhằm mục đích nghiên cứu xem liệu có mối liên hệ nào giữa 2 biến quan sát hay không và ước tính độ mạnh của mối liên hệ này. Ví dụ, Nishimura và cộng sự đã đánh giá xem thể tích dịch tinh thể được truyền vào có liên quan đến lượng rò rỉ dịch kẽ trong quá trình phẫu thuật hay không và Kim và cộng sự đã nghiên cứu xem biểu hiện của thụ thể yếu tố tăng trưởng opioid (OGFR) có liên quan đến sự tăng sinh tế bào trong tế bào ung thư hay không. Những mục tiêu nghiên cứu này và các mục tiêu tương tự có thể được giải quyết một cách định lượng bằng phân tích tương quan, cung cấp thông tin không chỉ về cường độ mà còn về hướng của mối quan hệ (ví dụ: sự gia tăng biểu hiện OGFR có liên quan đến sự gia tăng hoặc giảm sự tăng sinh tế bào)

Là một phần của loạt bài đang diễn ra về Gây mê & Giảm đau, hướng dẫn thống kê cơ bản này thảo luận về 2 hệ số tương quan được sử dụng phổ biến nhất trong nghiên cứu y học, hệ số Pearson và hệ số Spearman. 3 Điều quan trọng cần lưu ý là các hệ số tương quan này thường bị hiểu sai và sử dụng sai. 4,5 Do đó, chúng tôi tập trung vào cách chúng nên và không nên được sử dụng và giải thích chính xác

TƯƠNG QUAN SẢN PHẨM-MOMENT PEARSON

Tương quan là thước đo mối liên hệ đơn điệu giữa 2 biến. Mối quan hệ đơn điệu giữa 2 biến là mối quan hệ trong đó (1) giá trị của biến này tăng thì giá trị của biến kia cũng tăng theo;

Do đó, trong dữ liệu tương quan, sự thay đổi độ lớn của 1 biến có liên quan đến sự thay đổi độ lớn của một biến khác, cùng hướng hoặc ngược hướng. Nói cách khác, giá trị cao hơn của 1 biến có xu hướng được liên kết với giá trị cao hơn (tương quan dương) hoặc thấp hơn (tương quan âm) của biến kia và ngược lại

Mối quan hệ tuyến tính giữa 2 biến là trường hợp đặc biệt của mối quan hệ đơn điệu. Thông thường, thuật ngữ “tương quan” được sử dụng trong ngữ cảnh của mối quan hệ tuyến tính như vậy giữa 2 biến ngẫu nhiên, liên tục, được gọi là tương quan tích-thời điểm Pearson, thường được viết tắt là “r. ”6

Mức độ mà sự thay đổi trong một biến liên tục có liên quan đến sự thay đổi trong một biến liên tục khác có thể được mô tả một cách toán học dưới dạng hiệp phương sai của các biến. 7 Hiệp phương sai tương tự như phương sai, nhưng trong khi phương sai mô tả mức độ biến thiên của một biến đơn lẻ, thì hiệp phương sai là thước đo mức độ 2 biến thay đổi cùng nhau. 7 Tuy nhiên, hiệp phương sai phụ thuộc vào thang đo lường của các biến và độ lớn tuyệt đối của nó không thể dễ dàng diễn giải hoặc so sánh giữa các nghiên cứu. Để thuận tiện cho việc giải thích, hệ số tương quan Pearson thường được sử dụng. Hệ số này là thước đo không thứ nguyên của hiệp phương sai, được chia tỷ lệ sao cho nó nằm trong khoảng từ –1 đến +1. 7

Hình 1 cho thấy các biểu đồ phân tán với các ví dụ về dữ liệu mô phỏng được lấy mẫu từ các phân phối chuẩn hai biến với các hệ số tương quan Pearson khác nhau. Như minh họa, r = 0 chỉ ra rằng không có mối quan hệ tuyến tính giữa các biến và mối quan hệ trở nên mạnh mẽ hơn (nghĩa là độ tán xạ giảm) khi giá trị tuyệt đối của r tăng và cuối cùng tiến tới một đường thẳng khi hệ số tiến tới –1 hoặc +

Phân tích tương quan Pearson được sử dụng để làm gì?
Hình 1

A–F, Biểu đồ phân tán với dữ liệu được lấy mẫu từ phân phối chuẩn hai biến mô phỏng với các hệ số tương quan Pearson khác nhau (r). Lưu ý rằng sự phân tán tiến đến một đường thẳng khi hệ số tiến đến –1 hoặc +1, trong khi không có mối quan hệ tuyến tính khi hệ số bằng 0 (D). E cho thấy bằng ví dụ rằng mối tương quan phụ thuộc vào phạm vi của các giá trị được đánh giá. Trong khi hệ số là +0. 6 cho toàn bộ phạm vi dữ liệu được hiển thị trong E, nó chỉ là +0. 34 khi tính toán cho dữ liệu trong khu vực bóng mờ

Một mối tương quan hoàn hảo của –1 hoặc +1 có nghĩa là tất cả các điểm dữ liệu nằm chính xác trên đường thẳng mà chúng ta mong đợi, chẳng hạn như nếu chúng ta tương quan trọng lượng của các mẫu nước với thể tích của chúng, giả sử rằng cả hai đại lượng đều có thể đo được . Tuy nhiên, những mối quan hệ tuyệt đối như vậy không phải là điển hình trong nghiên cứu y học do sự thay đổi của các quá trình sinh học và lỗi đo lường

Các giả định về tương quan Pearson

Các giả định về mối tương quan Pearson đã được tranh luận gay gắt. 8–10 Do đó, không có gì đáng ngạc nhiên, nhưng dù sao cũng gây nhầm lẫn, rằng các nguồn thống kê khác nhau đưa ra các giả định khác nhau. Trong thực tế, hệ số có thể được tính như một thước đo của mối quan hệ tuyến tính mà không cần bất kỳ giả định nào

Tuy nhiên, suy luận đúng đắn về sức mạnh của mối liên hệ trong dân số mà dữ liệu được lấy mẫu (điều mà người ta thường quan tâm) đòi hỏi phải đáp ứng một số giả định. 9–11

  1. Như thực sự đúng với bất kỳ suy luận thống kê nào, dữ liệu được lấy từ một mẫu ngẫu nhiên hoặc ít nhất là đại diện. Nếu dữ liệu không đại diện cho dân số quan tâm, người ta không thể rút ra kết luận có ý nghĩa về dân số đó
  2. Cả hai biến đều liên tục, có phân phối chuẩn chung, biến ngẫu nhiên. Chúng tuân theo phân phối chuẩn hai biến trong quần thể mà chúng được lấy mẫu. Phân phối chuẩn hai biến nằm ngoài phạm vi của hướng dẫn này nhưng không cần phải hiểu đầy đủ để sử dụng hệ số Pearson

Hai thuộc tính điển hình của phân phối chuẩn hai biến có thể được đánh giá tương đối dễ dàng và các nhà nghiên cứu nên kiểm tra sự tuân thủ gần đúng của dữ liệu của họ với các thuộc tính này

  • i. Cả hai biến đều có phân phối chuẩn. Các phương pháp để đánh giá giả định này gần đây đã được xem xét trong loạt bài hướng dẫn thống kê cơ bản này. 12
  • ii. Nếu có một mối quan hệ giữa dữ liệu được phân phối bình thường chung, thì nó luôn là tuyến tính. 13 Do đó, nếu các điểm dữ liệu trong biểu đồ phân tán dường như nằm gần một số đường cong, thì giả định về phân phối chuẩn hai biến bị vi phạm

Có một số khả năng để giải quyết các vi phạm đối với giả định này. Đầu tiên, các biến thường có thể được chuyển đổi để tiến tới phân phối chuẩn và tuyến tính hóa mối quan hệ giữa các biến. 12 Thứ hai, trái ngược với tương quan Pearson, tương quan Spearman (xem bên dưới) không yêu cầu dữ liệu phân phối chuẩn và có thể được sử dụng để phân tích các mối quan hệ đơn điệu phi tuyến tính (nghĩa là tăng hoặc giảm liên tục). 14

  • 3. Không có ngoại lệ liên quan. Các ngoại lệ cực đoan có thể có ảnh hưởng quá mức đến hệ số tương quan Pearson. Mặc dù nói chung là không hợp pháp nếu chỉ đơn giản là loại trừ các ngoại lệ,15 chạy phân tích tương quan có và không có (các) ngoại lệ và so sánh các hệ số là một khả năng để đánh giá ảnh hưởng thực sự của ngoại lệ đối với phân tích. Đối với dữ liệu có các ngoại lệ có liên quan, tương quan Spearman được ưu tiên hơn vì nó có xu hướng tương đối mạnh so với các ngoại lệ. 14
  • 4. Mỗi cặp giá trị x–y được đo độc lập với từng cặp khác. Nhiều quan sát từ cùng một đối tượng sẽ vi phạm giả định này. 11 Cách xử lý dữ liệu đó phụ thuộc vào việc chúng ta quan tâm đến mối tương quan trong các chủ thể hay giữa các chủ thể như đã xem xét trước đây. 16,17

Giải thích hệ số tương quan

Several approaches have been suggested to translate the correlation coefficient into descriptors like “weak,” “moderate,” or “strong” relationship (see the Table for an example).3,18 These cutoff points are arbitrary and inconsistent and should be used judiciously. While most researchers would probably agree that a coefficient of <0.1 indicates a negligible and >0.9 a very strong relationship, values in-between are disputable. For example, a correlation coefficient of 0.65 could either be interpreted as a “good” or “moderate” correlation, depending on the applied rule of thumb. It is also quite capricious to claim that a correlation coefficient of 0.39 represents a “weak” association, whereas 0.40 is a “moderate” association.

Phân tích tương quan Pearson được sử dụng để làm gì?
Bàn

Ví dụ về cách tiếp cận thông thường để giải thích hệ số tương quan

Thay vì sử dụng các quy tắc đơn giản hóa, chúng tôi đề xuất rằng một hệ số cụ thể nên được hiểu là thước đo độ mạnh của mối quan hệ trong bối cảnh của câu hỏi khoa học được đặt ra. Lưu ý rằng phạm vi của các giá trị được đánh giá nên được xem xét khi diễn giải, vì phạm vi giá trị rộng hơn có xu hướng thể hiện mối tương quan cao hơn phạm vi nhỏ hơn (Hình 1E). 19

Mối tương quan được quan sát cũng có thể không nhất thiết là một ước tính tốt cho hệ số tương quan dân số, bởi vì các mẫu chắc chắn bị ảnh hưởng bởi sự ngẫu nhiên. Do đó, hệ số được quan sát phải luôn đi kèm với khoảng tin cậy, cung cấp phạm vi giá trị hợp lý của hệ số trong dân số mà dữ liệu được lấy mẫu. 20

Trong nghiên cứu của Nishimura et al,1 các tác giả báo cáo hệ số tương quan bằng 0. 42 về mối quan hệ giữa thể tích dịch tinh thể được truyền vào và lượng rò rỉ dịch kẽ, do đó dường như có mối liên hệ đáng kể giữa 2 biến số. Tuy nhiên, khoảng tin cậy 95%, nằm trong khoảng từ 0. 03 đến 0. 70, gợi ý rằng các kết quả cũng tương thích với một giá trị không đáng kể (r = 0. 03) và do đó mối quan hệ không quan trọng về mặt lâm sàng. Mặt khác, dữ liệu cũng tương thích với mối liên hệ khá mạnh (r = 0. 70). Dữ liệu có khoảng tin cậy rộng như vậy không cho phép kết luận dứt khoát về độ mạnh của mối quan hệ giữa các biến

Các nhà nghiên cứu thường cũng nhằm mục đích xác định xem kết quả của họ có “có ý nghĩa thống kê hay không”. ” Một kiểm định t có sẵn để kiểm định giả thuyết khống rằng hệ số tương quan bằng không. 13 Lưu ý rằng giá trị P thu được từ kiểm định không cung cấp thông tin về mức độ liên quan của 2 biến. Với các tập dữ liệu lớn, các hệ số tương quan rất nhỏ có thể “có ý nghĩa thống kê. ” Do đó, không được nhầm lẫn mối tương quan có ý nghĩa thống kê với mối tương quan có ý nghĩa lâm sàng. Để biết thêm thông tin về cách diễn giải kết quả kiểm tra giả thuyết và khoảng tin cậy, chúng tôi giới thiệu người đọc đến các hướng dẫn trước trong Gây mê & Giảm đau. 20,21

Hệ số xác định

Hệ số tương quan đôi khi bị chỉ trích là không có sự giải thích nội tại rõ ràng,6 và các nhà nghiên cứu đôi khi báo cáo bình phương của hệ số tương quan. R2 này được gọi là “hệ số xác định. ” Có thể hiểu là tỷ lệ phương sai của 1 biến được tính bởi biến kia. 6

Hệ số tương quan của 0. 42 được báo cáo bởi Nishimura et al1 tương ứng với hệ số xác định (R2) bằng 0. 18, gợi ý rằng khoảng 18% sự thay đổi của lượng rò rỉ dịch kẽ có thể được “giải thích” bằng mối quan hệ với lượng dịch tinh thể được truyền vào. Vì hơn 80% sự thay đổi vẫn chưa giải thích được, nên phải có 1 hoặc nhiều yếu tố liên quan khác liên quan đến rò kẽ

Khi giải thích hệ số xác định, lưu ý rằng hệ số tương quan bình phương luôn là một số dương, vì vậy thông tin về hướng của mối quan hệ bị mất. Ấn phẩm mang tính bước ngoặt của Ozer22 cung cấp một cuộc thảo luận đầy đủ hơn về hệ số xác định

Tương quan Pearson so với hồi quy tuyến tính

Do sự tương đồng giữa tương quan Pearson và hồi quy tuyến tính, các nhà nghiên cứu đôi khi không chắc chắn nên sử dụng thử nghiệm nào. Cả hai kỹ thuật đều có mối quan hệ toán học chặt chẽ, nhưng các mục đích và giả định khác nhau

Hồi quy tuyến tính sẽ được đề cập trong phần hướng dẫn tiếp theo của loạt bài này. Tóm lại, hồi quy tuyến tính đơn giản chỉ có 1 biến độc lập (x) và 1 biến phụ thuộc (y). Nó phù hợp với một dòng thông qua các điểm dữ liệu của biểu đồ phân tán, cho phép ước tính các giá trị y từ các giá trị x. 23 Tuy nhiên, bản thân đường hồi quy không cung cấp thông tin về mức độ liên quan chặt chẽ của các biến. Ngược lại, một mối tương quan không khớp với một đường như vậy và không cho phép ước tính như vậy, nhưng nó mô tả sức mạnh của mối quan hệ. Do đó, việc lựa chọn hệ số tương quan hay hồi quy tuyến tính phụ thuộc vào mục tiêu nghiên cứu. sức mạnh của mối quan hệ so với ước tính giá trị y từ giá trị x

Tuy nhiên, các yếu tố bổ sung nên được xem xét. Trong một phân tích tương quan Pearson, cả hai biến được giả định là phân phối bình thường. Các giá trị quan sát được của các biến này có thể thay đổi ngẫu nhiên tự nhiên. Ngược lại, trong hồi quy tuyến tính, các giá trị của biến độc lập (x) được coi là hằng số đã biết. 23 Do đó, phân tích tương quan Pearson thường được áp dụng khi cả hai biến được quan sát, trong khi hồi quy tuyến tính nói chung, nhưng không độc quyền, được sử dụng khi các giá trị cố định của biến độc lập (x) được các nhà nghiên cứu chọn trong một giao thức thử nghiệm

Để minh họa sự khác biệt, trong nghiên cứu của Nishimura et al,1 thể tích truyền và lượng rò rỉ là các biến quan sát được. Tuy nhiên, nếu các nhà điều tra chọn các chế độ truyền khác nhau mà họ chỉ định bệnh nhân (ví dụ: 500, 1000, 1500 và 2000 mL), biến độc lập sẽ không còn ngẫu nhiên nữa và phân tích tương quan Pearson sẽ không phù hợp.

TƯƠNG QUAN XẾP HẠNG THẦN THOẠI

Trong nghiên cứu được đề cập trước đây của Kim và cộng sự,2 biểu đồ phân tán của biểu hiện OGFR và sự phát triển của tế bào dường như không tương thích với phân phối chuẩn hai biến và mối quan hệ có vẻ đơn điệu nhưng phi tuyến tính. Tương quan xếp hạng Spearman có thể được sử dụng để phân tích mối liên hệ giữa các dữ liệu đó. 14

Về cơ bản, hệ số Spearman là một hệ số tương quan Pearson được tính với thứ hạng của các giá trị của từng biến trong số 2 biến thay vì giá trị thực của chúng (Hình 2). 13 Hệ số Spearman thường được viết tắt là ρ (rho) hoặc “rs. ” Bởi vì dữ liệu thứ tự cũng có thể được xếp hạng, việc sử dụng hệ số Spearman không bị hạn chế đối với các biến liên tục. Bằng cách sử dụng xếp hạng, hệ số định lượng mối quan hệ đơn điệu nghiêm ngặt giữa 2 biến (xếp hạng của dữ liệu chuyển đổi mối quan hệ đơn điệu phi tuyến tính thành mối quan hệ tuyến tính, xem Hình 2). Hơn nữa, thuộc tính này làm cho hệ số Spearman tương đối mạnh so với các giá trị ngoại lai (Hình 3)

Phân tích tương quan Pearson được sử dụng để làm gì?
Hình 2

A, Một đường cong đơn điệu nghiêm ngặt với hệ số tương quan Pearson (r) là +0. 84. Cũng ở phần phẳng bên trái, đường cong liên tục tăng nhẹ. Sau khi xếp hạng các giá trị của cả hai biến từ thấp nhất đến cao nhất, thứ hạng cho thấy mối quan hệ tuyến tính hoàn hảo (B). Tương quan xếp hạng Spearman là tương quan Pearson được tính với xếp hạng dữ liệu thay vì giá trị thực của chúng. Do đó, hệ số Spearman (ρ) là +1. 0 trong A tương ứng với tương quan Pearson +1. 0 trong B

Phân tích tương quan Pearson được sử dụng để làm gì?
Hình 3

Các ví dụ được xây dựng để minh họa rằng mối quan hệ giữa các dữ liệu cũng cần được đánh giá bằng cách kiểm tra trực quan các biểu đồ, thay vì chỉ dựa vào các hệ số tương quan. A, Hệ số tương quan gần bằng 0 không nhất thiết có nghĩa là biến trục x và trục y không liên quan. Trên thực tế, biểu đồ gợi ý một mối quan hệ bậc hai mạnh mẽ. B–D, hệ số tương quan Pearson (r) là +0. 84, giống như trong Hình 2A, nhưng mối quan hệ thực tế giữa dữ liệu là khá khác nhau trong mỗi bảng. Lưu ý rằng ngoại lệ trong B có ảnh hưởng liên quan đến hệ số Pearson vì loại trừ giá trị cực trị này sẽ tạo ra mối quan hệ tuyến tính hoàn hảo, trong khi nó hầu như không ảnh hưởng đến hệ số Spearman (với ngoại lệ, ρ rất gần với +1, không có ngoại lệ, . C, Mối quan hệ không tuyến tính cũng không đơn điệu và cả hệ số Pearson và Spearman đều không thể hiện được mối quan hệ hình sin. D, Được lấy mẫu từ phân phối chuẩn hai biến

Tương tự như hệ số Pearson, hệ số Spearman cũng nằm trong khoảng từ –1 đến +1. Nó có thể được hiểu là mô tả bất cứ điều gì giữa không có mối liên hệ (ρ = 0) với mối quan hệ đơn điệu hoàn hảo (ρ = –1 hoặc +1). Các cân nhắc tương tự như được mô tả ở trên đối với mối tương quan Pearson cũng áp dụng cho việc giải thích khoảng tin cậy và giá trị P cho hệ số Spearman

Cạm bẫy và GIẢI THÍCH SAI

Các mối tương quan thường bị hiểu sai và sử dụng sai. 4,5 Điều quan trọng cần lưu ý là mối tương quan quan sát được (nghĩa là mối liên hệ) không đảm bảo rằng mối quan hệ giữa 2 biến là nhân quả. Doanh số bán kem tăng khi nhiệt độ tăng trong mùa hè và doanh số bán quạt cũng vậy. Do đó, doanh số bán quạt có xu hướng tăng cùng với doanh số bán kem, nhưng mối tương quan tích cực này không biện minh cho kết luận rằng ăn kem khiến mọi người mua quạt. Mặc dù ngụy biện dễ dàng được phát hiện trong ví dụ này, nhưng có thể dễ dàng kết luận rằng việc truyền một lượng lớn dịch tinh thể gây rò rỉ dịch vào mô kẽ. Mặc dù chắc chắn có thể tồn tại mối quan hệ nhân quả, nhưng chúng tôi sẽ không có cơ sở để kết luận điều này dựa trên phân tích tương quan. Sự khác biệt giữa hiệp hội và nhân quả được thảo luận chi tiết trong hướng dẫn trước. 24

Các mối tương quan cũng không mô tả mức độ phù hợp giữa 2 biến (ví dụ: mức độ phù hợp giữa các giá trị đọc từ 2 thiết bị đo lường, xét nghiệm chẩn đoán hoặc người quan sát/người đánh giá). 25 Hai biến số có thể thể hiện mức độ tương quan cao nhưng đồng thời có thể khác nhau đáng kể, ví dụ nếu một kỹ thuật đo lường luôn cao hơn kỹ thuật kia

Một quan niệm sai lầm khác là hệ số tương quan gần bằng 0 chứng tỏ rằng các biến không liên quan với nhau. Mối tương quan nên được sử dụng để mô tả mối liên hệ tuyến tính hoặc đơn điệu, nhưng điều này không loại trừ việc các nhà nghiên cứu có thể cố ý hoặc vô tình sử dụng sai hệ số tương quan cho các mối quan hệ không được mô tả đầy đủ bằng phân tích tương quan (ví dụ: mối quan hệ bậc hai như trong Hình 3A). Các mối quan hệ rất khác nhau có thể dẫn đến các hệ số tương quan giống nhau (Hình 2A và 3B–D). Do đó, các nhà nghiên cứu được khuyên không chỉ dựa vào hệ số tương quan mà còn vẽ biểu đồ dữ liệu để kiểm tra trực quan mối quan hệ. 26 Vẽ đồ thị dữ liệu nói chung là bước đầu tiên tốt trước khi thực hiện bất kỳ phân tích số nào

KẾT LUẬN

Các hệ số tương quan mô tả cường độ và hướng của mối liên hệ giữa các biến. Tương quan Pearson là thước đo mối liên hệ tuyến tính giữa 2 biến ngẫu nhiên có phân phối chuẩn. Một tương quan xếp hạng Spearman mô tả mối quan hệ đơn điệu giữa 2 biến. Nó (1) hữu ích cho dữ liệu liên tục được phân phối không bình thường, (2) có thể được sử dụng cho dữ liệu thứ tự và (3) tương đối mạnh đối với các ngoại lệ. Các thử nghiệm giả thuyết được sử dụng để kiểm tra giả thuyết không về mối tương quan và khoảng tin cậy cung cấp một loạt các giá trị hợp lý của ước tính

Các nhà nghiên cứu nên tránh suy luận nguyên nhân từ mối tương quan và mối tương quan không phù hợp để phân tích sự đồng thuận. Việc kiểm tra trực quan các biểu đồ phân tán luôn được khuyến khích, vì mối tương quan không thể mô tả đầy đủ các mối quan hệ phi tuyến tính hoặc không đơn điệu và các mối quan hệ khác nhau giữa các biến có thể dẫn đến các hệ số tương quan giống nhau

Mục đích của tương quan Pearson là gì?

Sửa đổi vào ngày 5 tháng 12 năm 2022. Hệ số tương quan Pearson (r) là cách phổ biến nhất để đo lường mối tương quan tuyến tính. Đó là một số giữa –1 và 1 đo lường cường độ và hướng của mối quan hệ giữa hai biến .

Khi nào tôi nên sử dụng Pearson hoặc Spearman?

Sự khác biệt giữa tương quan Pearson và tương quan Spearman là Pearson thích hợp nhất cho các phép đo được lấy từ thang đo khoảng, trong khi Spearman thích hợp hơn cho các phép đo được lấy từ thứ tự . .