1. Khái niệm biểu đồ tương quan
Biểu đồ tương quan (scatter diagram) Là hình thức biểu diễn các cặp giá trị của biến số độc lập và biến phụ thuộc bằng hình ảnh. Để làm cho những số liệu này có ý nghĩa, người ta phải vẽ một đường thích hợp đi qua các điểm biểu thị mối quan hệ giữa biến độc lập và biến phụ thuộc. Một biểu đồ tương quan có thể được sử dụng khi một biến liên tục nằm dưới sự kiểm soát của người thử nghiệm và biến còn lại phụ thuộc vào nó hoặc khi cả hai biến liên tục đều độc lập. Nếu một tham số tồn tại được tăng lên và / hoặc bị giảm đi một cách có hệ thống, nó được gọi là tham số điều khiển hoặc biến độc lập và được tùy chỉnh vẽ dọc trục hoành. Biến được đo hoặc biến phụ thuộc được tùy chỉnh vẽ dọc trục tung. Nếu không có biến phụ thuộc tồn tại, một trong hai loại biến có thể được vẽ trên một trong hai trục và một độ phân tán sẽ chỉ minh họa mức độ tương quan (không phải nguyên nhân) giữa hai biến.
Biểu đồ này được vẽ bằng cách sử dụng các điểm trên mặt phẳng tọa độ, với trục hoành biểu diễn biến độc lập (biến nguyên nhân) và trục tung biểu diễn biến phụ thuộc (biến kết quả). Biểu đồ tương quan giúp ta có thể nhận xét về mức độ và hướng của sự tương quan giữa hai biến số. Nếu các điểm trên biểu đồ có xu hướng nằm gần một đường thẳng, ta nói hai biến có tương quan tuyến tính. Nếu đường thẳng có dốc dương, ta nói hai biến có tương quan dương, tức là khi biến độc lập tăng thì biến phụ thuộc cũng tăng. Nếu đường thẳng có dốc âm, ta nói hai biến có tương quan âm, tức là khi biến độc lập tăng thì biến phụ thuộc giảm. Nếu các điểm trên biểu đồ không có xu hướng nằm gần một đường thẳng nào, ta nói hai biến không có tương quan hoặc có tương quan phi tuyến.
Biểu đồ tương quan hay có tên gọi khác là biểu đồ phân tán tiếng anh có tên Scatter diagram. Đây là một dạng biểu đồ được thực hiện nhằm biểu thị mối tương quan giữa nguyên nhân và kết quả giữa các yếu tố ảnh hưởng đến chất lượng. Biểu đồ này được dựng bởi các điểm theo tọa độ toán học nhằm xác định các mối tương quan khác nhau giữa hai biến cũng như hai bộ dữ liệu được vẽ trên đồ thị
- Trục X được sử dụng cho biến được dự đoán - Biến phụ thuộc
- Trục Y được sử dụng cho việc đưa ra dự đoán - Biến độc lập
Sau khi đã xác định được mối tương quan này thì bạn có thể dự đoán được kết quả của biến phụ thuộc dựa trên số đo của biến độc lập

Biểu đồ phân tán là một loại biểu đồ sử dụng các điểm để thể hiện mối quan hệ giữa hai biến định lượng. Nó có thể giúp bạn phân tích hình mẫu, tuyến tính, bờ dốc và độ tập trung của dữ liệu. Một số ví dụ về biểu đồ phân tán là:
- Biểu đồ phân tán về mối quan hệ giữa nhiệt độ và tốc độ làm đông nước đá. Biểu đồ này cho thấy có một mối quan hệ nghịch biến giữa hai biến, tức là khi nhiệt độ tăng thì tốc độ làm đông giảm và ngược lại. Biểu đồ này cũng cho thấy mối quan hệ này khá mạnh, vì các điểm phân tán gần với một đường thẳng.
- Biểu đồ phân tán về mối quan hệ giữa chiều cao và cân nặng của một nhóm người. Biểu đồ này cho thấy có một mối quan hệ thuận biến giữa hai biến, tức là khi chiều cao tăng thì cân nặng cũng tăng và ngược lại. Biểu đồ này cũng cho thấy mối quan hệ này khá yếu, vì các điểm phân tán rộng và không theo một hướng rõ ràng.
- Biểu đồ phân tán về mối quan hệ giữa số lượng bài viết trên blog và số lượng lượt xem. Biểu đồ này cho thấy không có một mối quan hệ rõ ràng giữa hai biến, vì các điểm phân tán không có hình mẫu hay xu hướng nào. Có thể có những yếu tố khác ảnh hưởng đến số lượng lượt xem như chất lượng bài viết, chủ đề, thời gian, v.v…
2. Đặc điểm của biểu đồ tương quan
- Một chỉ tiêu chất lượng được tạo ra nhờ sự kết hợp và tác động của nhiều yếu tố. Giữa chất lượng và các yếu tố có mối quan hệ chặt chẽ
- Để đánh giá tình hình chất lượng người ta có thể dùng hai hoặc nhiều dữ liệu cùng một lúc thể hiện mối tương quan giữa các yếu tố trên đồ thị
- Thông quan đó có thể xác định được khuynh hướng tác động của nguyên nhân đang xem xét tới kết quả cụ thể đạt được
- Nó thể hiện mối quan hệ giữa hai biến định lượng bằng cách sử dụng các điểm trên mặt phẳng tọa độ. Giúp phát hiện các hình mẫu, tuyến tính, bờ dốc và độ tập trung của dữ liệu. Nó có thể giúp dự đoán kết quả của biến phụ thuộc dựa trên biến độc lập nếu có một mối quan hệ rõ ràng giữa chúng.
- Nó cần có số lượng dữ liệu đủ lớn và đại diện cho phạm vi quan sát để có thể phản ánh chính xác mối quan hệ giữa hai biến. Biểu đồ không thể cho biết nguyên nhân và kết quả của mối quan hệ giữa hai biến, chỉ có thể cho biết sự tương quan thống kê giữa chúng.
Thông thường trước khi tiến hành phân tích tương quan hoặc phân tích quy hồi thì bạn cần kiểm tra dữ liệu với biểu đồ tương quan. Đây là biểu đồ có thể cung cấp các thông tin một cách hữu ích về việc phát hiện mối quan hệ tuyến tính giữa hai biến và phát hiện các điểm ngoại lệ. Đồng thời biểu đồ còn giúp bạn cung cấp một vài mô tả ban đầu về mối quan hệ giữa hai biến. Cách sử dụng biểu đồ tương quan (phân tán) trong thực tế là: Bạn có thể sử dụng biểu đồ phân tán để khảo sát mối quan hệ giữa chi phí quảng cáo và doanh số bán hàng của một sản phẩm. Biểu đồ này sẽ cho bạn thấy liệu có một xu hướng tăng hoặc giảm doanh số khi chi phí quảng cáo thay đổi hay không, và mức độ ảnh hưởng của chi phí quảng cáo lên doanh số là bao nhiêu. Bạn có thể sử dụng biểu đồ phân tán để kiểm tra mối quan hệ giữa nhiệt độ và lượng khí CO2 trong không khí. Biểu đồ này sẽ cho bạn thấy liệu có một mối liên hệ nào giữa hai yếu tố này hay không, và nếu có thì hướng và mức độ của mối liên hệ là như thế nào. Bạn có thể sử dụng biểu đồ phân tán để so sánh hiệu suất của các nhân viên trong công ty. Biểu đồ này sẽ cho bạn thấy liệu có một sự khác biệt nào về hiệu suất giữa các nhân viên hay không, và nếu có thì nhân viên nào làm việc hiệu quả hơn hay kém hơn so với trung bình.
3. Mục đích, ý nghĩa áp dụng
3.1 Mục đích
Biểu đồ tương quan được sử dụng để giải quyết các vấn đề và xác định điều kiện tối ưu bằng cách phân tích định lượng mối quan hệ nhân quả giữa hai nhân tố. Biểu đồ tương quan được sử dụng để:
- Xác định mức độ tương quan giữa hai biến số
- Xác định có tồn tại mối quan hệ giữa hai đặc tính bằng cách đánh dấu các cặp số liệu trên hệ tọa độ Oxy hoặc đánh dấu một đặc tính trên trục Oy còn đặc tính khác trên trục Ox
- Khi xác định có tồn tại mối quan hệ giữa hai đặc tính tức là chúng có quan hệ với nhau. Khi một đặc tính tăng thì đặc tính khác cũng tăng, chúng có mối quan hệ thuận và các điểm dữ liệu sẽ nằm trong vùng elip nghiêng về bên phải. Nếu một đặc tính giảm mà đặc tính khác tăng chúng có mối quan hệ nghịch. Khi đó, các điểm của dữ liệu nằm trong vùng elip nghiêng về bên trái
- Khi xác định hai đặc tính không có mối quan hệ, các điểm dữ liệu phân tán trong một vòng tròn. Mối quan hệ được thể hiện qua giá trị của hệ số hồi quy hay hệ số tương quan r. Giá trị này gần với -1 (<0,85) thì có mối quan hệ nghịch rất lớn (quan hệ nghịch chặt). Giá trị gần với +1 (>0,85) thì có mối quan hệ thuận rất lớn (quan hệ thuận chặt). Giá trị này gần 0 thì mối quan hệ giữa hai đặc tính rất kém. Trên cơ sở phân tích biểu đồ tương quan, hệ số tương quan r và phương trình hồi quy, có thể dự báo được đặc tính chất lượng và đặc tính quá trình, cũng như xác định các yếu tố cần được kiểm soát chặt chẽ để đảm bảo chất lượng sản phẩm.
3.2 Vai trò ý nghĩa
Trong việc phân tích và sử dụng các dữ liệu với nhau chúng ta chỉ dựa trên các dữ liệu sử dụng bảng biểu để đưa ra kết luận. Những điều này thường thiếu chính xác và không bao quát hết được. Việc thể hiện được các mối tương quan với nhau, sự liên hệ giữa 2 biến số sẽ rất khó khăn trước đó. Nhờ có biểu đồ tương quan mà chúng ta sẽ có thể thể hiện được mối quan hệ giữa hai biến số với nhau. Dưới đây là một vài ý nghĩa mà khi áp dụng biểu đồ
- Nó giúp bạn xác định hướng và mức độ của mối tương quan giữa hai biến định lượng. Nếu đường xu hướng có dốc dương, có nghĩa là hai biến có mối tương quan thuận biến, tức là khi một biến tăng thì biến kia cũng tăng và ngược lại. Nếu đường xu hướng có dốc âm, có nghĩa là hai biến có mối tương quan nghịch biến, tức là khi một biến tăng thì biến kia giảm và ngược lại. Nếu đường xu hướng gần như ngang hoặc không rõ ràng, có nghĩa là hai biến không có mối tương quan hoặc rất yếu.
- Giúp bạn dự đoán giá trị của biến phụ thuộc dựa trên giá trị của biến độc lập. Bạn có thể sử dụng công thức của đường xu hướng để tính toán giá trị mong muốn của biến phụ thuộc khi biết giá trị của biến độc lập. Ví dụ: nếu công thức của đường xu hướng là y = 2x + 5, bạn có thể dự đoán rằng khi x = 10, y sẽ bằng 25.
- Nó giúp bạn kiểm tra sự phù hợp của mô hình hồi quy cho dữ liệu. Bạn có thể so sánh các điểm phân tán với đường xu hướng để xem liệu chúng có gần với nhau hay không. Nếu các điểm phân tán nằm gần với đường xu hướng, có nghĩa là mô hình hồi quy khớp với dữ liệu và có thể giải thích được phần lớn biến thiên của dữ liệu. Nếu các điểm phân tán nằm xa với đường xu hướng, có nghĩa là mô hình hồi quy không khớp với dữ liệu và không thể giải thích được nhiều biến thiên của dữ liệu.
- Bạn có thể phát hiện và đánh giá mối quan hệ giữa hai biến định lượng, có thể là mối quan hệ nguyên nhân - kết quả hoặc mối quan hệ tác động lẫn nhau. Nó giúp bạn dự đoán kết quả của một biến khi biết giá trị của biến khác, có thể là để tối ưu hóa hoặc kiểm soát một quá trình nào đó. Ngoài ra bạn có thể kiểm tra sự phù hợp của mô hình hồi quy cho dữ liệu, có thể là để xác nhận hoặc bác bỏ một giả thuyết nào đó.
4. Các bước lập biểu đồ tương quan
Thông thường ta lập biểu đồ tương quan trên Excel. Dưới đây các bước giúp bạn lập biểu đồ hoàn chỉnh
Bước 1: Chuẩn bị dữ liệu cho biểu đồ. Bạn cần có một bảng dữ liệu gồm hai cột, một cột cho biến độc lập và một cột cho biến phụ thuộc. Các giá trị của hai biến phải là số liên tục. Ví dụ: bạn có một bảng dữ liệu về chi phí quảng cáo và doanh số bán hàng của một sản phẩm.
Bước 2: Chọn dữ liệu cho biểu đồ. Bạn có thể chọn toàn bộ bảng dữ liệu hoặc chỉ chọn hai cột chứa giá trị của hai biến. Sau đó, bạn vào tab Insert > biểu đồ phân tán > chọn loại biểu đồ phân tán mong muốn. Ví dụ: bạn chọn loại biểu đồ phân tán có các điểm tròn.
Bước 3: Thêm đường xu hướng vào biểu đồ. Đường xu hướng là một đường thẳng hoặc cong được vẽ qua các điểm phân tán để thể hiện xu hướng của dữ liệu. Để thêm đường xu hướng, bạn nhấp chuột phải vào một điểm bất kỳ trên biểu đồ, chọn Add Trendline. Sau đó, bạn có thể chọn loại đường xu hướng mong muốn trong hộp thoại Format Trendline2. Ví dụ: bạn chọn loại đường xu hướng tuyến tính.
Bước 4: Chỉnh sửa biểu đồ theo ý muốn. Bạn có thể thay đổi tên biểu đồ, tên các trục, nhãn dữ liệu, chú thích, màu sắc, kiểu nét vẽ, v.v… để làm cho biểu đồ trở nên rõ ràng và sinh động hơn. Bạn có thể sử dụng các công cụ trong tab Design và Format để chỉnh sửa biểu đồ. Ví dụ: bạn thay đổi tên biểu đồ thành "Mối quan hệ giữa chi phí quảng cáo và doanh số bán hàng"
Sau khi các hệ số được thể hiện trên đồ thị lúc này bạn cần tiến hành hai biến số theo hệ số tương quan với nhau. Mỗi tương quan này được thể hiện dưới dạng sau:
- Tương quan dương: Là mối tương quan trong đó sự gia tăng của biến số nguyên nhân dẫn đến sự gia tăng của biến số kết quả
- Tương quan âm: Là mối tương quan trong đó sự gia tăng của biến số nguyên nhân sẽ làm giảm kết quả
- Không có tương quan: Giữa hai biến số không có mối tương quan nào với nhau. Trường hợp này cho thấy vấn đề chất lượng do các nguyên nhân khác gây ra.
Bạn đọc có thể tham khảo thêm nội dung bài viết sau liên quan về chủ đề này: Biểu đồ tự tương quan (Correlogram)
Trên đây là chia sẻ của luật Minh Khuê về chủ đề "Biểu đồ tương quan (scatter diagram) là gì ?" Mong rằng bài viết trên của chúng tôi sẽ là tài liệu tham khảo hữu ích dành cho bạn. Bạn đọc nếu có bất kỳ thắc mắc nào vui lòng liên hệ tổng đài 1900.6162 của chúng tôi để được tư vấn trực tiếp, giải đáp thắc mắc một cách nhanh chóng và kịp thời. Quý khách hàng có yêu cầu báo giá dịch vụ tư vấn vui lòng gửi yêu cầu về địa chỉ email: lienhe@luatminhkhue.vn. Cảm ơn bạn đọc đã quan tâm theo dõi nội dung tư vấn của chúng tôi. Xin trân trọng cảm ơn quý khách.