1. Trung vị (median) được hiểu như thế nào?

Trong tiếng Anh, trung vị là Median. Trung vị là số nằm giữa trong một tập dữ liệu có các số được sắp xếp. Để xác định giá trị trung vị trong một chuỗi số, trước tiên các số phải được sắp xếp theo thứ tự giá trị từ thấp nhất đến cao nhất hoặc cao nhất đến thấp nhất. Trung vị có thể được sử dụng để xác định giá trị trung bình gần đúng hoặc giá trị trung bình, tuy nhiên không được nhầm lẫn trung vị với giá trị trung bình thực tế.

Nếu tập dữ liệu có số lượng điểm dữ liệu là lẻ, trung vị là số nằm ở giữa có cùng một số lượng điểm dữ liệu ở bên dưới và bên trên.

Nếu tập dữ liệu có số lượng điểm dữ liệu là chẵn, để tìm giá trị trung vị cần xác định cặp điểm dữ liệu ở giữa sau đó cộng 2 số này lại và chia cho hai.

Trung vị được sử dụng thay cho giá trị trung bình khi có các điểm ngoại lai trong chuỗi dữ liệu, các điểm ngoại lai có thể làm lệch giá trị trung bình của các giá trị. Trung vị của một chuỗi ít bị ảnh hưởng bởi các điểm ngoại lai hơn giá trị trung bình.

Để Median dễ hiểu hơn, có thể thông qua ví dụ sau:

Giả sử ta có một căn phòng với 19 người nghèo và 1 tỷ phú. Các người này đã bỏ tất cả số tiền trong túi của họ ra và đặt lên một cái bàn. Trong đó, mỗi người nghèo đặt 5 đồng lên bàn và người tỉ phú đặt 1 tỷ đồng (109 đồng) lên bàn. Tổng số tiền lúc này là 1.000.000.095 đồng.

Nếu chúng ta chia đều số tiền này cho 20 người, mỗi người sẽ nhận được số tiền là 50.000.004 đồng và 75 xu. Số tiền này trung bình cho mỗi người trong phòng. Tuy nhiên, số trung vị của số tiền này lại là 5 đồng. Điều này có nghĩa là, chúng ta có thể chia thành 2 nhóm, mỗi nhóm có 10 người và nói rằng, người trong nhóm thứ nhất đưa ra số tiền không nhiều hơn 5 đồng, và người trong nhóm thứ hai đưa ra số tiền không ít hơn 5 đồng.

Như vậy, số trung vị là số tiền mà một người đại diện trong số các người trong căn phòng này mang đến. Trái lại, giá trị trung bình không điển hình một chút nào, bởi vì không ai, bao gồm cả người nghèo và tỉ phú, đã đưa ra một số tiền gần bằng 50.000.004,75 đồng. Do đó, số trung vị là một phép đo trung tâm tốt hơn giá trị trung bình trong trường hợp này để mô tả số tiền mà một người điển hình mang đến.

 

2. Các đặc điểm của trung vị

Dưới đây là một số đặc điểm của số trung vị:

- Số trung vị không bị ảnh hưởng bởi các giá trị ngoại lệ (outlier) trong tập dữ liệu. Các giá trị ngoại lệ thường là các giá trị cực đại hoặc cực tiểu của tập dữ liệu, có thể là do lỗi đo lường hoặc ghi nhận sai sót. Vì vậy, khi tính toán số trung vị, các giá trị ngoại lệ không ảnh hưởng đến kết quả cuối cùng.

- Số trung vị là một giá trị dễ hiểu và dễ sử dụng trong các phép tính toán khác. Vì nó được tính toán bằng cách chọn giá trị nằm ở giữa của tập dữ liệu, số trung vị có thể dễ dàng được tính toán và sử dụng trong các phép tính toán khác như phương sai, độ lệch chuẩn, ...

- Số trung vị thường được sử dụng trong các tập dữ liệu có phân phối không đối xứng. Trong trường hợp phân phối không đối xứng, giá trị trung bình có thể không phản ánh đúng giá trị trung tâm của tập dữ liệu, vì nó bị ảnh hưởng bởi các giá trị ngoại lệ. Trong khi đó, số trung vị sẽ phản ánh được giá trị trung tâm của tập dữ liệu một cách chính xác hơn.

- Số trung vị không thể được tính toán cho tập dữ liệu không thứ tự hoặc không có thứ tự. Do đó, nếu muốn tính toán số trung vị, tập dữ liệu phải được sắp xếp theo thứ tự tăng dần hoặc giảm dần.

 

3. Cách tìm median

Để xác định số trung vị của một tập hợp các giá trị, ta thực hiện các bước sau:

- Sắp xếp các giá trị trong tập hợp theo thứ tự tăng dần hoặc giảm dần.

- Nếu số lượng phần tử trong tập hợp là số lẻ, số trung vị sẽ là giá trị ở giữa của tập hợp. Nếu số lượng phần tử là số chẵn, số trung vị sẽ là trung bình của hai giá trị ở giữa.

Ví dụ, giả sử ta có tập hợp các giá trị sau: 2, 4, 5, 7, 8, 10. Để tìm số trung vị của tập hợp này, ta thực hiện các bước sau:

- Sắp xếp các giá trị: 2, 4, 5, 7, 8, 10 -> 2, 4, 5, 7, 8, 10

- Vì số lượng phần tử là số chẵn, ta lấy trung bình của hai giá trị ở giữa: (5 + 7) / 2 = 6

Vậy số trung vị của tập hợp giá trị này là 6.

Nếu tập hợp có nhiều giá trị trùng nhau ở giữa, thì số trung vị vẫn là giá trị đó. Ví dụ, nếu tập hợp giá trị là: 2, 3, 5, 5, 5, 7, 8, thì số trung vị vẫn là 5.

 

4. Ứng dụng của số trung vị (median)

Trung vị được ưu tiên sử dụng trong trường hợp tập hợp dữ liệu có giá trị ngoại lai, tức là các giá trị bất thường so với các giá trị còn lại. Khi đó, trung vị cho phép đo lường xu hướng tập trung của dữ liệu một cách chính xác hơn. Tuy nhiên, nếu tập hợp dữ liệu lớn và không có giá trị ngoại lai, số trung bình lại đo lường chính xác hơn.

Ví dụ, giá trị ngoại lai trong dãy số là tuổi của các học viên trong lớp tiếng Anh (10, 15, 13, 17, 18, 65, 20, 19, 22, 16, 21, 14) là 65. Giá trị này khiến cho số trung bình chênh lệch rất nhiều so với trung vị (20,83 so với 17,5).

Trung vị được sử dụng rộng rãi trong các lĩnh vực kỹ thuật, ví dụ như trong việc xây dựng mạng lưới điện, lắp đặt đường ống dẫn nước và bố trí các trạm đỗ xe ở công cộng nơi thuận lợi để đạt được hiệu quả.

Một ưu điểm của trung vị là nó không bị ảnh hưởng bởi các giá trị biên độ trong dãy số, đồng thời dễ hiểu và dễ tính toán. Tuy nhiên, một nhược điểm của nó là không thể dự đoán chính xác như số trung bình, thường được sử dụng để thay thế hoặc bổ sung cho số trung bình trong trường hợp cần thiết.

Ngoài ra, số trung vị (median) được sử dụng trong nhiều lĩnh vực khác nhau và có nhiều ứng dụng khác, ví dụ như:

- Trong thống kê: Số trung vị là một phép đo trung tâm của tập dữ liệu, được sử dụng để mô tả giá trị trung bình của tập dữ liệu. Nó có thể được sử dụng để so sánh giữa các tập dữ liệu và đo lường sự khác biệt giữa chúng.

- Trong kinh tế: Số trung vị được sử dụng để tính toán thu nhập trung bình của một quốc gia hoặc khu vực. Nó cũng được sử dụng để tính toán các chỉ số tài chính như trung bình giá thành hoặc giá trị trung bình của các khoản đầu tư.

- Trong y học: Số trung vị được sử dụng để mô tả phân bố của các chỉ số sức khỏe như chiều cao, cân nặng, huyết áp, lượng đường trong máu, ... Nó có thể được sử dụng để so sánh giữa các nhóm người và đo lường sự khác biệt giữa chúng.

- Trong khoa học dữ liệu: Số trung vị là một trong các thống kê cơ bản được sử dụng để phân tích dữ liệu. Nó có thể được sử dụng để loại bỏ các giá trị ngoại lệ, làm giảm sự ảnh hưởng của chúng đến kết quả phân tích.

- Trong các ứng dụng máy tính: Số trung vị được sử dụng để phân tách các tập dữ liệu thành các nhóm có cùng phân phối. Nó cũng được sử dụng để tính toán các giá trị tương tự như phương sai và độ lệch chuẩn.

Trên đây là toàn bộ nội dung bài viết của Luật Minh Khuê liên quan đến vấn đề: Median hay số trung vị (median) là gì? Mọi thắc mắc chưa rõ hay có nhu cầu hỗ trợ vấn đề pháp lý khác, quý khách hàng vui lòng liên hệ với bộ phận tư vấn pháp luật trực tuyến qua số hotline: 1900.6162 hoặc gửi yêu cầu tư vấn qua email: lienhe@luatminhkhue.vn để được hỗ trợ và giải đáp kịp thời. Xin trân trọng cảm ơn quý khách hàng đã quan tâm theo dõi bài viết của Luật Minh Khuê.