1. Suy rộng thống kê là gì?

Phép suy rộng thống kê (statistical inference) là quá trình đi đến các kết luận về tổng thể thống kê từ một mẫu các kết quả quan sát rút ra từ tổng thể đó. Chẳng hạn có 10.000 người Hà Nội đi nghỉ ở Cửa Lò mỗi năm. Nếu phỏng vấn 50 người về lý do họ đi nghỉ ở Cửa lò, chứ không phải ở nơi khác và có 25 người (50%) trả lời vì bãi tắm ở đây đẹp, chúng ta có thể suy ra rằng trong số 10.000 người Hà Nội đi nghỉ ở Cửa Lò, có 5000 người đến đó vì lý do bãi tắm đẹp. Đây chỉ là một ước lượng thống kê, thường gọi là phép suy rộng thống kê, vì chúng ta không thể nói chính xác là có 5000 người nghĩ như vậy nếu không phỏng vấn cả 10.000 người. Tuy nhiên, chúng ta có thể nói với độ tin cậy nhất định (chẳng hạn bằng 95%) ràng con số suy rộng 5000 người đúng với cả tổng thể.

Rõ ràng việc phỏng vấn tất cả mọi người vế lý do di nghỉ ở Cửa Lò rất khó khăn, tốn kém tiền của và thời gian. Phương pháp điều tra chọn mẫu và suy rộng thống kê tạo điều kiện cho chúng ta giảm được những khó khăn và chi phí này. Xác suất để tổng thể (10.000 người) hành động giống mẫu điều tra (50 người) có thể được xác định bằng phương pháp kiểm định giả thuyết thống kê.

Tóm lại thì suy rộng thống kê là quá trình suy luận ra các đặc điểm của một phân phối cơ bản bằng việc phân tích dữ liệu. Phân tích thống kê suy luận suy ra tính chất của tổng thế, điều này thì bao gồm cả các giả thuyết thử nghiệm và các ước tính phát sinh. Suy rộng thống kê giải thích rõ ràng về một tổng thể, sử dụng dữ liệu rút ra từ tổng thể thông qua hình thức lấy mẫu. 

Như vậy suy rộng thống kê statistical inference là quá trình đi đến các kết luận về tổng thể thống kê từ một mẫu các kết quả quan sát rút ra từ tổng thể đó. Tức là rút ra kết luận về một tổng thể nào đo thông qua kết quả quan sát và thông kê. 

 

2. Một số hình thức phổ biến nhất của thống kê.

Dưới đây là 05 hình thức phổ biến nhất của thống kê mà các bạn có thể biết đến. Cụ thể như sau:

- Thứ nhất: Ước lượng điểm, được hiểu là một giá trị đặc biệt xấp xỉ một thông số có tầm quan trọng

- Thứ hai là ước lượng khoảng thời gian, ví dụ như một khoảng tin cậy ( hoặc khoảng ước lượng) là một khoảng thời gian được xây dựng mà dựa trên một tập hợp dữ liệu rút ra từ một thống kê, chịu tác động của mẫu lặp lại của một bộ dữ liệu này. Như vậy khoảng thời gian đó sẽ chứa các giá trị tham số đúng với xác suất tại mức độ tin cậy nhất định

- Thứ ba là một khoảng thời gian đáng tin cậy, tức là một tập hợp các giá trị có giới hạn, ví dụ như là 95% của độ tin cậy. 

- Thứ tư là bác bỏ giả thuyết.

- Thứ năm là nhóm hoặc phân tầng các dữ liệu thành các nhóm. 

 

3. Các phương pháp luận trong thống kê

Phương pháp suy luận trong thống kê là một trong những vấn đề được nhiều người quan tâm, để có thể đưa ra những kết luận phân tích đúng đắn thì dĩ nhiên chúng ta phải sử dụng những phương pháp suy luận. Hiện nay thì có rất nhiều những phương pháp luận khác nhau, như là phương pháp suy luận mẫu lặp, suy luận bayes, suy luận dựa theo AIC, suy luận cơ sở so sánh và suy luận cấu trúc...Để có thể hiểu rõ hơn những phương pháp suy luận này thì chúng tôi đã đưa ra những đặc điểm cơ bản về từng phương pháp suy luận này, các bạn có thể tham khảo dưới đây. 

Suy luận phương pháp mẫu lặp:

 Mô hình này hiệu chỉnh việc sản xuất các mệnh đề bằng cách xem xét lặp lại việc lấy mẫu của bộ dữ liệu tương tự như một phương thức. Bằng cách xem xét các đặc điểm của mẫu theo mẫu lặp lại. Suy luận mô hình, khách quan và lý thuyết quyết định. Mô hình suy luận là nó chỉ được áp dụng trong các dạng của tần số xác suất, tức là các dạng lấy mẫu lặp lại một tổng thể. Cách tiếp cạn của Neyman phát triển một thủ tục dưới dạng xác suất thử nghiệm trước, khi thực hiện một thử nghiệm một quyết định về một quy tắc cho đến một kết luận như vậy là xác suất đúng được kiểm soát một cách hợp lý, một xác suất như vậy không cần phải có mô hình hoặc giải thích mẫu lặp lại. Ngược lại với Neyman thì Bayesian lại hoạt động dưới dạng xác suất có điều kiện, có nghĩa là xác suất có điều kiện dựa trên dữ liệu quan sát. Các mô hình thủ tục thử nghiệm có ý nghĩa và khoảng tin cậy có thể được xây dựng mà không liên quan đến chức năng tiện ích. 

Suy luận Bayes:

Cách tính toán của Bayesian mô tả mức độ tin cậy bằng cách đó là sử dụng ngôn ngữ của xác suất, độ tin cậy này có thể chấp nhận được. Suy luận của Bayse sử dụng khoảng tin cậy ở phía sau có sẵn như là cơ sở cho việc thực hiện mệnh đề thống kê. 

Suy luận của bayes được hiệu chỉnh với tham chiếu đến một tiện ích được nêu một cách rõ ràng, hoặc hàm dự kiến. Hình thức suy luận Bayseian tự động cung cấp các quyết định tối ưu trong một ý nghĩa lý thuyết quyết định. Suy luận Bayesian có thể được thực hiện cho bất kỳ vấn đề cơ bản, mặc dù không phải tất cả thống kê cần có một giải thích Bayessian.  Một số những người ủng hộ suy luận Bayes khẳng định suy luận phải trong phạm vi lý thuyết quyết định, và rằng suy luận Bayesian không nên kết luận với việc đánh giá, tổng hợp của độ tin cậy hậu nghiệm.

Suy luận dựa theo AIC: 

 AIC về cơ bản là một thước đo ước tính về chất lượng của mỗi mô hình kinh tế có sẵn khi chúng liên quan đến nhau cho một tập hợp dữ liệu nhất định, làm cho nó trở thành một phương pháp lý tưởng để lựa chọn mô hình.  Khi sử dụng AIC để đo lường chất lượng tương đối của các mô hình kinh tế cho một tập dữ liệu nhất định, AIC cung cấp cho nhà nghiên cứu một ước tính về thông tin sẽ bị mất nếu một mô hình cụ thể được sử dụng để hiển thị quá trình tạo dữ liệu.

Suy luận cơ sở so sánh:

Cơ sở so sánh suy luận là một phương pháp tiếp cận các kết luận thống kê dựa trên xác suất chuẩn còn gọi là phân phối cơ sở so sánh. Phương pháp này còn được gọi là xác định tính tất yếu, rất hạn chế trong các ứng dụng và thậm chí là sai lầm. 

Suy luận cấu trúc:

Barnard phát triển suy luận cấu trúc dựa trên sự phát triển ý tưởng của Fissher và Pitman. Barnard đã trình bày lại lý lẽ sau suy luận chuẩn trên một lớp hạn chế của mô hình mà những thủ tục cơ sở so sánh sẽ được xác định rõ ràng và hữu ích. 

Trên đây là toàn bộ những nội dung và thông tin mà chúng tôi muốn cung cấp cho các bạn có liên quan đến suy rộng thống kê statistical inference. Mong rằng thông qua những nội dung và thông tin mà chúng tôi cung cấp thì đã giúp cho các bạn có thêm những thông tin hiểu viết về suy rộng thống kê statistical inference, và hiểu suy rộng thống kê chính là quá trình đi đến kết luận và tổng kể thống kê từ một mẫu các kết quả quan sát rút ra từ tổng thể đó. Nếu các bạn còn có những câu hỏi thắc mắc khác có liên quan thì có thể liên hệ trực tiếp với chúng tôi thông qua số điện thoại của tổng đài tư vấn 19006162 để được chúng tôi trực tiếp giải đáp ngay hoặc là gửi yêu cầu về địa chỉ liên hệ qua emai:lienhe@luatminhkhue.vn để được chúng tôi phản hồi email trả lời những thắc mắc của các bạn. 

Ngoài ra thì các bạn còn có thể tìm hiểu thêm một số nội dung bài viết sau đây của chúng tôi để có thể hiểu thêm về suy rộng thống kê statistical inference dưới đây:

Suy rộng thống kê, phép (statistical inference) là gì ?

Thống kê kinh tế (economic statistics) là gì ?

Khu vực thống kê đô thị (METROPOLITAN STATISTICAL AREA - MSA) là gì 

Thống kê tiếng Anh là gì? Bảng, số liệu thống kê Tiếng Anh là gì?

Thống kê của đường sắt Mỹ (CARLOADINGS) là gì ?