Hypothesis Testing là gì? Quy trình Hypothesis Testing chuẩn nhất

Hypothesis Testing là gì? Quy trình Hypothesis Testing chuẩn nhất
Bảo Linh

04/12/2023

329

0

Chia sẻ lên Facebook
Hypothesis Testing là gì? Quy trình Hypothesis Testing chuẩn nhất

Hypothesis Testing là gì? Trong bối cảnh công nghệ số hoá, các quyết định đưa ra đều phải dựa trên dữ liệu và phân tích thống kê, đây cũng chính là lý do giả thuyết đóng vai trò vô cùng quan trọng. Nếu không có giả thuyết cùng các bài kiểm tra giả thuyết thì các nhà phân tích có thể đưa ra những quyết định sai lầm. Để tìm hiểu kỹ hơn về định nghĩa, vai trò và các bước thực hiện Hypothesis Testing, hãy cùng Topchuyengia theo dõi ngay bài viết dưới đây.

 

Khi không có sự hiểu biết đúng đắn về Hypothesis Testing, đặc biệt là điều tra sử dụng các số liệu thống kê, quá trình thực hiện Hypothesis Testing có thể mất rất nhiều thời gian và làm ảnh hưởng đến việc đánh giá giả thuyết, cũng như kết quả nghiên cứu cuối cùng. Nếu muốn khắc phục những vấn đề này, hãy nhanh chóng liên lạc các chuyên gia và khóa học Data Analyst giỏi tại Askany để được hỗ trợ tốt nhất.

 

Hypothesis Testing là gì?

Hypothesis Testing là gì?
Hypothesis Testing là gì?

Hypothesis Testing (kiểm định giả thuyết) là thủ tục các bước điều tra, nghiên cứu và kiểm nghiệm những ý tưởng thông qua số liệu thống kê thực tế. Các nhà khoa học thường dùng Hypothesis Testing để kiểm tra các dự đoán cụ thể hoặc các giả thuyết suy luận từ lý thuyết.

 

Hiểu đơn giản hơn thì đây là một hoạt động trong thống kê, các nhà phân tích sẽ kiểm tra một giả định nào đó từ dữ liệu mẫu để có thể đưa ra kết luận về phân phối thống kê hoặc tập hợp tham số.

 

Hypothesis Testing được thực hiện dựa trên các thông số của một hoặc nhiều quần thể trong nhiều tình huống khác nhau. Với từng tình huống, quá trình này bắt đầu từ việc xây dựng các giả thuyết vô hiệu và giả thuyết thay thế về dân số.

 

Bên cạnh giá trị trung bình của tổng thể thì quy trình kiểm định giả thuyết có sẵn còn cho ra các tham số về dân số như phương sai, tỷ lệ, độ lệch chuẩn và trung bình. Thêm vào đó, Hypothesis Testing còn được sử dụng trong phân tích hồi quy và tương quan nhằm xác định mối quan hệ hồi quy và hệ số tương quan có ý nghĩa về thống kê hay không. Data Analyst là làm gìHypothesis Testing là bước quan trọng trong việc kiểm định giả thuyết dữ liệu.

 

>>>Xem thêm: Đăng ký ngay khóa học dạy BA uy tín, chất lượng hiện nay.

Vai trò của Hypothesis Testing

Hypothesis Testing được sử dụng với mục đích đánh giá một giả thuyết nào đó dựa trên các dữ liệu thực tế, từ đó giúp các nhà phân tích cung cấp bằng chứng xác minh tính hợp lý của giả thuyết đã được đánh giá trước đó.

 

Các nhà phân tích có thể thực hiện Hypothesis Testing bằng cách đo lường, kiểm tra một đơn vị số liệu, dân số hoặc tài liệu ngẫu nhiên nào đó đang được phân tích, điều này sẽ cho ra kết quả khách quan nhất.

Xem thêm các bài viết khác:

Cơ chế hoạt động của Hypothesis Testing

Cơ chế hoạt động của Hypothesis Testing
Cơ chế hoạt động của Hypothesis Testing

Trong quá trình Hypothesis Testing, các nhà phân tích sẽ sử dụng chung một mẫu thống kê để thực hiện kiểm tra hai giả thuyết khác nhau, bao gồm giả thuyết vô hiệu - thường được mọi người thắc mắc là null hypothesis là gì và giả thuyết thay thế. Hiểu rõ thống kê là gì là giúp các Data Analyst đưa ra phương pháp hiệu quả hơn trong quá trình Hypothesis Testing.

 

Giả thuyết vô hiệu phản ánh sử bình đẳng giữa các tham số, trong khi đó, giả thuyết thay thế lại trái ngược hoàn toàn. Để dễ hình dung hơn hãy xét ví dụ sau:

 

Với giả thuyết vô hiệu, lợi tức trung bình của tổng thể bằng 0. Tuy nhiên, với giả thuyết thay thế thì lợi tích trung bình của tổng thể không bằng 0.

 

Như vậy, hai giả thuyết này sẽ loại trừ lẫn nhau, cái này đúng thì cái kia sai và cái nào đúng thì luôn đúng, không thể bị thay đổi.

Các bước Hypothesis Testing chuẩn nhất

Nêu giả thuyết vô hiệu và giả thuyết thay thế

Nêu giả thuyết vô hiệu và giả thuyết thay thế
Nêu giả thuyết vô hiệu và giả thuyết thay thế

Đầu tiên, bạn cần đưa ra giả thuyết ban đầu được bạn dự đoán, đây cũng là điều mà bạn muốn điều tra. Giả thuyết này có ký hiệu là Ha, giả thuyết vô hiệu được đưa ra có ký hiệu là H0, Ha có xu hướng trái ngược với H0.

 

Xét ví dụ: Nếu bạn muốn kiểm tra giới tính có mối liên hệ nào với chiều cao hay không. Dựa theo kiến thức về sinh lý học, bạn có thể xây dựng giả thuyết nam giới cao hơn nữ giới và để bắt đầu kiểm định giả thuyết này, bạn tiến hành đặt ký hiệu cho các giả thuyết như sau: 

  • H0 là chiều cao trung bình của nam giới thấp hơn nữ giới.
  • Ha là chiều cao trung bình của nam giới cao hơn nữ giới.

Thu thập dữ liệu

Tiếp theo, để đưa ra được những bằng chứng xác thực và có giá trị, bạn cần tiến hành lấy mẫu và thu thập dữ liệu với cách thức được quy định. Trong trường hợp, dữ liệu bạn thu được không mang tính đại diện thì suy luận thống kê về vấn đề mà bạn đang quan tâm có thể không chính xác.

 

Xét ví dụ: Để kiểm tra khác biệt về chiều cao trung bình của nam và nữ, bạn phải thực hiện thu thập thông tin về số lượng nam nữ bằng nhau, ở các tầng lớp xã hội khác nhau, cũng như những yếu tố ảnh hưởng đến chiều cao của hai giới, điều này giúp tạo nên sự khách quan và chính xác nhất. Ngoài ra, bạn cũng cần xem xét các yếu tố vị trí địa lý, chẳng hạn như quốc gia. Hãy chú ý rằng, nguồn dữ liệu càng ở phạm vi rộng và nhiều thông tin thì càng tiềm năng.

Kiểm tra thống kê

Kiểm tra thống kê
Kiểm tra thống kê

Hiện nay, có rất nhiều bài kiểm tra thống kê có sẵn, tuy nhiên chúng đều phải thực hiện dựa trên sự so sánh phương sai trong nhóm với phương sai giữa các nhóm. Dữ liệu phân tích thống kê sẽ phản ánh việc phương sai giữa các nhóm có ít hoặc không có sự trùng lặp giữa các nhóm bằng cách hiển thị giá trị p thấp. Ngược lại, nếu phương sai trong nhóm chênh lệch nhiều thì dữ liệu phân tích thống kê của bạn phản ánh điều này qua giá trị p cao.

Quyết định bác bỏ hay không bác bỏ giả thuyết vô hiệu

Với kết quả của bài kiểm tra thống kê, bạn sẽ đưa ra được kết luận bác bỏ hoặc không bác bỏ giả thuyết vô hiệu. Đa phần trong các trường hợp, bạn sẽ phải dựa theo giá trị p để đưa ra kết luận này. Mức sai sót để bác bỏ giả thuyết vô hiệu được cho phép là 5%. Nhưng với một số trường hợp, mức sai sót có thể được giảm xuống 1% nhằm giảm thiểu rủi ro và nâng cao tính chân thực của giả thuyết.

Trình bày những phát hiện

Trong bước này, bạn nên tóm tắt dữ liệu của thử nghiệm thống kê và thảo luận xem giả thuyết ban đầu có được hỗ trợ bởi kết quả thống kê không. Quay ngược lại với giả thuyết ban đầu, đưa ra kết luận về kết quả thử nghiệm có tương thích với giả thuyết thay thế không, nếu không thì xét nó phù hợp với giả thuyết vô hiệu.

 

Lưu ý, Hypothesis Testing không nhằm mục đích đưa ra quyết định bác bỏ hay không bác bỏ giả thuyết, bởi nó được sử dụng để kiểm tra mẫu đo lường có thể xuất hiện ngẫu nhiên như thế nào. Nếu chúng ta bác bỏ các giả thuyết vừa nghiên cứu chỉ vì số liệu thống kê không phù hợp, điều này có nghĩa khẳng định chúng không có bất kỳ khả năng nào xuất hiện cho dù là tình cờ. Thực tế, mọi chuyện đều có thể xảy ra, thứ mà chúng ta kiểm nghiệm  chỉ mang tính xác suất, không hoàn toàn đúng cũng không hoàn toàn sau. Vậy nên, chúng ta sẽ không kết luận bác bỏ giả thuyết nào mà chỉ kết luận giả thuyết đó có phù hợp với kết quả thử nghiệm hay không.

Hy vọng qua bài viết, bạn đã biết Hypothesis Testing là gì cùng với những thông tin quan trọng nhất về Hypothesis Testing. Bên cạnh đó, để tối ưu thời gian thực hiện quá trình Hypothesis Testing, đồng thời có thể đưa ra kết quả phù hợp cho giả thuyết, bạn có thể trực tiếp gặp gỡ các chuyên gia Data Analyst trên ứng dụng Askany để được hỗ trợ toàn diện và học hỏi cách tiến hành các bước Hypothesis Testing dựa trên những kinh nghiệm làm nghề quý báu của họ.

Bình luận

Kinh nghiệm thực tế

Tư vấn 1:1

Uy tín

Đây là 3 tiêu chí mà TOPCHUYENGIA luôn muốn hướng tới để đem lại những thông tin hữu ích cho cộng đồng