Thứ Tư, 5 tháng 11, 2014

Bài giảng G5: Xây dựng biểu đồ tương quan

Xin thông báo cùng các bạn quan tâm, tôi đã upload bài thứ 5 trong loạt bài bàn về phân tích dữ liệu bằng biểu đồ. Bài này (G5) hướng dẫn cách xây dựng một biểu đồ, mà thuật ngữ tiếng Anh gọi là scatterplot và tôi dịch là biểu đồ tương quan, bằng cách dùng ggplot2 trong R.



Đây là một dạng biểu đồ rất phổ biến trong khoa học mỗi khi nói đến phân tích tương quan, nhưng có khi được trình bày rất dở. Tôi xem rất nhiều bài báo khoa học xuất bản ở VN (tôi chỉ nói ngành y) thì tôi thấy tác giả trình bày quá đơn giản, không xứng đáng có trong bài báo. Thường thường họ chỉ trình bày mối tương quan đơn giản nhất, tức là chỉ có 2 biến X và Y. Mà, có khi họ dấu giếm những dữ liệu ngoại vi (chắc sợ bị nghi ngờ )! Nhưng họ không hiểu rằng nếu họ trình bày dữ liệu quá đẹp thì đó là một cách gieo nghi ngờ tốt nhất, bởi vì trong thực tế làm gì có những thí nghiệm hay nghiên cứu trơn tru!

Vấn đề trở nên thú vị hơn là mối tương quan giữa X và Y được trình bày theo một biến thứ 3. Hấp dẫn và có nhiều thông tin hơn nữa là mối tương quan phải có một đường biểu diễn thể hiện những nét tiêu biểu của mối tương quan. Bài này sẽ hướng dẫn các bạn làm chuyện hấp dẫn đó qua vài ví dụ cụ thể với dữ liệu thực tế. Địa chỉ bài giảng là:


Tuần qua chẳng có bạn đọc nào gửi mail khen cả, nên chẳng có gì bên lề để chia sẻ hay PR J.

0 nhận xét:

Đăng nhận xét