Google có thể biết những gì bạn làm gì trên mạng

Trợ lí giáo sư của trường Đại học Princeton là Arvind Narayanan và sinh viên đã tốt nghiệp Steven Englehardt đã thực hiện nghiên cứu xem những trang web theo dõi hoạt động của người dùng sử dụng những kỹ thuật khác nhau như thế nào .

 

Trong bản nghiên cứu “Princeton Web Census” họ tuyên bố lớn nhất cho tới thời điểm hiện tại là Google , thông qua nhiều tên miền , đang theo dõi hoạt động của người dùng chiếm khoảng 80% trong Top 1 triệu tên miền .

Các nhà nghiên cứu tiết lộ những tên miền của Google , từ những trình duyệt  tải mã theo dõi , chiếm 5 công cụ theo dõi thông dụng nhất và 12 trong số Top 20 tên miền theo dõi người dùng .

Sau khi nghiên cứu Top 1 triệu tên miền , họ đã phát hiện hơn 81.000 tên miền khác nhau tải mã theo dõi . Sau khi xem xét kỹ hơn về dữ liệu , các nhà nghiên cứu nói rằng chỉ có 123 công cụ theo dõi “của bên thứ ba” tìm thấy trong hơn 1% tất cả những trang web .

Princeton Web Census giải thích “ Điều này cho thấy những công cụ theo dõi “bên thứ ba” mà người dùng thông thường sẽ trạm trán hàng ngày là con số rất nhỏ . Tuy nhiên điều này sẽ khác nếu như chúng ta xem xét những công cụ khác nhau này lại có thể sở hữu bởi cùng một công ty  . Trên thực tế những công cụ theo dõi của Google , Facebook và Twitter có mặt hơn 10% trang web” .

Như vậy khi bạn truy cập một trang web hoặc bấm vào một đường link thì một trong ba công ty  trên sẽ sẵn sàng để biết điều đó . Điều chắc chắn là Google đã tải những mã theo dõi trên 4 trông số 5 trang web .

Để thu thập được những kết quả trên , các chuyên gia đã dùng phần mềm OpenWPM nguồn mở . OpenWPM tải những trang web trong Chrome , FireFox và Internet Explorer , thu thập dữ  liệu công nghệ theo dõi tải trong mỗi trang .

OpenWPM sẽ xem xét những file JavaScript , Flash , những Cookie , những phông chữ và những kỹ thuật vân tay . Một trong những công nghệ theo dõi mới nhất được phát hiện dùng API AudioContext . Nó gửi những âm thanh tần số thấp tới PC của người dùng để xác định PC xử lí dữ liệu như thế nào , tạo ra vân tay riêng dựa trên khả năng phần cứng và phần mềm của người dùng . Nếu bạn muốn kiểm tra vân tay âm thanh của bạn có thể vào trang demo được những nhà nghiên cứu lập ra .

Kết quả của nghiên cứu này không có gì khiến chúng ta phải ngạc nhiên . Một báo cáo tương tự được MIT và Oxford công bố trong tuần này tiết lộ những Tag vị trí Twitter chỉ với vài Tweet có thể tiết lộ nhiều chi tiết về người chủ tài khoản , như địa chỉ thực , thói quen , lịch sử y tế . Tất nhiên dữ liệu này được Twitter thu thập lại và dùng cho mục đích quảng cáo .

Việc theo dõi người dùng  không phải chỉ diễn ra trên Web . Báo cáo mới đây của Stanford cho thấy Metadata cuộc gọi điện thoại có thể được dùng để biết thông tin chi tiết cá nhân của người chủ điện thoại .

Tất cả những nghiên cứu trên cho thấy ngày càng trở nên khó khăn để không bị ai nhòm ngó vào cuộc sống cá nhân . Một số người có thể chặn vân tay dựa trên HTML5 Canvas nhưng họ vẫn phải dùng điện thoại trong những cuộc sống hàng ngày . Nếu không dùng điện thoại thì WebRTC tiết lộ địa chỉ IP thực từ phía sau VPN . Bất kì sự cố gắng của người dùng để tránh bị theo dõi thì vẫn có một ai đó đang theo dõi họ từ bóng tối .

Bạn có thể xem báo cáo đầy đủ nghiên cứu của Princeton tại đây .