Đây là bài viết thứ mười tám trong loạt bài liên tục giới thiệu các tính năng bảo vệ quyền riêng tư mới và sắp ra mắt trên iBrowe. Bài viết này trình bày công việc của Quản lý Sản phẩm & Kỹ sư Bảo mật Shivan Kaul Sahib, được đồng biên soạn bởi Shivan Kaul Sahib và Giám đốc Cấp cao về Quyền riêng tư Peter Snyder.
📋 Tóm tắt
iBrowe hiện cung cấp De-AMP – một tính năng mạnh mẽ giúp bạn không còn bị chuyển hướng đến các trang AMP do Google lưu trữ. Thay vào đó, bạn sẽ truy cập trực tiếp vào URL gốc của nhà xuất bản. ⚡ AMP (Accelerated Mobile Pages) làm tổn hại đến quyền riêng tư, bảo mật và trải nghiệm người dùng, đồng thời củng cố sự kiểm soát của Google đối với Web. Với De-AMP, iBrowe tự động ghi đè các liên kết AMP đã biết và chặn tải trang AMP – chuyển hướng bạn đến bài viết gốc trước khi bất kỳ mã AMP nào của Google được thực thi. Điều này giúp giảm tái sử dụng dữ liệu, tăng tốc độ tải trang và bảo vệ quyền riêng tư khi duyệt web. Tính năng De-AMP đã có trên bản Nightly, Beta và mặc định trong iBrowe 1.38 trên Desktop và Android (phiên bản iOS sẽ phát hành sau).
🔍 1. AMP là gì và tại sao nó gây hại?
1.1 Tổng quan về AMP
AMP (Accelerated Mobile Pages) là một phiên bản HTML rút gọn do Google phát triển, cho phép Google phục vụ nội dung bài viết của nhà xuất bản từ máy chủ của chính họ (ví dụ: google.com/amp/...
), ngay cả khi nội dung đó thuộc về các trang khác như nytimes.com
.
Trên kết quả tìm kiếm di động, Google nạp sẵn trang AMP dưới nền và hiển thị khi người dùng nhấp vào, khiến bạn tưởng rằng đang truy cập trang của nhà xuất bản, trong khi thực tế bạn đang xem bản sao do Google lưu trữ.
1.2 Vấn đề quyền riêng tư
- Mở rộng phạm vi theo dõi: AMP cung cấp cho Google cái nhìn sâu hơn về nội dung bạn đọc. Mỗi lần nhấp vào liên kết AMP đều được Google ghi lại hành vi, khác với việc truy cập trực tiếp khi chỉ nhà xuất bản và các trình theo dõi nhúng mới thu thập được dữ liệu.
- Ép buộc tích hợp AMP: Các nhà xuất bản buộc phải triển khai AMP để tránh bị giảm hạng tìm kiếm. Google áp dụng cơ chế phạt các trang không sử dụng AMP, buộc họ phải nhúng mã AMP và liên kết ngược về
google.com
, khiến dữ liệu người dùng bị tập trung vào hệ sinh thái của Google.
1.3 Vấn đề bảo mật và khả năng sử dụng
- Phá vỡ mô hình tin cậy trình duyệt: Người dùng nghĩ rằng họ đang truy cập tên miền của nhà xuất bản (ví dụ
nytimes.com
), nhưng trên thực tế URL hiển thị lại làgoogle.com/amp/...
Điều này làm mờ ranh giới bảo mật và quyền riêng tư vốn được trình duyệt bảo vệ. 🔒 - Hiệu suất sai lệch: Google quảng cáo AMP giúp tải nhanh hơn, nhưng thực tế nội bộ cho thấy AMP chỉ cải thiện hiệu suất trung bình – nhiều trang lớn tự tối ưu hóa còn nhanh hơn. Người dùng thậm chí sẵn sàng trả tiền cho trình duyệt không quảng cáo để né tránh AMP.
1.4 Độc quyền Web
- Kiểm soát bởi Google: AMP đẩy nhiều phần của Web lên máy chủ và định dạng độc quyền của Google. Các nhà xuất bản mất quyền kiểm soát phân phối quảng cáo, phân tích dữ liệu và cấu trúc nội dung. AMP chỉ là một phần trong chiến lược “Privacy Sandbox” và “Web Bundles” nhằm khóa chặt người dùng vào hệ sinh thái Google. 🌐
🚀 2. Cách De-AMP bảo vệ quyền riêng tư duyệt web
De-AMP áp dụng cơ chế ba lớp để ngăn trang AMP:
2.1 Ghi đè liên kết: Chặn AMP từ đầu
-
Tự động ghi đè URL AMP: Khi tải các trang chứa liên kết AMP (như kết quả tìm kiếm Google), iBrowe tự động chuyển đổi các URL này sang liên kết gốc của nhà xuất bản, bỏ qua proxy AMP của Google. 🔄
-
Ví dụ:
- Gốc:
<a href="http://nytimes.com/article">
- Sau khi ghi đè:
<a href="https://nytimes.com/article">
- Gốc:
-
Trang web vẫn hoạt động bình thường mà không làm hỏng liên kết.
2.2 Chặn tải trang AMP trong thời gian thực
- Phát hiện AMP: Nếu liên kết chưa được ghi đè (ví dụ từ mạng xã hội), iBrowe sẽ kiểm tra trang được tải về xem có thẻ
<html amp>
hoặc thẻ meta URLamphtml
hay không. - Tự động chuyển hướng: Nếu phát hiện trang AMP trong lúc tải (trước khi tải script hay hình ảnh), iBrowe sẽ chặn quá trình tải và chuyển hướng ngay lập tức đến URL gốc lấy từ metadata AMP.
- Ngăn chặn: Bất kỳ mã JavaScript AMP, hình ảnh hay cá nhân hóa từ Google. Các yêu cầu mạng được gửi thẳng đến máy chủ nhà xuất bản, giảm thiểu dữ liệu gửi về Google.
2.3 Mở rộng Debounce: Bỏ qua chuyển hướng AMP
- Sắp có (v1.40): De-AMP sẽ tích hợp với cơ chế debounce sẵn có của iBrowe, phát hiện các mẫu chuyển hướng AMP (ví dụ
amp/s/...
) và bỏ qua trực tiếp, không chờ yêu cầu bắt đầu. ⏭️ - Lợi ích: Loại bỏ hoàn toàn chuyển hướng AMP, ngay cả khi không thể ghi đè liên kết (ví dụ trong iframe hoặc liên kết chia sẻ bị ẩn).
⚙️ 3. Kích hoạt, vô hiệu hóa và tương thích trang web
3.1 Kích hoạt mặc định
- Nightly & Beta: De-AMP được kích hoạt sẵn. Nếu không thấy, hãy khởi động lại iBrowe.
- Phiên bản ổn định (v1.38+): De-AMP mặc định bật trên Desktop & Android; iOS sẽ ra mắt sau.
3.2 Tùy chỉnh người dùng
- Tắt De-AMP: Nếu cần truy cập trang AMP gốc (ví dụ lập trình viên cần kiểm thử), truy cập
ibrowe://settings/shields
và tắt De-AMP. 🔧
3.3 Tương thích trang web
De-AMP cố gắng giữ nguyên các chức năng trang web (bình luận, paywall, nhúng tương tác). Nếu một trang gặp sự cố do chặn AMP quá mức, hãy liên hệ cộng đồng iBrowe để điều chỉnh quy tắc ghi đè hoặc chặn tải phù hợp.
🌐 4. Bối cảnh rộng hơn: AMP 2.0 và các công nghệ kế tiếp
4.1 AMP 2.0 (Signed Exchange & WebBundles)
- Signed Exchange (SXG): Đóng gói nội dung nhà xuất bản thành tập tin được ký số, phân phối qua máy chủ Google, nhưng vẫn hiển thị như từ tên miền gốc.
- WebBundles: Định dạng đóng gói toàn bộ HTML, CSS, JS vào một tập tin nhị phân duy nhất (
.wbn
), lưu trữ trên máy chủ Google rồi phân phối cho người dùng.
Rủi ro:
- Người dùng không còn thấy rõ nguồn gốc thực sự của nội dung.
- Công cụ bảo vệ quyền riêng tư (như chặn quảng cáo) khó kiểm tra, lọc nội dung trong tập tin đóng gói.
- Các sáng kiến như “Privacy Sandbox” sẽ buộc nhà xuất bản áp dụng các định dạng độc quyền này để duy trì thứ hạng tìm kiếm, tiếp tục tập trung quyền kiểm soát vào Google.
4.2 Lập trường của iBrowe
- Phản đối sự chiếm lĩnh: iBrowe chủ động phản biện tại W3C và các tổ chức tiêu chuẩn, thúc đẩy các giao thức lấy người dùng làm trung tâm và bảo vệ tính minh bạch nguồn gốc nội dung.
- Phát triển De-SXG & De-WebBundle: Khi các định dạng kiểu AMP 2.0 phổ biến, iBrowe sẽ phát triển công cụ “De-SXG” và kiểm tra tập tin đóng gói, tự động ghi đè hoặc chặn các yêu cầu này để phục vụ nội dung gốc từ nhà xuất bản.
🎉 5. Kết luận
De-AMP trong iBrowe 1.38 trao lại quyền kiểm soát cho người dùng – chấm dứt các chuyển hướng ẩn qua AMP của Google. Bằng cách ghi đè liên kết AMP, chặn tải AMP thời gian thực và sắp tới là tích hợp cơ chế debounce, iBrowe đảm bảo bạn luôn thấy nội dung gốc từ nhà xuất bản, không phải bản sao proxy của Google. 🌟 Điều này giúp tăng cường quyền riêng tư, bảo mật và giữ cho Web phi tập trung.
Cập nhật iBrowe 1.38 (hoặc thử Nightly/Beta) để trải nghiệm duyệt web trực tiếp, tôn trọng quyền riêng tư – không còn các chuyển hướng AMP ngầm.