Vụ rò rỉ bí mật của Google Search đã tiết lộ những gì?

Gần đây, một vụ rò rỉ tài liệu nội bộ nghiêm trọng của Google đã vô tình tiết lộ cách thức mà Google xếp hạng các trang web trên trang tìm kiếm. Từ các tài liệu này, người ta nghi ngờ sự minh bạch và công tâm của Google khi xây dựng qui trình xếp hạng tìm kiếm – điều đã định hình lĩnh vực SEO trong suốt một thời gian dài. Mọi thứ trở nên trầm trọng hơn khi Google thừa nhận những tài liệu đó là thật. Các chuyên gia trong lĩnh vực SEO gọi đây là sự kiện chấn động. Trong bài viết hôm nay, hãy cùng Language Link tìm hiểu các thông tin xoay quanh vụ việc này.

Google Search xếp hạng các trang web như thế nào?

Các tài liệu rò rỉ qua kho lưu trữ GitHub này đã cung cấp các mô tả chi tiết về API Content Warehouse của Google. Đây là phiên bản cũ hơn của hệ thống hiện hành, đã đóng vai trò then chốt trong việc tổ chức và xếp hạng các trang web khi xuất hiện các truy vấn tìm kiếm từ người dùng trong nhiều năm.

Hơn 14 nghìn thuộc tính liên quan đến API bị rò rỉ được xác định đã tạo thành thuật toán phức tạp của Google Search phục vụ chức năng xếp hạng trang web trên trang kết quả tìm kiếm. Khác xa với các công cụ khớp từ khóa đơn giản của những năm đầu bùng nổ Internet, Google Search thể hiện sự tinh vi và phức tạp của mình. Chuyên gia SEO, Tiến sĩ Marie Haynes đánh giá cao tính ưu việt của thuật toán bị rò rỉ, khẳng định tính xác thực của các tài liệu trước khi Google chính thức lên tiếng.

Bên cạnh việc chỉ ra điểm mạnh và vượt trội của cơ chế lõi Google Search khi có thể xử lý hơn 3,5 tỉ lượt tìm kiếm mỗi ngày với hiệu quả và độ chính xác đáng kinh ngạc, các tài liệu còn cho biết bí mật của Google Search khi công cụ này xem xét nhiều yếu tố khác thay vì chỉ cân nhắc tính chính xác và liên quan của kết quả với từ khoá được truy xuất. Một vài yếu tố được chỉ ra bao gồm hành vi của người dùng, dữ liệu lịch sử và mức độ liên quan theo ngữ cảnh cụ thể. Điều này vô tình khẳng định sự phụ thuộc của Google Search với lịch sử duyệt web của người dùng.

2.500 trang tài liệu mật của Google bị rò rỉ trực tuyến

Dựa vào lịch sử duyệt web và bộ lưu hành vi người dùng, Google thiết lập nên hồ sơ của họ và sử dụng khoảng 20 chỉ mục gần nhất nhằm phân tích sự liên quan của các liên kết tới từ khoá được truy xuất. Tiến sĩ Haynes giải thích rằng việc theo dõi lịch sử duyệt web gần nhất của người dùng cho phép Google hiểu rõ hơn về bối cảnh và độ tin cậy của một trang web (điều có thể tác động đáng kể đến thứ hạng của trang này trên trang kết quả tìm kiếm). Phương pháp này cũng cho phép Google theo dõi sự phát triển của một trang web và đánh giá chất lượng nội dung của trang, đảm bảo rằng chỉ thông tin đáng tin cậy và cập nhật nhất mới được ưu tiên trong kết quả tìm kiếm.

Tuy nhiên, chính những tài liệu này cũng “tố cáo” Google không trung thực trong việc tuyên truyền các tiêu chuẩn xếp hạng trang web. Dù rằng cốt lõi của việc đánh giá là tỉ lệ nhấp chuột chung vào trang web khi hiển thị trên trang tìm kiếm nhưng trên thực tế, Google được cho là đã “lén lút” hạ thấp tầm quan trọng của nó. Google không chỉ xem xét thêm các tên miền phụ xuất hiện trong bảng xếp hạng nhằm cho điểm các trang web (như một số đồn đoán trong nhiều năm trở lại đây) mà còn dựa vào mức độ tương tác của người dùng đối với tên miền để đánh giá mức độ ưu tiên cho hiển thị kết quả tìm kiếm. Điều này cho thấy dữ liệu tương tác của người dùng được theo dõi chặt chẽ, thu thập và sử dụng để thực hiện xếp hạng thứ hạng tìm kiếm.

Ngoài ra, sự tồn tại của sandbox (một khái niệm ám chỉ việc hạn chế xếp hạng các trang web mới) vốn là một chủ đề gây tranh cãi trong cộng đồng SEO nhiều năm cũng được chính các tài liệu này khẳng định và củng cố. Google bị nghi là đã áp dụng một số hạn chế nhất định đối với các tên miền mới nhằm ngăn chặn việc các trang web spam hoặc có chất lượng nội dung thấp có thể đạt thứ hạng cao trên trang kết quả tìm kiếm. Nhà phân tích xu hướng quản trị trang web cấp cao tại Google, ông John Mueller trước đây từng kịch liệt phủ nhận sự tồn tại của sandbox nhưng các tài liệu bị rò rỉ đã tố cáo chuyện này. Thời gian bị giữ trong “hộp cát” của một trang web mới có thể kéo dài từ vài tháng tới thậm chí một năm. Do bị giám sát chặt chẽ, các trang web này gặp rất nhiều khó khăn để có hiệu suất tốt và phải liên tục đảm bảo rằng chúng đáp ứng các tiêu chuẩn chất lượng được Google qui định trước khi được phép tham gia cạnh tranh về thứ hạng tìm kiếm.

Tác động của vụ việc này ra sao?

Hiển nhiên, tác động từ vụ rò rỉ này tới lĩnh vực SEO là rất lớn. Thông qua các tài liệu này, các chuyên gia SEO có nhiều dữ kiện để có thể tái định hình các chiến lược và hoạt động SEO của mình. Các trang web từ đây biết được họ cần phải làm gì để nâng cao cơ hội được ưu tiên hiển thị để có được lưu lượng truy cập cao hơn. Còn từ góc độ người dùng, vụ rò rỉ này cũng cảnh báo về việc khai thác dữ liệu mà các công cụ tìm kiếm cố tình che đậy. Chuyên gia tiếp thị kỹ thuật số Neil Patel cho biết những bí mật được tiết lộ sẽ đặt ra một bài toán mới cho Google trong việc điều chỉnh thuật toán, bởi hơn ai hết Google vẫn muốn kiểm soát cách các trang web và doanh nghiệp tiếp cận SEO cũng như tiếp thị trực tuyến nhằm tối đa hoá tiềm năng thu lời, đồng thời củng cố địa vị thống trị thị trường của họ.

Google Plus to shut down after data leak affecting 500,000 users

Theo nghiên cứu của BrightEdge, có tới 68% phiên duyệt web bắt đầu bằng các công cụ tìm kiếm. Điều này cho thấy sự phụ thuộc của cả người dùng và các trang web với công cụ tìm kiếm. Khi các dạng nội dung tương tác được chỉ ra là sẽ được ưu tiên hơn, các doanh nghiệp hoàn toàn có thể cân nhắc lại chiến lược nội dung để tối ưu hiệu suất nội dung nhằm cải thiện thứ hạng tìm kiếm của họ.

Tuy Google vẫn chưa bình luận gì thêm về thông tin chi tiết về vụ rò rỉ nhưng trong tuyên bố mới đây, người phát ngôn của hãng nhấn mạnh rằng các tài liệu bị rò rỉ không phản ánh chính xác phiên bản API hiện hành cũng như qui trình xếp hạng mà hãng này đã nâng cấp và thay đổi. “Các thuật toán của chúng tôi được đảm bảo liên tục cập nhật nhằm cung cấp kết quả tìm kiếm có mức độ liên quan và hữu ích cao nhất cho người dùng”, hãng cho biết thêm. “Chính đặc điểm này đảm bảo Google không chỉ theo kịp tốc độ biến đổi của Internet mà còn đoán trước được sự thay đổi của nhu cầu người dùng.”

Chúng ta có thể mong chờ gì trong thời gian tới?

Dù rằng những hiểu biết và khả năng khai thác công cụ tìm kiếm của các nhà quản trị SEO và tiếp thị kỹ thuật số không giống nhau nhưng vụ rò rỉ này của Google đã cung cấp các dữ liệu cao cấp giúp gia tăng mức độ am hiểu về nền tảng quảng cáo của Google, đồng thời dấy lên các cuộc thảo luận về tính minh bạch của các nền tảng kỹ thuật số trong việc khai báo và bảo vệ quyền riêng tư của người dùng.

Trong thời gian tới, khi toàn bộ số tài liệu rò rỉ được mổ xẻ kĩ lưỡng hơn, chúng ta có thể mong đợi những cuộc tranh luận mới. Rất có thể những vấn đề về quyền của công chúng sẽ được đề cao hơn và khiến cho các hệ thống bị ảnh hưởng ít nhiều. Điều này cũng có thể khiến cho các vấn đề pháp lí liên quan được nhìn nhận và xem xét cẩn thận. Liên minh châu Âu vốn có lịch sử giám sát chặt chẽ các gã khổng lồ công nghệ rất có thể sẽ nhân cơ hội này để áp dụng các qui định mới nhằm đảm bảo các quyền của người dùng cũng như giữ cho thị trường minh bạch và cạnh tranh công bằng hơn.

Giới thiệu gói nhượng quyền thương mại trung tâm Anh ngữ quốc tế Language Link Academic

Hệ thống nhượng quyền trung tâm Anh ngữ quốc tế của Language Link được thiết kế đặc biệt nhằm đáp ứng nhu cầu của các tổ chức và cá nhân có mong muốn đầu tư vào lĩnh vực giáo dục vẫn đang còn nhiều tiềm năng phát triển. Bên cạnh nguồn thu từ trung tâm tiếng Anh, một số nguồn thu bổ sung bao gồm:

  • Chia sẻ hoa hồng dịch vụ du học;
  • Bán giáo trình và các khóa học đào tạo giáo viên trực tuyến có bản quyền;
  • Các chương trình đào tạo ngoài trung tâm, tiếp cận đến các trường tiểu học và trung học.

Về thương hiệu Language Link Academic

Language Link Academic (LLA) được thành lập năm 1996 tại Hà Nội với tên gọi Language Link Việt Nam, trở thành một trong những đơn vị giáo dục tiếng Anh bản ngữ đầu tiên tại Việt Nam.

Áp dụng công nghệ giáo dục tiêu chuẩn châu Âu, LLA phát triển thành công chương trình đào tạo tiếng Anh hoàn hảo dành cho người Việt và đã sát cánh cùng hàng trăm nghìn học sinh và phụ huynh trong suốt hơn 25 năm qua. Hàng chục chương trình giáo dục đa kênh của LLA ra đời nhằm giúp học sinh người Việt học tiếng Anh tốt hơn, nhanh hơn, sẵn sàng và tự tin viết nên câu chuyện của chính mình không chỉ tại Việt Nam mà bất cứ đâu trên toàn thế giới.

Hệ thống trung tâm Anh ngữ LLA đã có mặt tại 10 tỉnh thành trên toàn quốc và là đối tác lâu năm của Sở Giáo dục và Đào tạo Tp. Hà Nội trong gần 20 năm.

Để nhận tư vấn về gói nhượng quyền, vui lòng để lại thông tin tại đây hoặc gửi email tới địa chỉ franchise@languagelink.edu.vn, hotline: 0989857371.