Thuộc tính IP+UA so với Thuộc tính Cookie

Đã viết Tháng 5 19, 2025 qua

John Paul

Thuộc tính IP+UA so với Thuộc tính Cookie

Việc tiếp cận đối tượng mục tiêu phụ thuộc rất nhiều vào cách tiếp cận đúng đắn để xác định chính xác từng người dùng, cũng như chất lượng của bạn. nguồn giao thông.

Khi câu đố được tạo ra từng mảnh, người dùng duy nhất được xác định thông qua sự kết hợp của một số phương pháp cùng một lúc. Do đó, chúng tôi quyết định điều tra xem phương pháp xác định người dùng dựa trên IP+UA có cần thiết hay không, hay Cookie vẫn là kỹ thuật phải có để bù đắp cho sự chênh lệch xảy ra ngay từ đầu.

Chúng ta sẽ bắt đầu với phần lý thuyết—cách thức hoạt động của từng phương pháp, dữ liệu nào về người dùng mà phương pháp này thu thập và những thách thức nào phải đối mặt. Sau đó, chúng ta sẽ tìm hiểu thêm về sự kết hợp IP+UserAgent, độ chính xác của nó so với phương pháp Cookie và cách sử dụng cả Cookie và IP+UA có thể nâng cao chất lượng phân bổ lưu lượng truy cập.

Mục tiêu của nghiên cứu

Mục tiêu của nghiên cứu: để so sánh các cách tiếp cận khác nhau trong việc phân bổ lưu lượng truy cập: IP+UserAgent so với Cookie

Các chủ đề chưa được khám phá:

  1. Tỷ lệ chia sẻ lưu lượng truy cập là giống nhau đối với cả hai cách phân bổ; Phần này khám phá tần suất nhận dạng người dùng vẫn nhất quán giữa hai phương pháp theo dõi này.
  2. Phân khúc thay đổi nào trong sự quy kết IP+UA có liên quan đến sự dịch chuyển IP và phân khúc nào tương ứng với sự dịch chuyển UA; Điều này phân tích xem sự thay đổi của người dùng chủ yếu là do thay đổi kết nối internet (IP) hay cập nhật thiết bị/trình duyệt (UA).
  3. Những mô hình nào tồn tại trong việc phân bổ UA và chúng ảnh hưởng như thế nào đến độ chính xác của việc nhận dạng người dùng; Phần này nêu bật những biến thể phổ biến trong tác nhân người dùng có thể làm phức tạp việc theo dõi chính xác.
  4. IP+UA có thể đảm bảo kết nối ổn định trong bao lâu; Phần này sẽ xem xét tuổi thọ thông thường của cặp IP+UA trước khi thay đổi.

Để đảm bảo chúng ta hiểu đúng vấn đề, chúng ta hãy nêu ra một số định nghĩa và sự kiện mà chúng ta sẽ sử dụng trong Nghiên cứu này.

What is What: Định nghĩa và Nguyên tắc hoạt động của IP, UA và Cookie

Địa chỉ IP

Nói tóm lại, IP (Giao thức Internet) là địa chỉ duy nhất được gán cho thiết bị của bạn để nhận dạng thiết bị đó trên Internet, giúp thiết bị đó có thể giao tiếp với các thiết bị khác trên web.

Phương pháp IP hoàn hảo để theo dõi vị trí của người dùng nhưng lại gặp khó khăn trong việc xác định đặc điểm của những người dùng khác vì nhiều người dùng có thể chia sẻ cùng một IP.

Địa chỉ IP có thể được phân loại theo Vị trí mạng (Công cộng, Riêng tư) hoặc Loại chỉ định (Tĩnh, Động).

Trong nghiên cứu này, chúng tôi chủ yếu tập trung vào IP động công cộng, nghĩa là nó có thể dễ dàng thay đổi vì nhiều lý do mà thậm chí không phụ thuộc vào người dùng.

Các vấn đề về theo dõi qua IP

Các yếu tố phổ biến dẫn đến thay đổi địa chỉ IP:

Khởi động lại modem;

Hết hạn hợp đồng thuê ISP;

Kết nối lại mạng;

Bảo trì mạng ISP.

Tất nhiên, nếu bạn kết nối Internet thông qua cùng một thiết bị nhưng từ một điểm truy cập Internet khác, IP của bạn cũng sẽ thay đổi.

Ghi chú: hơn nữa, chúng tôi sẽ rút ngắn thuật ngữ “IP động công cộng” và chỉ gọi nó là IP.

Đại lý người dùng

User-Agent (sau đây gọi tắt là UA) là một phần của HTTP-request mà trình duyệt của bạn tự động gửi đến máy chủ trang web. Chuỗi văn bản một dòng này chứa thông tin chi tiết về: trình duyệt của người dùng và phiên bản của trình duyệt, loại thiết bị và hệ điều hành, ngôn ngữ được sử dụng và phương pháp hiển thị.

Sau đó, máy chủ sẽ cung cấp cho bạn phiên bản trang web phù hợp nhất dựa trên thông tin nhận được.

Ai có thể xác định UA của bạn:

  • Trình duyệt web (Chrome, Trình duyệt Yandex, Opera, v.v.)
  • Hệ thống tìm kiếm (Google, Yandex, v.v.)
  • Máy chơi game (Xbox, PlayStation)
  • Máy đọc sách điện tử

Nói một cách đơn giản, bất cứ thứ gì kết nối với Internet đều có khả năng lấy được thông tin UA của bạn.

Ghi chú: bạn có thể xem UA của mình thông qua các dịch vụ như 2ip.io.

Các vấn đề với việc theo dõi thông qua UA

Hãy xem xét các yếu tố có thể ảnh hưởng đến những thay đổi trong UA:

UA Switcher được sử dụng

Người dùng đang chạy chương trình UA Switcher để ẩn thông tin cá nhân;

Hệ thống tự động cập nhật

Trình duyệt (hoặc hệ thống) tự động cập nhật;

Anhcác tính năng owser ẩn một số dữ liệu

Một số trình duyệt có các tính năng thu hẹp dữ liệu chứa trong UA. Điều này dẫn đến việc không có thông tin cần thiết để xác định lượt truy cập trở lại của người dùng.

Bánh quy

Cookie là những tệp nhỏ được lưu trữ bởi máy chủ của trang web trên thiết bị của người dùng thông qua các thuật toán của trình duyệt khi họ truy cập trang web. Ban đầu, Cookie được thiết kế để cải thiện trải nghiệm của người dùng bằng cách tiết kiệm thời gian của người dùng khi thiết lập tùy chọn trên trang web. Không lâu sau, các nhà tiếp thị và quảng cáo bắt đầu thu thập các loại thông tin khác, biến Cookie thành công cụ theo dõi và kiếm lợi nhuận từ người dùng.

Các nhà quảng cáo quan tâm nhất đến loại Cookie vĩnh viễn vì chúng chứa mọi thông tin về những lần truy cập trước đó của người dùng.

Máy chủ nào có thể yêu cầu thiết bị của người dùng ghi vào tệp văn bản như vậy:

  • Lựa chọn cài đặt trang web (vị trí, ngôn ngữ, tỷ lệ trang, v.v.);
  • Chi tiết xác thực (đăng nhập, mật khẩu);
  • Dữ liệu cá nhân (số điện thoại, địa chỉ, thông tin thanh toán);
  • Thông tin về lượt truy cập của Người dùng (thời gian phiên, loại thiết bị, kiểu máy và hệ điều hành, v.v.);
  • Dữ liệu mô tả Hành vi của Người dùng (nhấp chuột, chuyển hướng, các phần được xem nhiều nhất trên trang);

Các vấn đề về theo dõi thông qua Cookie

Nếu Cookies tuyệt vời như vậy để có được thông tin chi tiết về đối tượng của bạn, tại sao lại phải bận tâm tích hợp các phương pháp khác để thu thập dữ liệu? Thật không may, việc sử dụng chúng ngày càng trở nên khó khăn hơn. Sau đây là lý do:

Mất dữ liệu

Người dùng có thể dễ dàng xóa Cookies và mọi thông tin có giá trị về trải nghiệm của họ với trang web.

Quy định về quyền riêng tư

Ngày càng có nhiều luật hạn chế việc sử dụng Cookie liền mạch, yêu cầu người dùng phải đồng ý mới được thu thập.

Như bạn có thể thấy, về mặt lý thuyết, một cặp IP+UA có thể xác định chính xác người dùng duy nhất và cung cấp thông tin chi tiết có giá trị về hành vi của họ. Đó là lý do tại sao, trong Nghiên cứu này, chúng tôi lấy IP+UA làm đối tượng nghiên cứu và quyết định so sánh hiệu quả của nó với theo dõi Cookie, một phương pháp phân bổ lại.

Đầu tiên, chúng ta hãy xem phương pháp IP+UA để nhận dạng người dùng chính xác như thế nào so với Cookie.

Để thực hiện điều đó, chúng tôi sẽ so sánh số lượng Cookie có kết nối ổn định với cặp IP+UA và số lượng Cookie có nhiều hơn một cặp IP+UA trong khoảng thời gian một ngày.

Kết nối nào được định nghĩa là ổn định trong thí nghiệm này:

  • Mỗi Cookie chỉ tương ứng với một cặp IP+UA duy nhất.
  • Cặp IP+UA cụ thể này chỉ được liên kết với Cookie này.
Cookie và Hiển thị

Chú thích biểu đồ #1: Trên biểu đồ đầu tiên ở trên, màu xanh lam biểu thị tỷ lệ Cookie chỉ có một cặp IP+UA và biểu đồ màu đỏ biểu thị tỷ lệ Cookie có hai hoặc nhiều cặp như vậy. Dữ liệu tương tự nằm ở phía bên phải nhưng được tính toán dựa trên số lần hiển thị tương ứng với từng loại Cookie như vậy.

Kết quả là, chúng tôi thấy rằng ~30% trong số tất cả Cookie có nhiều hơn một cặp IP+UA. Điều này có nghĩa là nếu chúng tôi chỉ tính người dùng duy nhất theo cặp IP+UA, kết quả sẽ khác đáng kể so với giá trị thực tế.

Số lượng thay đổi cho IP và UA

Chúng tôi phát hiện ra rằng cặp IP+UA không ổn định. Tại sao? Hãy cùng giải quyết. Để tìm ra nguyên nhân gây ra những sai lệch như vậy, chúng tôi đã phân tích từng cặp IP+UA và kiểm tra tham số nào chuyển đổi thường xuyên hơn.

Theo dõi người dùng

Chú thích biểu đồ #2: Trên biểu đồ trên, màu xanh lam tương ứng với việc chuyển đổi IP trong khi vẫn duy trì cùng một UA (95.6%), màu đỏ dành cho việc chuyển đổi UA nhưng vẫn giữ nguyên IP (1.84%) và màu xanh lá cây mô tả cặp IP+UA khi cả hai tham số chuyển đổi (2.57%).

Như bạn có thể thấy, IP của người dùng đã thay đổi ở hầu hết các cặp trong khi thông tin UA vẫn giữ nguyên.

Kết luận này khá hiển nhiên vì nếu bạn đọc lý thuyết, thì bạn sẽ biết rằng IP có thể dễ dàng thay đổi mỗi khi bạn kết nối lại Internet, trong khi UA thường chỉ chuyển đổi khi trình duyệt hoặc hệ thống cập nhật (điều này hiếm khi xảy ra).

Thiếu chi tiết duy nhất trong UA để xác định người dùng duy nhất

Trong khi khá rõ ràng tại sao khi phân bổ IP, chúng ta có thể mất dấu người dùng do các yếu tố liên quan đến chuyển đổi IP, thì tình hình với UA lại không rõ ràng như vậy.

Trước đây, UA cung cấp cho chủ sở hữu trang web đủ dữ liệu để phân loại người dùng duy nhất (đặc biệt là người dùng Android hoặc Windows).

Thật không may cho các chi nhánh, ngày nay, các trình duyệt phổ biến như Chrome chỉ chia sẻ thông tin chung về thiết bị (ví dụ: Android hoặc Windows) thay vì thông tin chi tiết cụ thể có thể được sử dụng để nhắm mục tiêu chính xác. Các bản cập nhật trình duyệt như vậy được thực hiện để tăng quyền riêng tư của người dùng. Đồng thời, nó làm nảy sinh nhu cầu kết hợp phân bổ dựa trên UA với một phương pháp khác để lấp đầy khoảng trống dữ liệu mới nổi—phân bổ dựa trên IP đã bước vào để phục vụ vai trò đó.

Sau đây là thông tin cố định mà Chrome cung cấp về hệ thống:

Hệ điều hànhUA có thể chia sẻ thông tin
AndroidLinux; Android 10; K;
Cửa sổWindows NT 10.0; Win64; x64
Máy MacMacintosh; Intel Mac OS X 10_15_7
LinuxX11; Linux x86_64
Quyền sở hữu của người dùng

Chú thích biểu đồ: Đồ họa thông tin hiển thị các phần lưu lượng truy cập liên quan đến UA tương ứng với người dùng có các loại thiết bị khác nhau. Ngoài ra, chúng tôi đã triển khai thông tin về tỷ lệ UA được kết nối với iPhone OS mới nhất (iOS 17.5).

Đồ họa thông tin ở trên cho thấy có tới 75% lưu lượng truy cập nằm trên các UA có thiết bị cố định/được sử dụng rộng rãi.

Biến động trong tính duy nhất của IP+UA trong ba ngày

Bạn còn nhớ, chúng ta đã so sánh các Cookie có kết nối ổn định với cặp IP+UA với các Cookie khác (về cơ bản là các Cookie có hai hoặc nhiều cặp IP+UA được liên kết với chúng) trong khoảng thời gian một ngày ở phần đầu của Nghiên cứu như thế nào không?

Bây giờ, hãy cùng tìm hiểu thêm về Cookie có kết nối ổn định và thời gian chúng duy trì ổn định. Để làm như vậy, chúng tôi đã thu thập dữ liệu về số cặp IP+UA duy nhất từ tất cả người dùng được hệ thống của chúng tôi phát hiện trong ba ngày.

Chúng tôi đã tìm thấy những thay đổi sau trong Cookie với tính ổn định của kết nối IP+UA:

  • Ngày 1: ~30% của người dùng có nhiều cặp IP+UA cho một Cookie duy nhất (kết nối ổn định trong ~70%);
  • Ngày 2: IP và/hoặc UA thay đổi cho người khác ~40% của người dùng (kết nối ổn định trong ~30%);
  • Ngày thứ 3: Chỉ có ~21% người dùng vẫn có kết nối ổn định giữa Cookie và cặp IP+UA.
Theo dõi người dùng

Cuối cùng, hãy xác định cách kết nối này hoạt động trên một khoảng cách xa. Chúng tôi đã thu thập dữ liệu về đối tượng rộng hơn, đếm những người xuất hiện trong hệ thống ít nhất một lần trong khoảng thời gian hai tuần.

Khi quan sát trạng thái kết nối giữa Cookie và cặp IP+UA, chúng tôi thu được kết quả sau:

  • Trong suốt một tuần, kết nối vẫn ổn định cho ~20% người dùng;
  • Đến cuối hai tuần, con số đó giảm xuống chỉ còn ~5%.

Chúng ta có thể xây dựng sự phụ thuộc sau đây giữa Cookie với sự ổn định của kết nối IP+UA theo thời gian:

Ngày thí nghiệmSố lượng Cookie có kết nối ổn định với cặp IP+UA
170%
230%
321%
720%
145%
Quyền sở hữu của người dùng

Phần kết luận

Trên thực tế, độ chính xác của việc theo dõi người dùng duy nhất theo IP+UA không tốt như lý thuyết.

Dựa trên Nghiên cứu của chúng tôi, chúng tôi có thể khẳng định rằng Việc phân bổ người dùng chỉ được thực hiện bằng cách theo dõi cặp IP+UA của người dùng không phải là phương pháp đáng tin cậy trong thời gian dài.

  • Những thay đổi trong chính sách bảo vệ Dữ liệu cá nhân của Người dùng trên tất cả các trình duyệt chính đã dẫn đến sự suy giảm mạnh mẽ về tính duy nhất của thông tin được chia sẻ.
  • 20-30% người dùng sở hữu nhiều Cookie khác nhau với sự kết hợp IP+UA chỉ trong một ngày.
  • Kết nối ổn định giữa Cookie và cặp IP+UA chỉ ổn định đối với 5% trong số lượng người dùng ban đầu vào cuối giai đoạn hai tuần.

Đó là lý do tại sao nếu bạn tự mình theo dõi người dùng, chúng tôi khuyên bạn nên kết hợp nhiều phương pháp theo dõi người dùng, chẳng hạn như Cookie với IP+UA.

Và trong trường hợp bạn muốn phá vỡ giới hạn với ROI siêu cao của chiến dịch quảng cáo, bạn nên có một nguồn lưu lượng truy cập mạnh mẽ bên cạnh mình. Đăng ký HilltopAds mạng lưới quảng cáo hôm nay và tối đa hóa lợi nhuận của bạn!