Các platform khó tính nhận diện chúng ta như thế nào? Những hiểu nhầm về Cookie.

Em biết các bác rất bận và cũng không có thời gian để đọc những lý thuyết khó hiểu, vì vậy e sẽ đi thẳng vào vấn đề luôn và giải thích qua một số ví dụ đơn giản nhé!

 

PLATFORM khó tính nhận diện chúng ta như thế nào?

1.1. Via or Bot?

  • Các thuật toán liên quan tới AI đều rất tốn tài nguyên của máy chủ, vì vậy nó không chạy real-time mà chúng ta có thể thấy nó hoạt động sau những trận “Bão”, hệ thống sẽ quét dựa trên dữ liệu người dùng đẩy lên database để đánh giá người dùng là via or bot. Ví dụ như: thời gian listing sản phẩm trung bình, chỉ thực hiện 1 vài hành động duy nhất trên web, danh sách IP truy cập vào hệ thống…. -> AI sẽ đánh giá được dựa trên hành vi người dùng
  • Chém nhầm còn hơn bỏ sót ? Chắc chắn không, chỉ cần AI đánh giá sai quá nhiều nó sẽ gây áp lực cực lớn tới đội ngũ support (đơn giản như bên e chỉ launch hệ thống tool với khoảng vài ngàn thiết bị sử dụng, nhưng khi tool update lỗi là đã rep tin nhắn ốm rồi chưa nói tới các platform cả triệu người sử dụng). Vì vậy hãy yên tâm và đừng quá lo nếu chúng ta dùng tool 1 cách hợp lý !

1.2. Nhận diện thiết bị

  • Dựa vào request: trình duyệt sẽ gửi các thông tin yêu cầu web-server và chứa thêm các thông tin bao gồm: User-agent, các Header, Cookie, IP… : từ đó web-server có thể xác định được bạn là ai nhờ cookie, hoặc từ hệ điều hành, phiên bản trình duyệt nào (từ User-agent)
  • Javascript : trình duyệt sẽ cung cấp các thông tin cơ bản của hệ thống như Hệ điều hành, time / time-zone, các thông tin render của GPU , danh sách Font (gọi chung là Browser finger) , code javascript này rất đơn giản và nó sẽ gửi ngược lên web-server để check ; tuy nhiên đừng quá lo vì có rất rất nhiều thiết bị cùng lô sản xuất mà các thông tin render GPU hoặc list font giống nhau, nó không thể chắc chắn là bác là cùng 1 người dùng nếu các thông tin này giống nhau đâu, nó chỉ là 1 thông tin nhỏ để AI đánh giá kèm vs các thông tin khác (đương nhiên khác được thì tốt hơn thôi)

Hiểu nhầm về Cookie

Rất nhiều bác có một khái niệm là “Nuôi cookie” và cho rằng các tool nuôi acc chạy càng nhiều thì cookie càng lớn và trust, điều này không hề đúng.
Nếu ví dụ client là 1 sinh viên, webserver là 1 thư viện thì cookie giống như 1 tấm thẻ thư viện có thời hạn mà Thư viện (Web server) cung cấp cho chúng ta khi chúng ta đăng kí, nó có thể bao hàm 1 số thông tin về đăng nhập, và 1 số thông tin đơn giản như họ tên, avatar gì đó để giảm tải cho Thư viện và dễ dàng cho sinh viên (đỡ phải lần nào vào mượn sách cũng phải đăng kí)

 

Vì vậy, những tool nuôi account để làm gì?

Đơn giản khi xem các sản phẩm hay bất kì thao tác nào trên web mà AI có thể thu thập thông tin để lấy đó là dữ liệu recommend cho quảng cáo thì nó đều lấy, thao tác càng nhiều, dữ liệu đó càng lớn, recommended data càng chuẩn, như vậy cũng được xem là 1 người dùng trust