🔥 Elon Musk tiết lộ thuật toán đẩy bài viết trên X
Đây là lần hiếm hoi chúng ta được nhìn khá gần vào cách một mạng xã hội lớn sắp xếp nội dung cho mục “Dành cho bạn”. Trước giờ ai cũng biết là X có thuật toán chọn bài, nhưng nó hoạt động cụ thể ra sao thì phần lớn chỉ có thể đoán.
Link repo
https://t.co/Pq6bFzKTcl
Hiểu ngắn gọn thì khi bạn mở X, hệ thống sẽ phải làm vài việc cùng lúc. Trước tiên, nó lấy những bài mới từ những người bạn đã theo dõi. Nhưng nếu chỉ có vậy thì feed sẽ không hấp dẫn lắm, nên hệ thống còn phải đi tìm thêm những bài ở ngoài mạng lưới của bạn, tức là những người bạn chưa follow nhưng có khả năng bạn sẽ thấy thú vị.
Sau khi gom được một đống bài như vậy, hệ thống chưa thể đẩy thẳng lên feed. Nó còn phải đọc thêm rất nhiều tín hiệu xung quanh bạn và xung quanh từng bài viết.
Ví dụ như bạn từng thích nội dung gì, thường dừng lại lâu ở kiểu bài nào, có chặn hoặc ẩn ai không, có quan tâm chủ đề nào không, bài đó có phải video không, có phải quảng cáo không, có vi phạm gì không, đã từng hiện ra trước mắt bạn chưa.
Phần thông minh nhất trong repo này nằm ở chỗ chấm điểm các bài viết. Hệ thống sẽ cố dự đoán xem nếu hiện bài này lên thì bạn có khả năng bấm thích không, có bình luận không, có chia sẻ không, có bấm vào xem tiếp không, hay chỉ lướt qua. Mỗi kiểu hành động như vậy đều được tính như một tín hiệu.
Sau đó, hệ thống cộng các tín hiệu đó lại theo trọng số để quyết định bài nào nên được ưu tiên hơn. Nghĩa là nó không chỉ hỏi “bài này hay không”, mà hỏi cụ thể hơn: “bài này có làm người dùng thực sự tương tác không”.
Ngoài phần mô hình máy học, hệ thống vẫn có rất nhiều lớp lọc và sắp xếp thủ công để feed trông hợp lý hơn. Ví dụ, nó sẽ tránh hiện đi hiện lại quá nhiều bài từ cùng một người, tránh nhét những nội dung bạn đã xem, tránh những bài có vấn đề về an toàn nội dung, và còn phải chừa chỗ để trộn quảng cáo hay gợi ý tài khoản nên theo dõi.
Một điểm rất đáng chú ý nữa là thuật toán này không chỉ làm một việc theo kiểu từ đầu tới cuối, mà được chia thành nhiều phần riêng.
- Có phần chuyên lo lấy bài từ người bạn theo dõi.
- Có phần chuyên đi tìm bài mới ngoài mạng lưới.
- Có phần chuyên chấm điểm.
- Có phần chuyên lọc bớt những thứ không nên hiện.
- Có phần chuyên trộn tất cả lại thành feed cuối cùng.
Cách chia như vậy giúp hệ thống vừa nhanh, vừa dễ mở rộng, vừa dễ chỉnh nếu muốn thay đổi một khâu nào đó.
Thuật toán hiểu đơn giản là một hệ thống cố gắng học từ hành vi của bạn, rồi liên tục thử đoán xem điều gì sẽ giữ bạn ở lại lâu hơn.
Càng dùng nhiều, nó càng có thêm dữ liệu để đoán tốt hơn. Vì vậy đôi khi cảm giác “sao nó hiểu mình quá” thực ra đến từ việc nó đã quan sát rất nhiều thói quen nhỏ của mình trong thời gian dài.
Follow @nghienaivn để bắt kịp mọi thứ về AI!
https://t.co/wOX7GsW3qv
----

From X
Disclaimer: The above content reflects only the author's opinion and does not represent any stance of CoinNX, nor does it constitute any investment advice related to CoinNX.


