Được viết bởi Li Xinma
Năm 1850, nhà triết học Ludwig Feuerbach đã viết bằng tiếng Đức trong bài tiểu luận "Khoa học tự nhiên và cách mạng" của mình: "Der Mensch ist, was er ißt."
Cụm từ này sau đó lan rộng khắp thế giới với tên gọi phiên bản tiếng Anh của "You Are What You Eat", có thể đề cập đến cả chế độ ăn uống và sức khỏe, cũng như tinh thần con người, được định hình bởi trải nghiệm của họ.
美国行为主义心理学创始人约翰・B・华生(John B.Watson)在1924年出版的《行为主义》(Behaviorism)中也曾提出:“给我一打健康的婴儿,让他们在我设定的环境中成长,我能保证随机挑选一个,将其训练成我选定的任何类型的专家——医生、律师、艺术家、商人,甚至乞丐和小偷,无论其天赋、倾向、能力、职业和祖先种族如何。”
Môi trường có thể không quyết định hoàn toàn số phận của một người, nhưng nó đủ để ảnh hưởng sâu sắc đến ba quan điểm của con người. Sự ra đời của Internet đã làm cho sự bùng nổ thông tin, và con người đã tìm hiểu về thế giới thông qua các cổng thông tin, công cụ tìm kiếm, tài khoản công khai và microblog, và cũng bị ấn tượng bởi tin tức đúng hoặc sai trên Internet.
Bước vào kỷ nguyên Internet di động, các nền tảng video ngắn đã trở thành vua mới của lưu lượng truy cập, theo dữ liệu của QuestMobile, 9 năm 0 tháng, thời gian sử dụng điện thoại di động bình quân đầu người hàng tháng của người dùng trong nước đã tăng lên 0,0 giờ, tương đương với hơn 0,0 giờ mỗi ngày, trong đó 0,0 giờ được sử dụng cho các video ngắn.
图源:QuestMobile
Các video ngắn khiến mọi người muốn dừng lại, vì vậy một số người lo lắng liệu thuật toán của nền tảng có đan xen một "kén thông tin" hay không, để mọi người chỉ có thể xem nội dung đồng nhất mà họ quan tâm, và dần dần trở nên khép kín hoặc thậm chí cực đoan?
Vì những lo ngại và nghi ngờ như vậy, các thuật toán được coi là phù thủy, và các nền tảng đằng sau chúng, chẳng hạn như Douyin và Kuaishou, thường bị nhắm mục tiêu. Vào ngày 15 tháng 10, Douyin đã tổ chức "Ngày mở cửa Trung tâm An ninh và Tin cậy" tại Bắc Kinh, nơi các nhà lãnh đạo doanh nghiệp có liên quan đã giới thiệu chi tiết và làm rõ cho các phương tiện truyền thông, bao gồm cả DoNews, về các nguyên tắc của thuật toán Douyin, hệ thống quản trị nền tảng và các vấn đề xã hội quan tâm.
Nền tảng video ngắn có dệt nên một "cái kén thông tin" cho người dùng không? Sau khi đọc bài viết này, hoặc người đọc sẽ có câu trả lời.
1. Thuật toán đề xuất: chủ quan và không sẵn sàng
"Kén thông tin" được đề xuất bởi học giả người Mỹ Cass R. Sunstein trong cuốn sách "Thông tin không tưởng: Cách mọi người sản xuất tri thức" xuất bản năm 2006. Nó đề cập đến thực tế là trong việc phổ biến thông tin, công chúng chỉ chú ý đến những gì họ lựa chọn và những gì khiến họ hạnh phúc, như thể họ đang ở trong một cái kén được dệt bởi lợi ích và định kiến của chính họ, để cuộc sống của họ bị trói buộc trong một "cái kén" như một cái kén.
Nguyên tắc của thuật toán đề xuất Douyin là gì?
Trước hết, chúng ta phải biết rằng có hàng trăm triệu nội dung được đăng lên Douyin mỗi ngày và một người dùng Douyin sẽ chỉ vuốt vài trăm nội dung mỗi ngày. Do đó, thuật toán đề xuất giải quyết cách chọn ra nội dung mà người dùng thích từ nội dung khổng lồ và phân phối cho anh ta.
Nhưng trong quá trình này, thuật toán không cần phải hiểu nội dung, trọng tâm của nó là tìm hiểu hành vi của người dùng.
Thuật toán đề xuất của Douyin bao gồm hai liên kết cốt lõi: "thu hồi" và "sắp xếp", khi người dùng thích một số video ẩm thực, thuật toán sẽ giảm nội dung phù hợp để đẩy đến người dùng lên hàng chục ngàn, thậm chí hàng nghìn tấn thông qua chiến lược thu hồi từ hàng trăm triệu nội dung đã gửi.
Sau khi lọc ra hàng trăm đến hàng nghìn nội dung mà người dùng có thể quan tâm, Douyin sẽ sử dụng thuật toán sắp xếp để đoán nội dung nào người dùng sẽ quan tâm hơn dựa trên hành vi ngắn hạn của họ (lượt thích, tỷ lệ hoàn thành, v.v.) và giá trị dài hạn của họ (yêu thích, tương tác liên tục với tác giả, phản hồi tiêu cực, v.v.), sau đó lần lượt chấm điểm, sau đó đẩy chúng theo điểm từ cao xuống thấp.
Ví dụ, nếu hệ thống phát hiện ra rằng nội dung bạn thích với một người lạ khác trùng khớp, thì một nội dung nào đó bạn đọc và thích, anh ta cũng có thể thích nội dung đó và ngược lại.
Với sự phát triển của học máy, công nghệ mạng nơ-ron đã được đưa vào các hệ thống đề xuất. Bước cốt lõi là chuyển đổi các đặc điểm của người dùng và nội dung thành các vectơ số, đồng thời thực hiện hợp nhất tín hiệu phức tạp thông qua cấu trúc mạng nhiều lớp, để phù hợp chính xác hơn với nhu cầu của người dùng. Dựa trên mạng nơ-ron, một mô hình thu hồi hai tháp được rút ra và các tính năng người dùng và các tính năng nội dung được nhập vào hai mạng nơ-ron tương ứng, và sự tương đồng giữa hai được tính toán ở cấp cao nhất để xác định mối quan tâm tiềm năng của người dùng đối với nội dung.
Ngoài ra còn có Wide&Deep, nơi lớp "Rộng" xử lý dữ liệu hành vi lịch sử nông (chẳng hạn như nội dung mà người dùng đã thích) và lớp "Sâu" sử dụng web sâu để khai thác các liên kết tiềm năng (chẳng hạn như người dùng thích thể dục cũng có thể quan tâm đến việc leo núi và bơi lội), có thể nắm bắt sở thích của người dùng một cách toàn diện hơn so với lọc cộng tác truyền thống.
Sơ đồ sau đây minh họa các nguyên tắc cơ bản của thuật toán sắp xếp.
Nguồn: Douyin
Từ quan điểm kỹ thuật, nếu nội dung được đẩy đến người dùng quá khác nhau và nhiều người dùng không thích thì trải nghiệm người dùng sẽ xấu đi. Nhưng xuất phát điểm của công nghệ không phải là để người dùng chỉ nhìn thấy những gì họ thích.
Liu Chang, một kỹ sư thuật toán tại Douyin, cho biết: "Giá trị lâu dài của người dùng là 'chỉ báo Sao Bắc Đẩu' của thuật toán đề xuất của Douyin, đó là mục tiêu kinh doanh cốt lõi của chúng tôi. ”
Tuyên bố thực tế hơn của chỉ số này là Douyin hy vọng sẽ có nhiều người sử dụng Douyin và ở lại lâu dài. Dệt một "cái kén thông tin" có thể không thể ngăn cản trong ngắn hạn, nhưng nó không nhất thiết phải là một điều tốt về lâu dài, ví dụ, nếu bạn biết rằng một người dùng thích mèo và tiếp tục đẩy nội dung liên quan đến mèo cho anh ta, thì anh ta sẽ cảm thấy mệt mỏi khi rời đi sau một thời gian. Cũng có những người dùng cảm xúc thích xem nội dung được đẩy, nhưng ghét "nhạc núm vú" một cách hợp lý, thậm chí cố tình không thích nó để làm phiền đề xuất.
Nguồn: Douyin
Ví dụ, một mặt, nội dung mà người dùng quan tâm được kiểm soát bằng các phương pháp như phân tán đa dạng, thu hồi đa sở thích và hỗ trợ sở thích thích hợp (đuôi dài), mặt khác, các đề xuất ngẫu nhiên, mở rộng sở thích dựa trên các mối quan hệ xã hội của người dùng, liên kết đề xuất tìm kiếm và "không quan tâm" không còn được hiển thị, để người dùng có thể khám phá nhiều nội dung hơn.
Nguồn: Douyin
Liu Chang cũng cho biết trong cuộc phỏng vấn rằng thuật toán của Douyin đang chuyển sang "giá trị dài hạn": "Chúng tôi tương đối dễ mô hình hóa ngay từ đầu, nhưng nó là ngắn hạn, và dài hạn không dễ mô hình, đối với tương tác ngắn hạn, tính ngẫu nhiên của nó yếu hơn, nhưng nó ngẫu nhiên hơn đối với lợi ích dài hạn." Tại thời điểm này, quan điểm kỹ thuật của chúng tôi dần được khắc phục và chúng tôi tiếp tục kiểm soát giao thông. ”
Chỉ là, khách quan mà nói, bản chất con người là thích xem những gì bạn thích, và những gì bạn đồng ý, nếu hiện tượng "kén thông tin" được đề xuất trong 2006 năm thì không có gì ngạc nhiên khi người dùng các nền tảng video ngắn hiện nay cũng có những lo lắng tương tự.
2. Quản trị nền tảng: khó khăn khách quan
Chúng ta sợ "kén thông tin", và sợ bị nhấn chìm trong thông tin đồng nhất hoặc thậm chí thiên vị, và cuối cùng bị ảnh hưởng và thay đổi một cách không thể nhận thấy. Mặt khác, nếu tất cả những gì chúng ta tiếp xúc là nội dung chất lượng và lành mạnh, có vẻ như chúng ta không nên lo lắng quá nhiều ngay cả khi chúng ta bị mắc kẹt trong một "cái kén thông tin".
Tuy nhiên, như đã đề cập trước đó, thuật toán đề xuất của Douyin dựa trên hành vi của người dùng, chứ không phải là sự hiểu biết sâu sắc về nội dung, vậy liệu có khả năng nội dung độc hại sẽ tiếp tục lan truyền trên Douyin? Trên thực tế, khả năng tồn tại.
Khách quan mà nói, sự xuất hiện của những tình huống này chắc chắn không phải là điều Douyin muốn thấy, nhưng cũng có những khó khăn trong quản trị. Hiện tại, có hai nguyên tắc cốt lõi của liên kết quản trị nền tảng của Douyin. Đầu tiên là tất cả nội dung đang được xuất bản sẽ được đánh giá, và lưu lượng truy cập càng cao thì nội dung càng được đánh giá nhiều lần và các tiêu chuẩn càng nghiêm ngặt. Thứ hai là kiểm toán "thủ công + máy", được chia thành lao động và hợp tác chặt chẽ.
Cụ thể, sau khi nội dung được tải lên Douyin, trước tiên nó sẽ vào liên kết nhận dạng máy, và nếu nội dung được xác định là chứa các đặc điểm rủi ro cao, nó sẽ bị chặn trực tiếp. Nếu bỏ lỡ một tính năng có rủi ro cao nhưng mô hình bị lỗi, nó sẽ được gửi đến thủ công view. Nếu xác suất xảy ra vấn đề thấp, lưu lượng truy cập cơ bản sẽ thu được để chuyển sang liên kết tiếp theo. Nếu video được báo cáo, sẽ có các câu hỏi tập trung trong khu vực bình luận và lưu lượng truy cập tăng vọt, tất cả đều có thể kích hoạt xem xét "thủ công + máy". Sau khi nội dung được xử lý tại bất kỳ thời điểm nào, hệ thống ngay lập tức ngừng đề xuất và phân phối thêm.
Như bạn có thể thấy trong hình bên dưới, để một video ngắn được phân phối thành công trên Douyin, nó cần phải trải qua bốn bài đánh giá của máy móc và con người. Cũng giống như nói về chất độc, chúng ta phải nói về liều lượng, để kiểm soát tác hại của thông tin xấu càng nhiều càng tốt.
Nguồn: Douyin
Trên thực tế, quản trị nền tảng là nhiệm vụ then chốt của Douyin trong năm nay. Chen Dandan, giám đốc hoạt động sinh thái của Douyin, cho biết trong một cuộc phỏng vấn rằng họ đã nhận được phản hồi từ người dùng, phương tiện truyền thông và các cơ quan có thẩm quyền, và họ cũng đã trải qua nhiều vòng thảo luận vào cuối năm ngoái: "Chúng tôi thực sự đã làm trọng tâm quản trị nền tảng và minh bạch thuật toán trong suốt cả năm. Một trong những mục tiêu chúng tôi muốn đạt được là sự tin tưởng, bởi rất khó để có được sự tin tưởng của người dùng, truyền thông và xã hội. Trong quá trình này, chúng ta cần liên tục công khai hệ thống quản trị và công nghệ thuật toán đề xuất, và nhiều nền tảng đã chọn các hành động như vậy. ”
Các video ngắn đã trở thành một phần quan trọng trong đời sống tinh thần của người Trung Quốc, và thậm chí có thể nói là một chất mang quan trọng của văn hóa Internet đương đại, chứ không chỉ là giải trí kiếm tiền. Ngoài giá trị thương mại, Douyin cũng nên có trách nhiệm hơn về giá trị cộng đồng.