找回密码
 注册
8月份电巢直播计划
查看: 67|回复: 0

如何从5W模式入手,助力内容审核

[复制链接]
  • TA的每日心情
    奋斗
    2019-11-19 15:09
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2020-7-31 14:41 | 显示全部楼层 |阅读模式

    EDA365欢迎您登录!

    您需要 登录 才可以下载或查看,没有帐号?注册

    x
    本帖最后由 fish1352 于 2020-7-31 14:43 编辑 4 Z$ F& t6 P7 J7 @( v6 [
    4 ~) E5 }7 H5 `- b1 o4 h
    ( O1 }7 j4 B0 Q

    ' V4 ?6 \1 e7 o) g# \' o
    " z( }# V" }( S2 n" [/ K2 ?
    $ J& [5 P# \" d
    一、5W模式与内容审核
    $ l6 r2 E' r- Z/ p2 d; U* l, z# H
    1948年,拉斯韦尔提出了传播过程及其五个基本构成要素,即:
    # V3 z9 |, B8 c+ w" C5 j" @6 y, `7 H
    , g: f/ X/ Z% G' l! H
    • Who:谁——内容的生产者;  
    • What:内容——生产者说了什么;  
    • Which-In Which Channel:渠道——内容通过什么渠道传播;  
    • Whom-To Whom:受众——谁接受到了内容;  
    • With-With What Effect:效果——内容传播后取得了什么效果。 / K% t" v# L# q, l
    所有的传播行为都可以围绕这5个要素展开。8 I8 {. L9 t+ B( Z* g4 y3 W

    : h  l3 r+ K, ^ 所谓内容审核,也不仅仅是对内容本身进行识别,尤其是在目前机器识别无法达到100%的准确、内容数量本身及其庞大的情况下,通过对各个传播要素的“监控”,也是完善机器审核的数据维度、提升审核效率的有效途径。$ d2 V& h1 e) N. Y
    : A; e; X& @0 r( w: [
    5W要素应用到内容审核中,分别与以下角色环节相对应:
    9 R2 ~( n! {% l3 F2 F
    ( {% x. u5 I& t$ o* ~% c1 V
    • Who:生产者是否靠谱?是否是一个“可信”的人?他发布不合规信息的可能性有多大?  
    • What:内容本身是否是合规的?  
    • Which:渠道想要做好“把关人”的角色,应该如何开展内容审核 ?  
    • Whom:受众本身有无异常?受众的行为是否合规(如发布不良评论)?  
    • With What Effect:传播的情况是否正常? . F# n( I4 G2 i5 b7 ^
    内容审核目前都是通过机器+人工的方式进行,审核的机制既可以是先发后审也可以是先审后发。
    % f. V6 n" v6 E$ Y' D# S* c; R
    $ W' w& u. u+ f  K( g 如何选择这些方式和机制、在提升审核效率的同时最大程度地保障内容安全、同时又不影响用户体验,维护三者的平衡,可以围绕上述各要素来进行规划设计。0 k% _0 v  F1 a8 U
    * j1 J& [/ Z2 T
    二、五要素在内容审核中的应用 3 F% |' c+ b4 G) K1 U6 g
    & q/ S( t( Q$ Q% i$ u  `/ ~

    2 h" y# G' d% w7 y8 Z% d3 `7 f
    . P( |; Y+ V# d* n5 D 1. Who:对内容的生产者的风险评分和标签体系
    3 ^: [% P9 ^" Y, a6 e6 L0 n+ `: D9 R+ ]
    1)建立对于内容生产者的风险评分
    ) H  I3 O: P! W/ A
    ! L0 R- C  S6 c7 Q5 Q5 A. P 从内容生产者发布第一条内容开始,就对他展开内容识别,基于静态的注册信息、此前的行为信息建立初步的风险情况后,根据其后续发布内容的情况动态实时调整,同时建立黑名单制度。2 B/ v8 L# ]+ e
    9 ~9 E& Z8 c0 Y: \' q  E/ m
    如:一个内容生产者,此前浏览的内容都是财经、商务类型的,而且绑定了银行卡,则前期的静态评分可以认为他是一个低风险用户。; P2 K/ m6 J! Q4 \. S, q
    5 \4 v1 n; d6 h
    后续其发布的内容在一段时间内多次触发人工审核机制,则可以提高他的风险等级;随后他发布的内容被用户举报且人工审核确实违反了规则,则可以视情况将其纳入黑名单,限制之后的内容发布行为。( n! y! j: N: z# k$ M. b

    4 z. S& X3 q9 E* o 2)建立对于内容生产者的标签体系
    $ [  M  ?1 e- H7 [8 O' |4 a1 S
    7 Y9 b- G* `7 {1 V6 S6 M7 t 针对内容发布者进行画像,可以实现对异常行为的监控。
    # o( c$ ?: n2 C3 Z' j
    % L6 d8 \/ i* h- I* E* T! j 标签体系可以包括用户的性别、年龄段、常用地理位置、常用设备、发布的内容类型等信息。一旦某些信息发生变化,则需要对其内容进行重点监控,防止异常行为,如用户被盗号后此账户被用来发布不合规内容。* V2 R, u* y; j8 j

    , K$ n- j& c8 v3 s3 F 此外也可以设置优秀内容生产者等标签,对此类用户发布的内容免审核或可以先发后审。& s3 _( E' H' f& l# w0 r
    ' n" x* S% `6 b' L( `5 \7 l% ~
    2. What:对内容的识别规则和手段 ( {# m! s3 P( ^$ V! d* \% s0 B

    ( H* o3 l7 J7 |7 ~ 建立内容审核的规则,审核的规则大体上来说源于监管的要求和业务的政策。
    ! I4 B0 z* C' `
    . Q7 {, g% P0 y. X1 I3 O 1)监管的要求
    4 v- x7 r6 e2 n, _0 I# v2 r0 ^
    + h# y( Z  l. N( N$ ` 内容不能涉及黄赌毒暴政恐,《网络信息内容生态治理规定》、《网络短视频内容审核标准细则》等也对内容审核提出了详细的要求。: H1 C( x2 ~9 z/ X5 w

    ' c8 w; L( v+ M3 R. h 2)业务的政策
    6 ]& x+ r+ `7 Q) k& `/ D) m0 ~  `' G! d( g5 d( L. _
    为营造社区的良好氛围,保证用户体验,内容不能涉及侵权、谩骂、隐私、低俗、垃圾内容等;为保障平台的正常运营和利益,不能违规发布广告、添加链接等;为社区用户安全考虑,内容不能涉及导流、诈骗等。
    / k$ _5 T* \% \2 Q. T/ v
    2 f0 G  q9 I2 G' |* q5 _ 3)丰富审核的技术手段; Q3 z/ {9 _( o3 d  ^
    7 g% o4 F# h. N+ {
    充分利用人工智能等技术手段,实现对文本、图片、声音、视频的自动识别,不断提高机器的召回率和准确率。7 o3 U8 T6 f8 O' J1 ~
    9 _6 Q# K9 [! c" l
    4)搭建机器审核和人工审核的流转机制
    9 @+ |( c1 o9 o3 L% {$ L/ a$ w* d) G! {/ V+ t
    包括内容在何种情况下触发审核、何种情况下触发人工审核,人工审核是否需要复核等,完善的流程设置对效率的提升大有助益。$ h# R$ V4 d/ _6 o/ P2 T! A
    6 X( Q, t% O9 T; J
    3. Which:助力审核人员扮演好“把关人”的角色 " w6 m4 J4 _% x1 Q! e& z/ h

    " Z3 T( H+ v! @2 m- A% s* ^ 1)设置有效的任务分配机制) Q$ q6 I' g' I8 q  y# G

    $ i' D* W$ ^$ A- j2 w  f 提升分发效率和审核效率,保证需审核视频100%分发,且在最短时间内到达审核人员,同时按照一定的规则给审核人员分配需要审核的视频。
    * g6 y7 p! G. x1 i# k/ ]4 L4 c  \+ ~5 c& N
    按照触发人工审核的原因来分发,可以使审核人员积累在某一领域的审核经验,提升审核效率。2 A+ y) Z9 n2 l/ F
    0 I3 P0 D) }7 F( g' M% a  M
    2)为审核人员提供配套的功能5 [! A5 p* b; }
    % W1 ]2 ]  n8 r/ k2 W. b' v
    “工欲善其事必先利其器”,提供审核的辅助功能,助力人工审核提速。2 v6 e3 o) U* Q1 k$ B7 S8 d

    0 P" f4 Q( V: s. J 如针对文本的审核对敏感词高亮显示,针对音视频的审核标注关键帧、设置倍速浏览功能,审核的信息通过信息流的方式自动呈现,减少操作点击环节。
    5 \4 o& l1 E3 p. b& _% p- E/ l$ b& r5 G  V" Q
    4. Whom:通过受众识别违规内容的“蛛丝马迹” 1 m/ D. y, S+ E

    8 t' P, B5 Z5 v" z% ~! s 1)为受众提供举报功能! y/ V1 o) z) @
    7 {( n" P; W# ^) Q6 I. }
    一方面可以节约审核资源,另一方面也是对机器和人工审核错误率的一种弥补。
    9 c' K& m; X4 I$ p: n! I: t+ c! ^- v, ~" o$ q/ I0 z
    2)建立受众的标签体系. R9 W4 a( G1 C( h2 s

    0 L" W9 r# A) a% g+ e, t 和针对传播者的标签体系一样,对用户的画像除了用于针对用户的内容推荐外,也可以是对内容质量反馈的一个维度。
    7 N' l' J- b; H* m% z' z; w7 D4 }/ T/ ~3 `. c' x9 |
    例如:同一个内容被大量不同标签的用户关注,可能内容本身存在了诱导行为,就需要人工审核予以确认。: W6 ?! p* o+ Y+ ]7 Q
    ; U6 _# S0 s2 ]1 c& n4 m; v
    3)进行受众聚集情况分析; T) I6 _7 X5 @- `! Z7 x5 J

    3 g' p. E5 b' G! u4 X2 d 针对受众的集中情况进行分析,是否过于聚集。& N. @2 S" @9 h

    7 u9 ~. V$ R) C9 d8 Z 不过此方式多用于直播中刷量行为等的监控,在内容审核中,可以辅助判断内容是否存在诱导、违规广告营销等。
      I3 z. ?' {# m) t9 `* \# q5 [$ h! N% B: y" S! K: m0 h& i; q
    5. With What Effect:通过传播的效果发现内容的异常 ' D# \. g, R/ t6 `: N$ T% Q

    3 z, L) v* [9 v- W 1)通过观看、点赞、转发、评论数等的监控发现异常行为
    4 S) A* w+ e0 g" _; @+ `2 ]
    - \9 M  x! c0 s, H+ ^ 传播范围广泛的内容中若存在风险,造成的后果更为严重,因此要对观看、点赞、转发、评论量比较大的内容特别关注。/ ~% @* X( [  H* }

    + ?" @# @9 J& A  x; u% I' q 另外:这些指标的异常也是一个值得关注的风险点,此前点赞数一直不过百的用户新发布的内容突然点赞过万,可能需要对内容进行人工审核。
    " m8 L' E1 B% g5 U9 w# |3 h. K; S3 W+ `- o
    2)对评论进行内容识别8 T0 b  {; U3 d/ X0 r2 V" z
    6 Q  J8 }) }! w- c
    评论同样是内容审核需要关注的部分,对评论内容的识别。% r$ ]& u% n# Y+ N( P. O( }8 _, A- D# d

    # z  _8 W, `. n 一方面是监控评论是否有违规行为,另一方面通过关注评论内容中是否存在对内容本身的举报等,来进行内容审核。
    : K- u' W1 L6 p1 `( s0 L3 e' t2 R' z, b; o5 B" T6 p) h& _
    三、小结
    7 Q: Q9 k4 E, V( T, t9 t, Z# m* |% O6 {  S; m
    从5W模式入手建立内容审核的体系,是基于传播要素的完整模式。$ K, u7 y2 f$ e' T" \$ L/ w
    7 `1 F- m3 i# }2 F) M' T8 m
    内容审核的重点还是在对内容本身的识别方面,从提升机器审核的召回率和准确率,到提升人工审核的效率,再到搭建完整的流转机制,从其他要素着手也主要是为优化这三个环节来服务。2 g* e7 _1 N& H1 }! e5 M7 e2 F; m
    2 z* j" L6 z( N) y4 d* v, N) F) r
    当机器能够实现对违规内容的100%精准识别,甚至具备了自我学习的本领,能够自己去拓展发现审核的“要义”,或许其他环节也就不那么必要了。& [* j6 l" L+ z1 b

    # m- i" e$ Y) z, S
    2 {+ Z  H1 i8 [$ d5 S- O$ A6 b6 q『本文转载自网络,版权归原作者所有,如有侵权请联系删除』
    您需要登录后才可以回帖 登录 | 注册

    本版积分规则

    关闭

    推荐内容上一条 /1 下一条

    EDA365公众号

    关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号 )

    GMT+8, 2020-8-14 08:45 , Processed in 0.062500 second(s), 21 queries , Gzip On.

    深圳市墨知创新科技有限公司

    地址:深圳市南山区科技生态园2栋A座805 电话:19925233282

    快速回复 返回顶部 返回列表