重谈新番评分模式

不知道客栈的旅客们有否亲眼目睹过中国工厂流水线上的熟练工?当你日复一日的站在同一个岗位上执行同一个指令,你的肌肉就开始记忆操作的每个细节,提高你的速度,加快你的反应。无意识中,你的神经和GPS导航一样,不断寻索与更新着最优路径。

假如你有幸缺乏流水线的工作经验,不妨想象应试教育制度下的学生生活。不断重复的题海里,栽培出来的只有无限接近机器的条件反射,记忆与速度往往比创新和雕凿更受重视。

“重复”,作为自然界最常见的训练方式,也是最让人疲惫的方式。说来讽刺,恰恰是人类的高智商造就了奢侈的烦恼,才开始想方设法的用智慧减少重复。

等等,我记得这篇文章有个主题……哦,是想说新番评分模式来着。话说客栈乱弹新番的业务也在不经意中踏入第5年了(客栈自身则是6周年)。回顾这些年来构思,撰写,录制的各式新番评论,我不禁感叹:碎步前行,时光飞逝。

5年,我很欣慰自己尝试了人力范围内可完成的大多数评论风格。5年,我意识到自己的思维模式渐近定格——犹如一位应试前的学生,一名流水线的工人,顽固而僵硬。

要把一个捏它不知,经验为零,近乎小白的初级爱好者(例如我自己)带入宅门,是个复杂与残酷的锻炼过程……即便入了大宅门,亦不过多了一身“提前看穿制作组伎俩,对常见剧情展开无动于衷”的后遗症罢了。跨过门槛的我,在喧闹拥挤的四合院里左顾右盼,不知是走是留。

“为新番烦恼?无聊!为新番献身?多余!”正常人的神经高喊着。

“这是我的极限,除非我放弃三次元一切。”阿宅的神经犹豫着。

若上帝有蛋,他一定会微笑着关注我,并痛苦的捂着下体。

正常神经的预测十有八九没错,我确信今后5年内,新番爱好者的评论质量会大幅度提高,这和文化入侵沉淀后的生根发芽不无关系。供求关系是刚性存在的,合资公司是蓄势待发的,长远政策是逐渐开放的,保守的说,只要贵党不脑残不锁国不闭门造舟(我打下这句话时,背部一阵发凉),会有比客栈今天大100倍的盈利网站竞争新番乃至ACG的媒体蛋糕。现在关客栈,地球照样转。

但我说服了自己,“未来怎么样与我无关。我不满足的是现状。”

不满足于三脚猫门户,不满足于弹幕视频站,我尝试总结了一个新番评论的标准策略,以供激战将近的“新番评论业”参考。相比去年的标准,本策略的优势如下——

  • 逻辑明晰,量化观点
  • 模式灵活,简化结构
  • 应用性广,兼容性好

除非你愿意和我一样把新番评论写成蹩脚的文学作品,这个策略能节省你制定评分标准的时间,解放你在实用性与趣味性上左右平衡的重担。听起来不错?

在为新标准揭幕前,先来看看传统新番评论的两个极端。

  1. 客观角度:把评论写成购买指南,提供明细评分与多角度的数量化分析。
  2. 主观角度:把评论写成意见专栏,基于感官的分析,重点放在个人感受。

新番,虽然是商业得不能再商业的动画创作,却仍属于“艺术”的分支,因此我们见到的作品分析多是偏主观的。客观的数字则是方便读者更快速分辨作者观点的桥梁,通常没有横向可比性。换句话说,一个9分的化物语与一个8分的刀语之间,没有任何量化的优劣标准。

作为一个客观数据控,我去年尝试基于动画制作,剧情展现,流派特质与喜好偏差制定可重复使用的标准。但在使用中我发现了它的致命缺陷——读者(或者说新番观众)从不用这些指数作为观看作品与否的准绳。就像对网民谈自己的浏览器运行Javascript时有多快,毫无意义。即便动画质量可以测量,它还是业内人的小圈子兴趣。

一部作品是否好看,纯粹基于观众的个人体验。我可以说凉宫开创了一个强女角时代,不卖帐的人可以举出无数个反例。销量,知名度,文化冲击,在主观世界里都是飘渺的宏观概念。我们需要一个能客观表达主观意见的方式。

客栈隆重推出——新番坐标系

如你所见,这个伪坐标系只有中心点,没有数量化的刻度。横轴与纵轴均是主观的评价角度,而不是客观的统计数据。这个设计解决以下几个困局。

  • 评价是连续的。主观感想和自然界大多数事物一样,并不是离散的感念。我们没有办法把观点简单的转化为数字,因为我们缺乏计量的标准。
  • 评价是相对的。我们无法在感想上增加评分,没有标准能概括3分作画与4分作画之间相差的到底是什么。我们是感性而非理性的说一款作品比另一款作品更好。
  • 评价是多样化的。我们不能把感想肤浅的归纳为几个统一的评判标准。一如我之前所述,笼统的分析剧情或流派,不仅对读者无益,也容易略过作品的闪光点。

那大众爱好与个人爱好的区分又是怎么回事?我的思考如下——

  • 个体喜好再怎么具有概括意义,也不可能完全代表观众群体。
  • 若纯粹使用群体的喜好,则评价变成了民意调查,只剩下主流的概念。
  • 要从主观意见中提炼客观的表达方式,同时考虑两种主观意见是可靠的选择。

光说不练缺乏实感,就让我借用秋季新番来解释一下规则吧。

相信各位会首先注意到坐标系中的点与圆。填写图表的顺序如下:先回忆作品的数个特质,接着比较自己与观众群体对本特质的反应,在对应的地方划下交叉;然后根据交叉的具体布局,画一个正圆囊括它们;最后找到圆心所在,这就是本作的整体评价。

新番坐标系直观的记录评论者大脑的基本思路,比分数更能体现评论附带的暗示。例如圆圈覆盖的范围,其实是作者对观众群体感想的置信区间,他相信大部分人的观点会落在这个范围内。这样一来,读者不仅能看到作者的基本观点,还能立马理解作者对这款作品的推荐信心。

除去直观的点与圆圈,图表还诠释了分数难以形容的观点。例如象限的含义,第一象限是主流与创新,第二象限是标准与平淡,第三象限是过气与老朽,第四象限是小众与激进……还有圆圈的大小,它代表着作者对这款作品能否口碑一致的猜测,越大的面积代表着越大的不确定性。这些都是中位数所不能表达的。

时间关系我就不花太多时间重新构建图表了,这里统计本季追看过的作品定位。然后我发现自己是个装小众的白烂死宅——假如你看上图的绿线,它代表着大众与小众的分割线,比绿线高的作品都是观众反映比我自己反映好的(点到直线的垂直距离越大说明观点分歧越大),而绿线以下的,才是我更喜欢的小众作品。

这个图遗憾的说明,我是个嘴巴比身体硬的傲娇。

你看,新番坐标系不仅帮忙评论新番,还协助自审个性,难道不是一款好工具吗?更多的细节就留给旅客们去发掘了,若有什么感想和建议也欢迎留言提出。

最后是投票时间~

哪种评论组合更符合你口味

  • 简明分数 (12%, 50 Votes)
  • 直观图表 (24%, 98 Votes)
  • 分析文字 (34%, 139 Votes)
  • 附加媒体 (9%, 38 Votes)
  • 自我脑补 (21%, 86 Votes)

Total Voters: 219

Loading ... Loading ...

完。(image credit: 小唄, )

Author: 店长

The Master of BitInn

42 thoughts on “重谈新番评分模式”

  1. 我说圆心定得太随意了吧……我认为此处圆心的定义应该是各点距该圆心之和最小的点(我也觉得球形物开始痛了……)

    话说最后一张图那个圆有什么意义啊

    And… Where can I get that game?

  2. 很简单直接的评分系统,真的很不错。正如店长所言,动画的评价很大程度上都是主观的,相比起量化,还是比较来得实际。
    不过对于这个偶尔上来的旧客户而言,这样的评论系统,欠缺了店长以往有趣文笔的发挥机会,所以我还是希望店长能在这图表基础上,添加店长的短评。

  3. >然后根据交叉的具体布局,画一个正圆囊括它们
    我仿佛看到了高中物理的实验题

    不过这个方法到底叫什么,数理统计里好像没见到?

      1. 粗略看了一下,聚类是个分类的算法吧?
        我想说的应该是从多个离散的点求出类似于均值(圆心)和标准差之类的数据的方法
        话说本来想说半径是标准差的,打出来才发觉半径应该是“最大差”

  4. 大众就是个垃圾桶,没有负分,再烂的片都有人喜欢Orz
    比较有新意,但我为啥感觉店长对于大众口味的臆想比店长自己的捏他流吐槽还要主观Orz

  5. 大众果然被吐槽了,其实根据象限含义直接把作品特质扔进去也不错。

  6. 有意思的方法,至少会调动一下僵滞的思维。
    离散的点是主观看法,中心是相对客观的判定

    但是有个问题,主观的看法定性地确定象限很容易,但是具体的坐标和相对原点的距离还是要定量分析的吧,那样的话不是又归到单独打分时类似的情况了么?只是用图表更直观地表现了出来。

  7. 长文无力,喜欢言简意赅独到吐槽……表现自己就好,管其他人那么多……

  8. 又想了一下,于是来补充……

    “大众”也是分层次的,比如魔禁肯定比四叠半大众,但和宫崎骏小丸子比它又是小众,或者可以称之为“有限范围内的大众”
    所以不限定范围而单说“大众”和“个人”是没有意义的。坐标轴得好好定义一下大家才看得明白啊……

    不过这个想法真有意思,我就喜欢看图表啊统计神马的 ( ̄▽ ̄ )

  9. 想法不错,但是的确有问题…
    最主要的就是对于大众爱好的判定无法避免主观性,而这一主观性比对一部作品的主观性还要地图炮…
    另外象限的意义,就算是店长,把个人爱好概括为小众创新也太绝对了

  10. 店长你果然是个理科生啊——我这种数理超没感觉的家伙已经头晕了。

    产业大蛋糕什么的我是不熟悉啦,而且现在自己也算是半拖离ac大部队了,但就我这种只是想消遣一下的家伙而言,俺只是让自己已(大概)了解其喜好的别人能在我们还没看这部作品前(或者根本没听说过)告诉我他们自己的观看感觉,下一步的选择,就这样都还是全权由自己来负责了。

    所以,继续期待你在图表后面的文字——其他的就留给有需要的同志了。

  11. 说到量化标准……pixiv同名条目有多少是一个不错的量化标准……

    另外这个坐标系太难看了……

  12. 店长这文写得颇有松鼠会的文风,让我一度以为开错了标签……

    坐标系这种想法很有趣,也很直观的可以看出评价与取向,不过用四个象限来评价新番的水平有点不够准确,如果说Y轴是众人看法取平均值得到的结果,可以反映一定的真实情况;而X轴则是店长的主观看法,这样的话两者综合起来店长的看法就占到比较大的比重了,比如《缘之空》就因此被踢进了平淡无奇的行列。而且绝大部分的动画都停留在第一象限,这样剩下的三个象限基本就是没用了嘛

  13. 相当第一象限的一款评分标准。貌似是第一款二维评分标准?
    在此基础上想了想:
    首先是坐标原点的问题,可以预想不同评论者之间的主观原点会有一定分布,具体到个体评论上我认为足以使部分“第一象限”作品变成“第二象限”作品甚至“第四象限”作品。那么首先Y轴可以用统计的方式确定0点,然后对X轴用户可以基于统计数据得出评论者0点到自我0点的修正。所以说款标准个人认为可以反映一定程度上的客观素质,但是需要大样本量的支持——所谓“网站”的支持。
    其次依然是坐标原点的问题。很遗憾这款标准似乎只能适用于评论数多的番组,***Y轴的原点无法确定得很准确就失去了其意义***,对于比较冷门的番组,反而有着比起传统一维标准更加复杂累赘的劣势。目前粗略想了下,这个问题大概可以用非笛卡尔坐标来解决。。。换句话说两轴夹角和网络总评论数是成正相关的,评论数趋于无穷则夹角为直角,趋于零则夹角为0——但在小夹角情况下大概依旧会觉得还不如直接一维算了。

  14. 好热闹的讨论,问题主要集中在怎么确定坐标原点和如何调整店长和群众各自观点的权重——这会直接关系y=x那根线是否具有意义。
    不妨将群众关于各番组(以关注数为权重)的加权平均分的平均分作为基准,各自的加权平均分与之的差值即为Y轴上的坐标。
    而对于店长专属的X轴也可以用以上的办法,打出各番组的分数,用其与平均分的差值来确定在X轴上的位置。

    1. 还是要打分,而且得精确到小数点后面一两位的那种么……
      为什么我觉得店长就是想逃避打分才弄出来这东西的 XD

  15. 第三第四象限其实就是店长没看的啦…

    这种方式很新颖,比纯文字更直观,比普通打分更具体,重点是很有趣 (∩_∩)

    只要是人作出的评价就一定有主观因素,不过这一份主观不就是我们来这里而不去别处的理由吗,店长这份努力才是最可爱的

  16. 吐槽自己一下:丫的叫你不好好學數學啊!現在連宅的資格都沒有了!

    於是,被圖表擊敗。。。。爬走。。。。。

  17. 在感性的世界里探求理性本来就没有标准吧,弄得有逻辑可能会让人感到茫然,对于店长这种“肩上的负担源自胯下的巨蛋的人”,需要在下帮您柔肩么。
    嘛…路路子是很喜欢这种坐标系风格的…虽然不评论动画…但路路子也常推荐朋友听歌…给歌的整体曲风、歌手声线、伴奏乐器、前奏方式、整体音域等等元素划分了几个层次…把一些典型歌曲给数据化…想找出一个符合各种人口味的万能公式…然后计划果断流产了…太不直观了…
    路路子觉得…店长别太拘泥于主观想法的代入…大家会来这看店长的评论就是被你的魅力吸引…主观意见多些鲜明些挺好的…嘛…路路子挺喜欢那条绿线的…会心里想着…那些吸引店长的元素是什么呢而关注…自己和店长在那条绿线两边隔了多远呢…
    当然能把原作让人感触的地方都传达出来这种宣传推广届逆天的难题…本来就那个什么的…店长想到什么有趣的想法就添加上去吧…
    只是…我有点小担心…对这种试图的理解是建立在愿意去看之上的…不晓得不熟悉店长想法的人…第一次见到会产生怎样的感觉…

  18. GJ
    不过这样以来 对新番的评价就必须进行“民意调查”
    不然很难知道 大众的真实看法吧 而且 没有标度也很蛋疼啊

Comments are closed.