12
情感分析 推特推文的连贯检查 指南 1

Sentiment Analysis Training Guide [Simplified Chinese]

Embed Size (px)

Citation preview

Page 1: Sentiment Analysis Training Guide [Simplified Chinese]

情感分析

推特推文的连贯性检查

培训指南

1

Page 2: Sentiment Analysis Training Guide [Simplified Chinese]

Crowdsourcing Asia Sdn. Bhd. © All Rights Reserved - 2016

任务讲解

● 我们已推行了一项新的付费任务,名为情感分析。

● 许多公司雇用数据人员对人们予社交媒体和部落格针对该公司产品及服务发表的言论进行分析。这些评论被喻为 “情感”的

表达。

● 我们有很多公司对eRezeki的职源能否应付多样化的情感分析工作非常感兴趣。我们建议您对此项任务作充分准备。如果过

关,您将得到更多的副业机会。

● 情感分析任务有分几种。它们包括:

○ 分析该情感属正面,负面还是中性 (情感过滤)

○ 将情感归类 (即:评论是否与该产品有关)

○ 情感关联性 (即:整个评论是否与议题贴切)

● 今天得执行的任务为情感过滤。要求执行此工作的公司要知道个人是否需要该公司的产品或服务。您的任务是过滤推文评

论然后将它们归类为:“接纳”, 倘若该评论与议题有关;或“拒绝”,倘若该评论与这项议题无关。

● 如果您合格并呈交精准的成绩,您将通往另一个任务,予发表该评论的户头作进一步的资料查考。

2

Page 3: Sentiment Analysis Training Guide [Simplified Chinese]

Crowdsourcing Asia Sdn. Bhd. © All Rights Reserved - 2016

情感分析大纲 (1)

● 脸书,微博,Instagram (或其它)上的贴文或公告可以是有关客户对于某产品的看法或评论。公司利用您对这些评论和公

告 作 出 的 分 析 了 解 客 户 的 反 馈 , 从 而 改 进 该 产 品 或 产 品 宣 传 。

● 虽然电脑情感分析程式可以处理情感,可是人类往往更胜任处理累赘语言、表达方式、文化差异和一些俚语或社交媒体缩

写。人类在区别语气和整个句子的意思又或者判断该社交媒体贴文是属相关或正面负面等的要点区别更胜一筹。这就是您

表现的范畴!

● 举个例子:“天啊,我的车选在这个时候抛锚,未免太配合了吧!” 这句话很明显的表达了车主对于车子抛锚感到挫折。您

可以很清楚的评估该情感为负面的。然而,自动分析系统会单凭句子中的 “太配合” 而误判读该例句为正面情感句。

● 情感分析也被喻为意见采掘,是对有关的评论和贴文进行分析并将意见或态度归类,从而判定个人对某主意或产品的意见

是 否 属 于 正 面 , 负 面 , 或 中 性 。 例 如 : 以 下 推 文 被 喻 为 负 面 情 感 :

3

Page 4: Sentiment Analysis Training Guide [Simplified Chinese]

Crowdsourcing Asia Sdn. Bhd. © All Rights Reserved - 2016

情感分析大纲 (2)

4

● 举另一个例子:推特在集合了大量有关字限的差评后近期将放宽字数限制.

该公司审阅了用户的情感贴文后发现大家对字数的限制有着强烈的不满。通过社交媒体收集的资料,他们作出了改变。

● 在另一个情感分析任务中,你被问及有关社交媒体贴文是否与议题贴切,例如该贴能否成为该公司的商机或用在广告或宣

传用途上,像是以下例子:

Page 5: Sentiment Analysis Training Guide [Simplified Chinese]

Crowdsourcing Asia Sdn. Bhd. © All Rights Reserved - 2016

如何访问页面

5

登录众方案*( Massolutions)

搜索第一项任务并在该华语谙练调查中取得80%的合格分数

通过以下搜索我们:Qualify > Working with content > Content monitoring > Sentiment analysis(UGC/Social Media) > A Survey to Identify Worker Mandarin Language Proficiency

如果通过第一项测验,请选择特定的任务条件并取得90%的分数已获得酬劳资格

通过以下搜索我们 > Working with content > Content monitoring > Sentiment analysis(UGC/Social Media) > Qualification - Relevancy Check of a Twitter Post

如果合格,您将获得成千上万的酬劳任务!

通过以下搜索我们 : Work > Working with content > Content monitoring > Sentiment analysis(UGC/Social Media) > Relevency Check of a Twitter Post

*NOTE: Currently, some content, data and functionality used by Massolutions resides on the eRezeki Digital Work Portal. To provide workers with an easy to use worker interface, in particular when training, qualifying or seeking support, we have built Massolutions in a manner that allows the worker to view most content items via Massolutions without the need to also interact with the eRezeki Digital Work Portal. However, in order for all content to display within a Massolutions web page, the worker MUST be concurrently logged into the eRezeki Digital Work Portal.

Page 6: Sentiment Analysis Training Guide [Simplified Chinese]

Crowdsourcing Asia Sdn. Bhd. © All Rights Reserved - 2016

第一项合格条件测试!

一项衡量员工华语谙练资格的调查

● 这项调查的目的是测量您在华语谙练程度以及您对社交媒体的熟悉,是情感分析的一 项重要元素。

● 针对调查作答前务必清楚阅读指示。

● 调查题目其中一题作答前必须听一段录音,所以建议您装设一套耳机或扬声器

● 您需要回答20题问题

● 回答调查前记得按“接受”

● 计时器将在您按下 “接受” 开始计时。记得仔细阅读并回答每个提问。

● 回答所有问题后,请按“提交”。

● 当您完成调查后将会收到通知, “华语谙练合格”分数为80或以上并成功让您迈入下一步。倘若分数低于

80,您将无法继续前进。

● 您也可以在众方案仪表板(Massolutions Dashboard) 页面中查找您的合格分数

6

Page 7: Sentiment Analysis Training Guide [Simplified Chinese]

Crowdsourcing Asia Sdn. Bhd. © All Rights Reserved - 2016

下一步!酬劳资格测验:

推特推文的相关性检查

● 通过调查后,您将可进行“资格:推特推文的相关性 ”测验

● 在每一项情感分析任务里,都有一个您必须留意的专注点。如果不了解其背景将无法完成任 务。

● 请仔细阅读指令。您必须完成10项资格任务。您必须取得90或以上的分数以获取付费任务的通行证

● 记得对任务进行判断前按下 “接受”,并别让任务超时(计时器显示“零”)

● 当您按下“提交”时,计时器仍然处于计时状态直到您按“下一个任务”。

● 完成了10项任务后,您将收到这样的通知 “您的博文连贯性检查”分数为90,如果及格;否则分数为60。

● 或者您也可以到众方案(Massolutions)仪表板上查看您的分数。

7

Page 8: Sentiment Analysis Training Guide [Simplified Chinese]

Crowdsourcing Asia Sdn. Bhd. © All Rights Reserved - 2016

进一步指南:关键语

● 推特 - 一个人们和朋友互通讯息的社交媒体平台

● 推文 - 一句发放在微博140个字的贴文

● 推文中的@用来标签该用户:“嗨@推特!” 人们予推文中使用您的用户名来提起您,向您发讯息或和您的户头连接。

● 用户名是推特上您的称呼,通常会用 @符号开始然后输入您的用户名。譬如范冰冰是@范冰冰或@范爷

● (#)标签用来归类某个字或句,用# 符号开端。当您选择一个标签字或句,您会看到其它相同关键字或话题的推文。

● 一句您把别人的推文发出去给粉丝的叫做转贴,推文前段都会有原创者的用户名。转贴通常用来传递消息或其它探讨性的推文,并保留原创来源。

■ 例如:转发推文@马来西亚热浪岛海湾度假村:热浪岛的清晨,祝您周末快乐!#带着推特去马来西亚#@马来西亚旅游局 @马来西亚的镜头 @十六番-马来西亚 @微马来西亚

8

Page 9: Sentiment Analysis Training Guide [Simplified Chinese]

Crowdsourcing Asia Sdn. Bhd. © All Rights Reserved - 2016

● 检查用户名或作者账号。由程序自动发出的通常为垃圾邮件或广告博文。区别在于该账号名不会呈现个人的名字。账号照片也鲜少为人的照片,比较会用普通头像或图标代替。

这些推文的用户名/作者显示改贴文皆自动贴文而非个人贴文因此该推文应该被拒绝

进一步指引:区别推文为垃圾邮件或广告 (1)

9

Page 10: Sentiment Analysis Training Guide [Simplified Chinese]

Crowdsourcing Asia Sdn. Bhd. © All Rights Reserved - 2016

● 通常,促销产品或服务的广告推文上会有该产品促销的连接

● 有的广告推文也许也会由个人发出,您可以从此类推销推文的内容中察觉。

例如:

虽然这是个人推文,但其实是一则广告,因为它鼓励大家通过连接换取免费礼品

此推文的作者尝试推广他的网站并鼓励大家点击链接。

进一步指引: 区别推文为垃圾邮件或广告 (2)

10

Page 11: Sentiment Analysis Training Guide [Simplified Chinese]

Crowdsourcing Asia Sdn. Bhd. © All Rights Reserved - 2016

● 一句具有探讨性的推文倘若带有负面情感就该被拒绝 (即:讽刺产品或服务)

● 这个有关奔跑吧兄弟的例子虽然为正面情感的推文却应该被拒绝,因为作者虽然是该片的粉丝,但是却挖

苦其中演出者

这项评论应该被拒绝,因为它讽刺小米Max的预约人数不可能超过1000万。

这项推文应该被拒绝,因为其出发点是在挖苦演出者所以拥有负面情感的推文应该被拒绝。

进一步指引: 分辨讽刺或挖苦性质的推文

11

Page 12: Sentiment Analysis Training Guide [Simplified Chinese]

Crowdsourcing Asia Sdn. Bhd. © All Rights Reserved - 2016

● 有语病但是和关键任务有关的推文还是能被接受的,只要您可以了解整个句子的意思或推文 带出的讯息即可。

● 庸俗或亵渎的推文仍然可以被接受的,只要整个句子和公司的目的或主 题吻合。

● 拒绝该推文,如果:

❖ 内容无聊或句子表达不清楚❖ 含大部分亵渎成分❖ 和主题无关❖ 针对这项任务来说,并非用华语表达❖ 只充满标点符号或表情图标

进一步指引:拼字错误或语病,亵渎和废话

12