织梦CMS - 轻松建站从此开始!

我的技术分享-房事

当前位置: 我的技术分享-房事 > 情感疗愈 > 文章页

文本挖掘:避孕药主题情感分析

时间:2025-06-24 01:31来源: 作者:admin 点击: 91 次

关于舆情分析的实例分析,希望给你带来一些帮助。 前言 距离上次文本挖掘小文章时间已经过了3个月了,北京已经入冬,有人说北京的冬天很冷,但是吃上火锅很暖;也有人说北京的冬天雾霾严重,太干。这两句表达的是对北京冬天的情感,即有正面也有负面。 如果在舆情分析而言,我
<p> <p>对于舆情阐明的真例阐明,欲望给你带来一些协助。</p> <p><p><strong>前言</strong></p> <p>距离上次文原发掘小文章光阳已颠终了3个月了,北京曾经入冬,有人说北京的冬天很冷,但是吃上火锅很暖;也有人说北京的冬天雾霾重大,太干。那两句表达的是对北京冬天的激情,即有正面也有负面。</p> <p>假如正在舆情阐明而言,咱们正在作营销阐明,阐明产品、流动黑皂,大概欲望维护品排PR,咱们就须要针对出产者网络发声去阐明激情,来协助咱们维护品排,改进流动产品,来抵达监测舆情阐明成效。换句话说也便是咱们原日分享的主题&#8212;sentiment</p> <strong>舆情阐明思路</strong> <p>笔者5年前作舆情阐明时候正常来说便是人工舆情,并无参预高级点的阐明工具减少人工投入。跟着R,python等的风止,同时,跟着各类开源包tm,LDA,Rwordseg开发,以及高档概率数学的使用,譬喻分词算法依据隐性马尔科夫链算法编写而成(风趣味的同学原人钻研),让咱们之前的工做质大大减少。因而人工舆情转换成人工纠正舆情局势所趋,即咱们运用工具减少读帖子的光阳,并且让呆板进修,人工后期纠错。</p> <p>正常而言,舆情阐明报告分为以下几多个轨范:</p> <p></p> <p>前两个可以做为统计阐明-统计光阳趋势音质,音质份额,后两个可以做为<strong>建模阐明-主题阐明,激情判别。</strong></p> <p>那里有个小插直:上次分享的是主题阐明,笔者最近又从头梳理了下LDA,发现tm包中文分词造成词频矩阵很不抱负,那会招致LDA无奈使用,因而,后续笔者会原人写个脚原将词频矩阵真现,那样会便捷LDA,会便捷聚类阐明,以及预测阐明。</p> <p>言回正传,激情阐明便是表达发言人对一个主题的观点,有好有坏,大概中立。<strong>激情阐明使用分类两类,第一是给定正负面词,算分值,高于大概低于baseline则默示正面、负面情绪。第二,依据深度进修,操做神经网络来区分正负激情</strong>。原文先真现第一类激情阐明。</p> <strong>第一类激情阐明:正负面词典(简版)</strong> <strong>读入文原,数据清算</strong> <p>原次还是以上次文原为输入项,将content_Full 内容作文原办理</p> <p></p> <p><strong>清算准则:</strong></p> <p><strong>去除非凡字符,空值等,譬喻☆挪动平台☆iOS☆</strong></p> <p><strong>去除转发的内容,留本做者不雅概念。譬喻 糊口生涯红框内的文原,去除背面转发文原</strong></p> <p><strong></strong></p> <p><strong>增除文原过长的内容,内容偏差日记和告皂,减少文原噪声</strong></p> <p><strong></strong></p> <p><strong>去除stopwords</strong></p> <p>比如中文常规字符,‘的’‘地’‘得’‘我’等</p> <strong>添加词汇</strong> <p>由于原文是医用词汇,须要添加的词汇偏重医用大概品排,不让分词装成单个字符</p> <p>譬喻:妈富隆,调经</p> <strong>分词&amp;词云图</strong> <p>文原办理后,依据词频显现频率,<strong>且过滤掉分词为单个词的中文</strong>,绘制词云图,鼠标所过的词可以显示文原显现次数,譬喻避孕药:767次</p> <p></p> <strong>载入正负词典</strong> <p>正面词记1;负面词为-1,便于之后算分值划定激情</p> <p></p> <strong>计较激情得分</strong> <p>将文原中的分词依照中英文词典的正负面词打分,计较分值,若中性词(不显现字典)则记为0。</p> <p><strong>分值计较本理</strong></p> <p>公式 (原人编的,有疑问请留言一起探讨)</p> <p><strong>激情分值=∑i=1(正面+中性)*(-1)t</strong></p> <p><strong>i 默示第i句话;t默示显现负面词的次数</strong></p> <p>公式默示一句话中若显现偶数负面词,默示肯定,譬喻:我其真感觉他没有这么不知书达礼。 两次认可:不,没有,t=2</p> <strong>结果</strong> <p>正面发声分类结果:</p> <p></p> <p>负面发声结果</p> <p></p> <strong>后续改制:</strong> <p><strong>将词频矩阵脚原改写,重现LDA 大概 聚类</strong></p> <p><strong>对文原祖先工预判,将此打分停行 confusion matriV,评价分类器</strong></p> <p><strong>目测而言负面分类根柢准确,正面分类中包孕不少中性发声,须要进一步剔除钻研</strong></p> <p><strong>深度进修重现下激情阐明</strong></p> (责任编辑:)

------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:
发布者资料
查看详细资料 发送留言 加为好友 用户等级: 注册时间:2026-04-25 19:04 最后登录:2026-04-25 19:04
栏目列表
推荐内容
  • 做中国伤痛防治破局者,云南白药助力基层诊疗能力提升

    4月1日,国家卫健委正式启动基层医疗卫生机构医疗质量改善三年行动。这一行动是医疗卫生领域“强基工程”的贯彻落实。根据文件,该计划将在2026至2028年间开展。...

  • 停止内耗!3个方法帮你成为自己情绪的主人

    假如用一个词来描述你此时的情绪,你会用什么词呢?你的情绪还好吗?情绪,像一只有形的手掌控着咱们的糊口,它的映响力无处不正在。当情绪不被看见、不被觉察、不被开释的...

  • 豆包软件在哪里提交反馈意见给平台

    豆包软件在哪里提交反馈意见给平台,很多小伙伴不知道,手机版豆包软件在哪里提交反馈意见给平台?今天小编来分享一下经验...

  • 接纳的解释

    接纳的解释:[receive] 接受;收纳接纳新会员详细解释(1).结交罗致。《后汉书·岑彭传》:“ 光武 深接纳之。”《三国志·魏志·吕布传》:“先是,司徒 ...

  • 金泰克(TIGO)固态硬盘S300 120G报价

    苏宁易购提供金泰克(TIGO)固态硬盘S300 120G最新价格,包括优质商家报价、参数、图片、视频、问答、评价、怎么样等详细信息。关注苏宁易购,为您购买金泰克...

  • 脑人院(突发荒诞事件!)

    漫画站提供脑人院(突发荒诞事件!)漫画在线阅读和第一时间更新,同时也提供脑人院(突发荒诞事件!) 情报、图透等信息,漫画站是一个综合的脑人院(突发荒诞事件!)在...

  • 你很重要

    漫画站提供你很重要漫画在线阅读和第一时间更新,同时也提供你很重要 情报、图透等信息,漫画站是一个综合的你很重要在线漫画阅读网站。你很重要漫画简介: 被生活的琐事...

  • MCJS:《我的世界》网页中文版

    MCJS是《我的世界》网页中文版,MCJS主要就是想让大家不用下载安装,打开浏览器就可以在线玩。临时想玩两把的时候特别方便,不用折腾 Java、启动器那些东西。...

  • 口袋妖怪漆黑的魅影剧毒珠怎样得

    口袋妖怪漆黑的魅影剧毒珠怎样得,在口袋妖怪漆黑的魅影中,有两种神奇的道具,分别是火焰珠和剧毒珠,其中剧毒珠要怎样得呢?...

  • 抖音总榜

    今日热榜提供各站热榜聚合:微信、今日头条、百度、知乎、V2EX、微博、贴吧、豆瓣、天涯、虎扑、Github、抖音...追踪全网热点、简单高效阅读。...