书城现实肥仔马飞传
20051900000304

第304章 学分 报告和考试

【贴墙加速垮个批脸梗小宋原文哈哈/说的就是我焦某人/哈哈/xswl/不过设置了近几个月可见之类的吧/小宋好友也翻不到这条了/不过一些名场面寝室圈的人/是我们也就是马飞们/有的截过图】

———————↓↓↓———————

天天碰面就挎着个批脸给谁看呢?

当初全班我都加了好友,目前3个人不是好友。

一个太奇怪,被我删了。

一个太恶心,我被删了。

一个太离谱,把我删了。

某天搜察对话框想说事,发现没好友了寝室圈里聊天,有我到场立马变脸或者闭嘴,走廊或者洗漱碰面,就赶紧加快速度,并且靠边离你远远的,特别明显的那种。

凑沙比给脸不要脸,充实的一天最后心情坏了

———————↑↑↑———————

【最近小宋的动态/哈哈/哦不能说哈哈/要说挺搞笑的谢谢你让我开心/他讲的是工作的事】

———————↓↓↓———————

城市分部壮大,分组,权利分化,我可以接受。

我不能接受的是,比我晚来的人,在不用处理事务承担责任时,做出了成绩,就不停显摆自己。

在还没有分到我的权利时,就爱抢风头。问起问题来不管你忙不忙,追着你问。分到我的权利后,更是频频不尊重我,你想取代我也太心急了。

内部竞聘宣讲时,提问发言自信满满,直接问当上以后出差多不多等等,仿佛已经是囊中物。

你冒犯到我了,我必定会和你争到底,挫败你的信心和锐气,让你知道该听谁的。走着瞧。

———————↑↑↑———————

2021年3月25日,晴。

看了一部分早年的小说《死人经》之后我郁闷的不行,考完普通话才好一点。

复试好像是线上的。

2021年3月26日,阴。

因为毕设想做文本相关的,所以今天找了个文本生成的东西然后我再修改一下看看能否有逻辑。

———————↓↓↓———————

《挪威的森林》既是村上春树的书也是一首歌还是电影。原来生成的是歌词相关,无所谓了,已经没有那种世俗的欲望了。

哦,吴俊琳,

让我取下你的心,

试着慢

那里……

雪白的月亮照耀着地球,

【这段相关歌词就算了,讲个故事】

这是一个关于王子与公主的故事。

应该就是这个,啊,请听听。

在很久很久以前,在森林的最深处住着快乐的王子和公主,至于为什么王子和公主住在森林里我也不知道,不过不妨相信有这么一对幸福的璧人。当然,是在故事的最后两人幸福生活在了一起。

但是故事讲完后不久,一个女巫出来了,出于对王子和公主的嫉妒,女巫施了一个咒语:咒语使森林成为许多可怕的障碍,甚至白天也会有浓雾,森林里野猪变多了,可爱的毛绒兔子少了。

但是王子和公主没有承认失败,尽管他们过得很艰难,他们发明了一种叫做“猪赛跑”的运动,并建立了一个兔子繁殖机构。王子和公主的故事还没有结束!

他们在院子里种了藤蔓——青春和幸福的象征哦,从黎明到黄昏的王子和公主,他们手牵手走进了童话书,最终成为永恒的过去,没有什么比既定的过去更加永恒的了,即使是商人的谎言钻石也比不上历史的永恒。

21世纪的街道上不会有女巫,但是生活就像女巫的咒语,让生活变得更艰难。但是,我的好兄弟,你真的很幸运,你找到了你的女孩,你必须保护她,宠着她,处处听她的话,否则后果不堪设想,两个人在一起不容易。唔,两个人的相处还是不一定要一方顺着另一方,相处模式也是因人而异的。世间的事,终归不能完全套用。

2021年3月29日,周一,晴。

焦某人的人!生!大!失!败!

焦某人工作也没有着落!

焦某人喜欢女孩子不敢搭讪痛失吾爱!

焦某人打游戏黄金没上反而被封号!

焦某人开题报告难度爆高导致写不了!

焦某人考研复试毫无准备浪费复试报名费!

焦某人创新学分不够面临学制延毕!

この世界を壊したくなった

……

昨天马飞请室友们出去吃饭,缘由自然是马飞年满法定结婚年龄。

今天,政审表,模拟复试。创新学分材料。开题报告。

班上女生那边好像准备复试去酒店准备。哈哈,可能女生寝室杂乱了一点不太适合复试。

——————————————

自然语言处理( Natural Language Processing, NLP)是计算机科学领域与人工智能领域中的一个重要方向。

它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别。自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。因而它是计算机科学的一部分。

自然语言处理主要应用于机器翻译、舆情监测、自动摘要、观点提取、文本分类、问题回答、文本语义对比、语音识别、中文OCR等方面。

自动生成摘要:Automatic Text Summarization

文本自动摘要的算法分类

1.领域相关算法、2.领域无关算法、3.两者相互融合得到的算法

两者相互融合得到的算法分为四种:

基于统计的自动摘要

基于理解的自动摘要

基于信息抽取的自动摘要

基于结构的自动摘要

主流的文本摘要方式

一种是抽取式(extractive),另一种是生成式(abstractive)

抽取式从原文中找到合适的摘要;(page rank算法)

生成式理论上的过程:自然语言理解(NLU,Natural Language Understanding)→自然语言生成(NLG,Natural Language Generation)

实际训练:Seq2Seq 模型。端到端。ENCODER→Attention→DECODER、Seq2Seq,有监督,有大量的训练数据。或者transformer,bert基于它。

文本自动摘要的原理自动摘要系统的处理对象是自然语言文本.尤其是非结构化文本。

Hobbs曾提出一个信息摘要系统的通用体系结构闭,认为典型的信息摘要系统应当由依次相连的十个模块组成:

(1)文本分块:将输入的文本分割为不同的文本块。

(2)预处理:将文本块转换成句子序列,由词汇项及相关属性组成。

(3)过滤:去掉不相关的句子。

(4)预分析:在词汇项序列中识别确定的小型结构。如名词短语、动词短语、并列结构等。

(5)分析:通过分析小型结构和词汇项的序列建立描述句子结构的完整分析树或分析树片段集合。

(6)片段组合:若上步没有得到完整的分析树,则需要将分析树片段集合或逻辑形式片段组合成整句的一棵分析树或其他逻辑表示形式。

(7)语义解释:从分析树或分析树片段集合生成语义结构、意义表示或其他逻辑形式。

(8)词汇消歧:消解上一模块中存在的歧义。得到唯一的语义结构表示。

(9)共指消解或篇章处理:通过确定同一实体在文本不同部分中的不同描述将当前句的语义结构表示合并到先前的处理结果中。

(10)模板生成:由文本的语义结构表示生成最终的模板。

并不是所有的信息摘要系统都明确包含所有这些模块.也未必完全遵循以上的处理顺序.但一个信息摘要系统应当包含以上模块中描述的功能。

……

【生成式太难了,比较简单的transformer动辄训练两万个小时也不尽人意。我该怎么办?准备弄page rank算法抽取式搞最简单也是非常难看的文摘生成。】

抽取式摘要是一种比较成熟的方案,其中Text rank排序算法以其简洁、高效的特点被工业界广泛运用。大体思想是先去除文章中的一些停用词,之后对句子的相似度进行度量,计算每一句相对另一句的相似度得分,迭代传播,直到误差小于0.0001。再对上述得到的关键语句进行排序,便能得到想要的摘要。抽取式摘要主要考虑单词词频,并没有过多的语义信息,像“猪八戒”,“孙悟空”这样的词汇都会被独立对待,无法建立文本段落中的完整语义信息。