2019-05-30 10:03:39
第一步,先要把空格什么的去掉,变成一行连续的string,第二步再用正则就OK了,多行真的难匹配。
2019-05-29 10:10:07
学习链接:http://www.pythoner.com/205.html
2019-05-24 16:58:06
链接:https://blog.csdn.net/qq_38906523/article/details/80210527https://blog.csdn.net/somtian/article/details/79614570 1,多分类:输出层的设计。在多分类中,最常用的就是softmax层。2,多标签分类:3.接下来就是选着损失函数。
2019-05-22 11:18:35
参考链接:https://zhuanlan.zhihu.com/p/24720954?utm_source=zhihu&utm_medium=social
2019-05-20 09:33:30
比赛网址:http://cail.cipsc.org.cn/instruction.htmlgithub:https://github.com/china-ai-law-challenge/CAIL2019数据集的三大类类型:婚姻家庭、劳动争议、借款合同。比赛时间的安排:在6月10号之前得出模型。多分类的评价指标:微平均和宏平均:宏平均是每一个类的性能指标的算术平均值.微平均是每一个实例文档的性能指标的算术平均值.
2019-05-03 10:21:25
图片来源:https://blog.csdn.net/lff1208/article/details/77717149
2019-05-02 14:52:00
参考链接:https://www.zhihu.com/question/35866596假设你有许多小明同学一天内不同时段的照片,从小明提裤子起床到脱裤子睡觉各个时间段都有(小明是照片控!)。现在的任务是对这些照片进行分类。比如有的照片是吃饭,那就给它打上吃饭的标签;有的照片是跑步时拍的,那就打上跑步的标签;有的照片是开会时拍的,那就打上开会的标签。问题来了,你准备怎么干?一个简单直观的办法就是,不管这些照片之间的时间顺序,想办法训练出一个多元分类器。就是用一些打好标签的照片作为训练数据,训练出
2019-05-01 20:59:49
转:https://blog.csdn.net/zhangduan8785/article/details/80443650维特比算法是一种动态规划算法用于寻找最有可能产生观测事件序列的-维特比路径-隐含状态序列,特别是在马尔可夫信息源上下文和隐马尔可夫模型中。第二个实例
2019-05-01 17:22:10
中文分词可以用jieba,hanlpjieba和hanlp都是可以加载自定义词典的,在jieba中:(1)只是加载词典并不调整词频,在分词时,有些词是可以分的开,有的词任然分不开,这时就需要动态的调整词频,这样词就一定可以分开。(2)有些词是不能加到词典中的,因为穷举不完,例如,10%,20.5%。。。这种穷举不完的又有一定的特点的词,就可以运用正则的方式,进行分词。为什么在jieba分词的时候我们要调整词频呢?在hanlp中:(1)有些词分不开的时候,加载自定义的词典,分词是按照加载进词的顺序