卯卯 | 炼就一手绝世刀法!

日出东海落西山,愁也一天,喜也一天。遇事不钻牛角尖,人也舒坦,心也舒坦!

多行文本数据清洗、正则需要注意的点—1,(.*)是匹配不到换行符的。2,一般清洗流程

第一步,先要把空格什么的去掉,变成一行连续的string,第二步再用正则就OK了,多行真的难匹配。

collections模块的Counter类,用于深度学习,字的字典的生成—vocab.txt

学习链接:http://www.pythoner.com/205.html

深度学习多标签分类的思路总结博客收集

链接:https://blog.csdn.net/qq_38906523/article/details/80210527https://blog.csdn.net/somtian/article/details/79614570 1,多分类:输出层的设计。在多分类中,最常用的就是softmax层。2,多标签分类:3.接下来就是选着损失函数。

深度学习调参的大牛意见

参考链接:https://zhuanlan.zhihu.com/p/24720954?utm_source=zhihu&utm_medium=social 

中国法研杯-司法人工智能挑战赛-要素识别任务

比赛网址:http://cail.cipsc.org.cn/instruction.htmlgithub:https://github.com/china-ai-law-challenge/CAIL2019数据集的三大类类型:婚姻家庭、劳动争议、借款合同。比赛时间的安排:在6月10号之前得出模型。多分类的评价指标:微平均和宏平均:宏平均是每一个类的性能指标的算术平均值.微平均是每一个实例文档的性能指标的算术平均值.

DNN、RNN和CNN的关系总结图-相互比较

图片来源:https://blog.csdn.net/lff1208/article/details/77717149

(一)CRF工具包解决的问题-----由问题逐级引入。

参考链接:https://www.zhihu.com/question/35866596假设你有许多小明同学一天内不同时段的照片,从小明提裤子起床到脱裤子睡觉各个时间段都有(小明是照片控!)。现在的任务是对这些照片进行分类。比如有的照片是吃饭,那就给它打上吃饭的标签;有的照片是跑步时拍的,那就打上跑步的标签;有的照片是开会时拍的,那就打上开会的标签。问题来了,你准备怎么干?一个简单直观的办法就是,不管这些照片之间的时间顺序,想办法训练出一个多元分类器。就是用一些打好标签的照片作为训练数据,训练出

(四)简单理解viterbi算法-一种动态规划算法——viterbi算法:解决多步骤、每步都有多选择、的模型的最优化问题。

转:https://blog.csdn.net/zhangduan8785/article/details/80443650维特比算法是一种动态规划算法用于寻找最有可能产生观测事件序列的-维特比路径-隐含状态序列,特别是在马尔可夫信息源上下文和隐马尔可夫模型中。第二个实例 

在Windows系统中,如何书写路径也能把在Linux中跑。

实际应用中的分词以及会遇到的各种问题。---自定义词典+正则的形式分词。-结巴

中文分词可以用jieba,hanlpjieba和hanlp都是可以加载自定义词典的,在jieba中:(1)只是加载词典并不调整词频,在分词时,有些词是可以分的开,有的词任然分不开,这时就需要动态的调整词频,这样词就一定可以分开。(2)有些词是不能加到词典中的,因为穷举不完,例如,10%,20.5%。。。这种穷举不完的又有一定的特点的词,就可以运用正则的方式,进行分词。为什么在jieba分词的时候我们要调整词频呢?在hanlp中:(1)有些词分不开的时候,加载自定义的词典,分词是按照加载进词的顺序
«   2019年5月   »
12345
6789101112
13141516171819
20212223242526
2728293031
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
搜索
最新留言
文章归档
网站收藏
友情链接
  • RainbowSoft Studio Z-Blog
  • 订阅本站的 RSS 2.0 新闻聚合

Powered By Z-BlogPHP 1.5.2 Zero

转载请注明文章出处!!!!!