卯卯 | 炼就一手绝世刀法!

日出东海落西山,愁也一天,喜也一天。遇事不钻牛角尖,人也舒坦,心也舒坦!

文本噪音去干净

根据底层的编码来去噪音,unicodedata.category()参考链接:http://ju.outofmemory.cn/entry/374250类型码类型信息LuLetter, uppercaseLlLetter, lowercaseLtLetter, titlecaseLmLetter, modifierLoLetter, otherMnMark, nonspacingMcMark, spacing combiningMeMark, enclosingNdNumber, decimal

.tf_record格式来做大数量的形式。当数据量巨大的时候,为模型加速的方法—————训练样本非常大的时候,将train数据,转换成.tf_record文件,加速训练

提高代码速度的小技巧

运用return直接return 函数返回速度能提高10倍以上。

类的单例模式————很重要。实际应用场景,例如:加载jieba,做成一个单例类,不同人来调用的时候不用每次都调用占内存,只需要调用一次。

单例模式的好处:实现多个实例类的时候,实现共享,节省内存,加速,类里面不用self,而换成cls。方法一:方法二:

Python数据结构的各种效率-dict list tuple set,deque-优化技巧

学习链接:https://blog.csdn.net/qq_28304687/article/details/79088491 

一些Python小知识点

上面model_names的内容结果:

工具文件夹里多个py文件内的函数方便引用的小技巧

如下在文件中引用

变量初始化

tensorflow中图的理解,图相当于是一个一个命名空间

定义几个自己的图。

tf.squeeze()——挤压函数和tf.expand_dims()——增加维度相反(在NLP词嵌入处理时,最后嵌入完词向量,特征维度不够时长用到。)

在情感分类中用到:在医疗NER中运用到:
«   2019年3月   »
123
45678910
11121314151617
18192021222324
25262728293031
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
搜索
最新留言
文章归档
网站收藏
友情链接
  • RainbowSoft Studio Z-Blog
  • 订阅本站的 RSS 2.0 新闻聚合

Powered By Z-BlogPHP 1.5.2 Zero

转载请注明文章出处!!!!!